8月前
[Android稳定性] 第049篇 [问题篇] 软中断霸占CPU导致watchdog无法及时喂狗
系统出现死机,核心原因是Watchdog定时器未按时触发“喂狗”操作导致20秒内无回应。从dmesg和timerlist日志分析,定时器的回调因中断或内核临界区阻塞未能执行,所有CPU的最后ping均停留在同一时刻,反映定时器链路被阻塞。这突出内核定时器和中断管理对系统稳定性的关键影响。
8月前
[Android稳定性] 第048篇 [原理篇] Android SWT机制介绍
深入解析Android System Server中的Watchdog机制,阐述其关键作用:防止核心服务和线程因死锁或长时间阻塞导致系统不可用,通过周期性Checker监控各大线程与服务,超时自动重启,保障系统稳定与用户体验。详细讲解Watchdog的启动流程、重要变量、核心线程监控逻辑和AMS集成
8月前
「知不可忽骤得,托遗响于悲风」
《赤壁赋》是苏轼描绘秋夜泛舟赤壁之下所见的壮丽景象和内心感慨。文章以月夜泛舟、饮酒作乐为背景,引出对历史英雄曹操的回忆,及对人生无常、宇宙永恒的深刻思考。苏轼通过水与月的比喻,表达了对物我关系和人生价值的理解,最终以与客共饮、畅谈人生作结。
8月前
[Android稳定性] 第047篇 [问题篇] Unexpected kernel BRK exception at EL1
**问题背景**:多款手机在启用移动热点功能后出现死机现象,涉及BUGO19-6212、BUGO19-6235和BUGO19-6210等多个JIRA问题。 **问题现象**:设备在启用热点后崩溃。经过测试,发现启用热点功能会导致设备死机,与预期不符。 **问题分析**:通过分析堆栈信息和汇编代码,初步判断问题为数组越界。寄存器W26的值超出数组最大值,导致数组越界,进而触发BRK异常。 **wlan模块分析**:在wlan模块中,存在两个for循环,重复复制了同一批非indoor信道,导致pcl_len值翻倍,超出数组最大值。 **解决方案**:删除第二个for循环,避免重复复制信道,从而解决数组越界问题。
8月前
【深入内核】linux ftrace详解
本文主要介绍了Ftrace(Function Tracer)的概念、实现原理和使用方法。Ftrace是Linux内核自带的轻量级跟踪框架,用于记录内核内部发生的事件与函数调用,帮助开发者洞察系统最深处的执行路径、时序瓶颈与异常行为。文章详细阐述了Ftrace的实现原理,包括静态插桩和动态插桩两种方式,并介绍了Ftrace的开启方法,包括设置tracer类型、设置tracer参数、使能tracer、进行测试和提取trace结果等步骤。此外,文章还介绍了常见的trace event详解和特别注意点,如能够使用adb和开机过程中死机的情况。
8月前
[音乐分享] 莫失莫忘
文章回忆起了一个不酷热的夏天,描述了那时的生活细节,如电视的声响、风扇的转动和西瓜的甜味。作者反思了自己和他人当时的梦想,现已遗忘,只能推测当时未预料到生活的劳累与责任。文章中引用了角色们的豪言壮语,展现了年少时的理想与抱负。
8月前
高通平台xbl启动流程补充
本文是对高通Android启动代码流程的进一步分析,聚焦于XBL阶段的启动流程,通过流程图与日志对应的方式详细解析。目前分析尚在进行中,预计2025年8月18日完成全部梳理。
9月前
[Android稳定性] 第046篇 [方法篇] 如何使用trace32恢复AOP现场?
本文介绍了使用hansei工具解析AOP/RPM及使用trace32恢复AOP现场的方法。首先获取hansei工具,安装依赖库后执行工具,输入相关路径生成文件。然后进行恢复前的准备工作,包括下载T32脚本和准备相关文件。最后,通过执行aop_rpm_load.bat文件,选择正确的cmm文件开始恢复。
9月前
[Android稳定性] 第045篇 [问题篇] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00007f00
本文分析了在测试DDR TT和Reboot测试专项过程中机器出现dump的问题。通过panic现场和加debug patch的分析,发现死机原因是ufs没有初始化成功,函数`ufshcd_complete_dev_init`耗时过长。进一步分析发现,`kworker/6:1`线程在执行`kfree_rcu_monitor()`时被调度出去,并长时间卡在`schedule()`中,最终导致死机。根本原因是在ufs函数执行时被串口输出调度出去,而串口输出调度优先级很高,执行console_unlock()时持锁状态下运行,不允许调度,且阻塞式串口写函数`qcom_geni_serial_poll_tx_done`会造成长时间占用CPU。