9月前
linux-dead-lock-detect-lockdep
死锁是多进程或线程因相互等待资源而导致系统阻塞、难以自我恢复的严重问题。Linux 内核区分 D 状态死锁(因 I/O 资源长时间等待导致局部进程间互锁,多表现为系统冻结)和 R 状态死锁(进程占用 CPU 不释放,可能引发全局系统调度失败及看门狗复位)。常见死锁类型包括重复上锁、ABBA 顺序反复上锁等,尤其是 AB-BA 死锁,最易因多线程错拿锁顺序形成。为应对复杂内核环境中的死锁风险,lockdep 死锁检测模块应运而生,通过跟踪锁类以及各锁类的依赖链,提前发现潜在死锁风险并进行详细状态分析。
9月前
[Android稳定性] 第044篇 [问题篇] Unable to handle kernel write to read-only memory at virtual address
在老化测试中,多台机器出现黑屏问题,主要现象为使用9-11版本时,27台机器中有25台因USB问题导致dump,且问题多出现在使用33瓦充电器时。通过LOG分析,问题出现在45次重启测试中。dmesg日志显示,问题源于内存异常踩踏,具体为操作了空指针地址的结构体成员。 根本原因分析表明,在dwc3_msm模块中,存在一个空指针赋值操作,导致数据写入异常地址。解决方案建议对涉及空指针的代码进行兼容性处理,并在gerrit上提交了相关代码修改。