[Android稳定性] 第039篇 [问题篇] 记几次判断为DDR不稳定导致的死机问题 10月前 评论
[Android稳定性] 第039篇 [问题篇] 记几次判断为DDR不稳定导致的死机问题

在公司工厂老化测试过程中,出现多台机器死机,经技术分析后判断主要原因是DDR内存不稳定。文章详细记录了多个典型案例,展示不同核和线程在同一时间内频繁发生的异常,如内核试图在非可执行区域运行代码、遇到未定义指令错误、空指针解引用和地址翻译异常。通过对内核日志的深入解读,指出这些错误随机且大范围发生,反映出页表结构或内核代码段受损,极可能由DDR故障引发。此类高频和多样化的系统异常,为生产稳定性团队提供了宝贵的实操参考,有助于准确定位和快速解决类似硬件稳定性问题。

[Android稳定性] 第040篇 [问题篇] 高通平台tz busy造成的卡死问题 10月前 评论
[Android稳定性] 第040篇 [问题篇] 高通平台tz busy造成的卡死问题

**问题摘要:** 近期,工厂和开发版本中出现大量死机问题,原因指向tz相关的`qcom_scm_pas_auth_and_reset`函数异常。日志显示tz处于忙碌状态,且`mfido`固件更新可能为根本原因。 **问题分析:** 问题源于`qcom_scm_pas_auth_and_reset`函数返回异常,导致系统panic。日志分析发现tz处于忙碌状态,且`mfido`固件更新可能与问题相关。进一步分析显示,`mfido`在尝试读取公钥证书时失败,引发系统崩溃。 **根本原因:** 安全团队提交的`mfido`固件更新可能是导致死机的根本原因。更新后的固件在初始化过程中出现错误,导致tz无法正常响应,进而引发系统崩溃。