3周前
[灵感风暴] 第002篇 高通平台增强型watchdog
以提升高通watchdog调试效率为目标,提出面向新手工程师的内核日志增强方案,通过驱动形式集成UTC时间、Top10中断、Watchdog进程状态、CPU可用与ping掩码、最近跨核调用等关键信息输出,精准定位中断风暴、CPU无响应等常见系统异常,显著加快问题分析进程。
9月前
[Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系
本文深入探讨了进程上下文、中断上下文以及 Linux 进程调度器(如 CFS)的概念和关联性。进程上下文是内核代码为特定进程执行任务的环境,能被调度、休眠和参与 CFS 调度。中断上下文是内核响应中断时运行的代码环境,不能睡眠,且不直接参与调度。SoftIRQ 和 Tasklet 作为中间层,处理中断后的任务。三者之间的关联性体现在中断上下文可以触发调度事件,而进程上下文可以主动调用调度器。文中还列举了在中断上下文中不能调用的函数或行为,并强调了中断上下文中禁止使用可能引起睡眠或阻塞的函数,以避免系统问题。
9月前
[Android稳定性] 第035篇 [问题篇] 中断风暴触发watchdog bite
定位到系统死机的根本原因是显示子系统中断风暴,硬件中断msm_drm和dsi_ctrl频繁触发,导致CPU长时间被中断占用,内核软中断和线程无法调度。关键函数dsi_ctrl_hw_cmn_ctrl_reset卡死,形成软锁死,最终触发watchdog致使系统崩溃。
2024-12-18
[Android稳定性] 第007篇 [问题篇] 中断风暴导致panic
问题摘要:系统日志显示irq 193存在异常,其action为0,表明中断未被注册,导致中断被送至`handle_bad_irq`处理。经查询,该中断对应gpio 93,且在设备树中该gpio被用于wusb3801的中断和复位功能。去除相关配置后,系统恢复正常。