云栖梦泽
林渡
Blog
  • 首页
  • 我的视界
    • 人世间
      • 世间风声
      • 人间烟火
    • 壹句话
    • 云外光影
      • 动物与植物
      • 美食
      • 生活气息
      • 人物
    • 文章归档
      • 技术分享
      • 视频类型
      • 音频类型
      • 图文类型
      • 图片类型
  • 「内核宇宙」
    • 灵感工坊
      • 灵感风暴
    • 底层漫游
      • Android稳定性
      • Linux内存管理
      • Linux进程调度
      • Linux内核
      • ARM体系架构
      • LRDP2
      • 技术分享
  • 璀璨星河
    • 公告
    • 应用舱
    • 众星
    • 豆瓣
    • 足迹
    • 走心评论
    • 林渡的网盘
  • 留言板
  • 关于
    • 捐赠者名单
    • 关于我
    • 一些声明
      • 站点声明
      • 隐私政策
    • 网站看板
  • 欢迎订阅!

欢迎来到云栖梦泽,为您导读全站动态
  • 林渡 6日前前留言 工具我更新了,但是小米在线解析的,那个只支持小米内网的
  • ktxck 6日前前留言 确实都打不开,但你文章里提到的那个小米解析网站也打不开,实在没办法了,我现在正试着用pcat看看
  • 林渡 6日前前留言 你说的是minidump_linux_unzip 和 拆分脚本吧?这两个你应该用不到的,这个是我们客户定制的,应该不会适用于你们项目
  • 林渡 6日前前留言 哪里呀?不是这篇文章里的吧?
  • ktxck 6日前前留言 26年4月,文章提到的工具链全部失效了,想问一下这里面有hv层的详细日志吗光靠搜索没乱码的地方只能读到 ... (正常hv层内容启动) ... 4 344.470102 WDT bite: now_ticks 4915389, last_pat 3932438, from VM 3 4 344.471089 Abort: Watchdog bite from PC 0xffffffd6c6e3802c, FP 0xffffff97c0050eb0 4 344.471148 WDT: Triggering NS Watchdog Bite
  • 林渡 1周前前留言 有时候会直接修改page cache页数据,不走页表,那写保护就无效了。回写线程清除 PG_dirty 时,它赌的是:这个页在回写期间不会被修改。如果这个赌注输了(即 PG_dirty 在 I/O 完成前又被设置了),内核需要在 I/O 完成后重新入队回写。关键就在 redirty_page_for_writeback:这个函数会重新设置 PG_dirty + PAGECACHE_TAG_DIRTY,让这个页重新出现在下次回写的队列里。这样就能兜住 GUP 或 do_wp_page 产生的并发脏写。
  • Melokc 1周前前留言 回写这块我之前一直对一些细节很疑惑,就某个细节谈一下疑惑&看法。之前最疑惑的一点就是,为什么是在回写之前把dirty标志清掉?为什么不等待完全回写完毕之后,页面真正干净了,再抹掉标志位呢。甚至在shrink流程下,writeback之前还会释放PG_locked,摆明着在回写过程中卸下防备,等着页面被更改。现在的理解是,页在wb场景下,虽然设置了pte写保护,但仍旧有可能触发do_wp_page(),让这个页变脏,这时候回写之前抹掉dirty的好处就体现了,回来之后又发现自己是dirty的,说明又被改写了。甚至可能不是用户态触发缺页导致的dirty,可能是内核直接GUP导致的dirty(这个隐约记得在哪个文件里看到过相关注释,但当时没有记录,在懊恼了)
  • 林渡 2周前前留言 其实方法已经给了,重要的就是利用AI,让claude code代替人去理解代码架构,你只需要把你的需求以自然语言告诉claude code。
  • 林渡 2周前前留言 哈哈,我也觉得付费阅读很反感,所以基本上不会考虑的,改成打赏支持,能够抵一部分服务器成本就可以了。这个博客主要还是分享以及让自己回顾一下自己的知识点。 打赏支持页面就是一个单独的html页面,没有使用插件
  • 寻境者·唐 2周前前留言 这种模式挺好,当然当你积累到一定能量的时候,能够输出更多高水平高质量的文章时,是可以结合付费阅读的,虽然我本人挺反感这样的模式。 另外你这个打赏支持页面功能很不错,用什么插件实现的吗?
2026 年 4 月
日一二三四五六
1234
567891011
12131415161718
19202122232425
2627282930
« 3 月  
最近文章
  • 2026-04-10 [linux内存管理] 第046篇 Page Cache脏页回写机制深入分析
  • 2026-04-01 AI时代笔记工作流:构建下一代知识管理引擎
  • 2026-03-24 认知加速度:AI时代最残酷的鸿沟,正在此刻拉开
  • 2026-03-20 Linux 内核崩溃分析报告 - AI
  • 2026-03-11 AI时代的思考:内核稳定性工程师离失业还有多久?
  • 2026-03-06 [linux内存管理] 第045篇 per-CPU变量的静态与动态分配
  • 2026-03-04 [linux内存管理] 第044篇 per-CPU基础知识以及per-CPU分配器的初始化
  • 2026-03-02 [Android稳定性] 第62篇 内核访问与tee共享的内存数据异常造成内存越界
  • 2026-02-28 [LRDP2] 解析插件之logcat
  • 2026-02-26 [linux内存管理] 第043篇 page cache 脏页跟踪机制
  • 2026-02-26 向 Linux 内核社区提交 patch 实操要点
  • 2026-02-06 基于 QEMU 与 VSCode 的 Linux 内核调试环境搭建指南
  • 2026-02-06 「纵朝生暮死,亦当惊鸿」
  • 2026-02-04 [linux内存管理] 第042篇 Linux内核Page Cache机制深入分析
  • 2026-02-03 [linux内存管理] 第041篇 缺页异常之 do_swap_page:从 swap entry 到完整 swap-in 全流程
  • 2026-02-03 [灵感风暴] GKI 升级不再靠人肉:Aegis 自动风险分级与测试建议生成
  • 2026-02-02 [linux内存管理] 第040篇 文件映射与匿名映射
  • 2026-01-31 [Android稳定性] 第61篇 UFS异常导致卡开机logo
  • 2026-01-30 [linux内存管理] 第039篇 用户态内存映射malloc和mmap详解
  • 2026-01-29 [linux内存管理] 第038篇 深入剖析AArch64架构下的do_page_fault缺页异常处理
热门文章
  • 2024-11-22 高通android启动代码流程分析(SBL->ABL)
  • 2025-07-21 高通以及MTK平台内核单独编译ko的原理
  • 2025-08-27 [Android稳定性] 第058篇 [方法篇] 高通平台使用QFIL回读分区
  • 2024-12-15 [Android稳定性] 第000篇 Android稳定性系列开篇
  • 2025-06-25 [Android稳定性] 第052篇 [方法篇] HMI项目中如何使用QCAP解析minidump?
  • 2026-01-29 📢 致读者的一封信:关于运营、初心与一份邀请
  • 2025-06-18 [linux内存管理] 第027篇 Linux ARM64 虚拟地址布局
  • 2025-06-09 【深入内核】linux ftrace详解
  • 2024-11-29 [linux内存管理] 第009篇 reserved-memory详解
  • 2024-12-15 [Android稳定性] 第001篇 [方法篇] 高通Android平台稳定性分析介绍
  • 2025-01-14 [Android稳定性] 第017篇 [方法篇] 高通watchdog分析流程
  • 2025-08-23 [linux内存管理] 第029篇 谁把folio的函数定义“藏”起来了?
  • 2025-11-03 [linux内存管理] 第000篇 Linux内存管理系列开篇
  • 2025-08-05 [Android稳定性] 第057篇 [方法篇] 高通平台使能ftrace的方法
  • 2025-06-04 [Android稳定性] 第045篇 [问题篇] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00007f00
  • 2025-10-23 利用 Claude Code 探索 Linux 内核奥秘
  • 2024-12-18 [Android稳定性] 第004篇 [原理篇] minidump的原理介绍
  • 2025-08-19 【深入内核】ARM64下的内核栈
  • 2025-09-11 【深入内核】理解Linux Static Keys和jump label机制
  • 2025-01-18 [Android稳定性] 第020篇 [方法篇] crash实战:手把手教你使用crash分析内核dump
热门标签
  • 内核线程 1
  • 价值观 1
  • 内核开发 3
  • 生产力工具 1
  • Linux内核 12
  • init进程 1
  • 理想与现实 1
  • 人生态度 1
  • 人生意义 1
  • 精神追求 1
  • 性能优化 1
  • 生活美学 1
  • 内核栈 1
  • 任务优先级 0
  • 反思 1
  • 个人成长 1
  • 时间管理 1
  • 自我认知 1
  • 烟火气 1
  • 任务管理 1
  • Static Keys 1
  • 进程调度 1
  • 动态分支 1
  • 寄存器 1
  • idle进程 1
  • 高效工作 1
  • 页面管理 1
  • minidump 3
  • kmalloc 2
  • 脏页 2
43500° 188 14 255
当您评论及浏览文章且浏览器未禁止COOKIE时,会为您显示最近10条回复及前20篇文章的浏览记录。
在万物之间穿行,也在自我之间渡过。

你好,
我是林渡

    • 3日前

      这段时间我写博文的速度也慢下来了,因为我在思考,思考在这个AI时代下技术博客还有没有必要存在? 从我个人角度来说,我其实也不愿意看那些长篇大论的技术文章,也是随手丢给 AI 看一眼,让它帮我总结提炼出关键!而我遇到的那些坑,其实 AI 也比我更加的懂,更加的全面,那我还有必要写嘛?

    • 5日前

      当AI替我写完代码、润色文案、整理思路,我差点忘了自己也曾能徒手解构问题,也曾深入底层逻辑去研究代码。而如今直到token额度用尽,屏幕显示额度“0%”,只能安静的等待着额度刷新,我在电脑前呆愣住——原来不知不觉间,我的能力已经悄悄托管给了AI。额度归零的那一刻,我突然不会“自己”干活了。 这场浪潮

    • 2026-03-17

      只是简单的创建了一下今日任务清单+沉淀一篇文章要点+探索obsidian插件 就花了5.87元,现在的api还是太贵了啊

    • 2026-03-03

      给博客增加了一个项目展示页,还是挺好看的了。 链接:应用舱

    • 查看更多瞬间动态
  • [Android稳定性] 第033篇 [问题篇] suspend时shedule io操作导致线程阻塞引发死机 2025-04-18 2 条 林渡
      Android稳定性
      watchdogiosuspend
    [Android稳定性] 第033篇 [问题篇] suspend时shedule io操作导致线程阻塞引发死机

    工厂BLMMI工站一台设备死机进dump,经dmesg与任务栈分析,确认是QCOM Apps Watchdog在约67.7秒触发bark/bite,而系统最后一次喂狗停在47.7秒,中间超过20秒未喂狗。期间系统处于s2idle挂起流程中,未正常resume,定时器与调度未运行,导致watchdog无法被喂。 进一步从timer list看到,当前时刻并没有到任何定时器触发点,印证了系统在挂起状态未被唤醒。通过tasks.txt定位到关键卡死线程为......

    [Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系 2025-04-18 评论 林渡
      Android稳定性
      中断风暴进程栈schedule
    [Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系

    本文深入探讨了进程上下文、中断上下文以及 Linux 进程调度器(如 CFS)的概念和关联性。进程上下文是内核代码为特定进程执行任务的环境,能被调度、休眠和参与 CFS 调度。中断上下文是内核响应中断时运行的代码环境,不能睡眠,且不直接参与调度。SoftIRQ 和 Tasklet 作为中间层,处理中断后的任务。三者之间的关联性体现在中断上下文可以触发调度事件,而进程上下文可以主动调用调度器。文中还列举了在中断上下文中不能调用的函数或行为,并强调了中断上下文中禁止使用可能引起睡眠或阻塞的函数,以避免系统问题。

    [Android稳定性] 第037篇 [问题篇] vote函数持锁造成经典的AB-BA死锁 2025-04-18 评论 林渡
      Android稳定性
      死锁
    [Android稳定性] 第037篇 [问题篇] vote函数持锁造成经典的AB-BA死锁

    您好,我是一位专业的100字左右文章摘要总结写手。根据您提供的问题背景和日志分析,本文将探讨一个在Android设备老化测试过程中遇到的问题。具体来说,当使用组合键手动进入dump状态时,设备卡在了某些进程上,无法继续执行。通过分析dmesg日志,我们发现多个进程处于D状态,且存在锁的竞争关系。最终,我们确定这是一个典型的AB-BA锁死锁问题。

    【深入内核】Linux 内核栈初步了解 2025-04-15 评论 林渡
      技术分享 / Linux内核
      stack
    【深入内核】Linux 内核栈初步了解

    这篇文章详细介绍了Linux内核栈的概念、重要性以及与之相关的常见问题和调试方法。内核栈是Linux为每个线程在运行内核代码时专用的一块栈空间,用于保存函数调用链、局部变量、寄存器上下文等信息。文章强调了内核栈的大小固定(在ARM64架构下默认为16KB),不可扩展,并指出了在栈上分配大数组、返回栈上变量地址等常见“死亡操作”。此外,还提供了如何调试内核栈使用的方法,包括编译选项、工具和查看系统文件。最后,总结了避免内核栈溢出的建议,以确保系统稳定运行。

    [Android稳定性] 第035篇 [问题篇] 中断风暴触发watchdog bite 2025-04-14 评论 林渡
      Android稳定性
      中断风暴watchdog
    [Android稳定性] 第035篇 [问题篇] 中断风暴触发watchdog bite

    定位到系统死机的根本原因是显示子系统中断风暴,硬件中断msm_drm和dsi_ctrl频繁触发,导致CPU长时间被中断占用,内核软中断和线程无法调度。关键函数dsi_ctrl_hw_cmn_ctrl_reset卡死,形成软锁死,最终触发watchdog致使系统崩溃。

    [Android稳定性] 第032篇 [原理篇] 高通平台 OCP & 组合键 Warm Reset 机制详解 2025-04-10 评论 林渡
      Android稳定性
      OCPRESET
    [Android稳定性] 第032篇 [原理篇] 高通平台 OCP & 组合键 Warm Reset 机制详解

    本文深入探讨了Qualcomm平台Android系统中两种底层重启方式:OCP(过电流保护)触发的Warm Reset和通过组合键+Timer配置触发的Warm Reset。OCP是一种硬件保护机制,能监测供电轨是否过电流并执行Warm Reset。该重启不经过软件,重启后无last_kmsg记录。组合键+Timer配置则通过PMIC硬件监控按键状态,独立于软件,配置在Android启动后仍生效。两种重启方式均适合用于调试。

    [Android稳定性] 第031篇 [原理篇] Linux内核内存检测工具KASAN 2025-04-09 评论 林渡
      Android稳定性
      kasanOOB
    [Android稳定性] 第031篇 [原理篇] Linux内核内存检测工具KASAN

    Kasan(Kernel Address Sanitizer)是一个动态检测内存错误的工具,主要功能是检查内存越界访问和使用已释放的内存等问题。Kasan集成在Linux内核中,随Linux内核代码一起发布,并由内核社区维护和发展。在Android内核开发中,Android包括内核地址排错程序(KASan)。KASan是内核与编译时修改的组合,形成了一个插桩系统,可以实现更简单的bug发现和根本原因分析。KASan可以检测内核中许多类型的内存违规行为,包括堆栈、堆和全局变量中的出界读取和写入操作,并可检测释放后再使用和双重释放错误。

    [Android稳定性] 第030篇 [问题篇] I2C bus hang 导致锁线程阻塞导致卡死 2025-04-07 评论 林渡
      Android稳定性
      i2c
    [Android稳定性] 第030篇 [问题篇] I2C bus hang 导致锁线程阻塞导致卡死

    本文分析了测试过程中出现的ANR问题,通过分析bugreport日志,发现大量内核线程卡在“不可中断睡眠”状态,表明线程正在等待I/O操作。进一步分析发现,问题可能出在电池/充电控制相关驱动上,因为涉及I²C通信和电源管理的模块出现异常。此外,fg_read_volt函数在I²C读失败后,会尝试重试,但可能因为互斥锁或I2C总线问题导致永久阻塞,进而引发系统内多个线程进入D状态。根本原因可能是I²C传输超时导致regmap_raw_read函数卡住或失败,进而导致fg_read_word和fg_read_volt函数卡住或多次失败,最终引发线程风暴。可能的原因包括硬件层面的I²C总线锁死、Fuel Gauge芯片异常、电池连接问题,以及软件层面的I²C驱动问题、多线程并发访问问题、I²C错误处理问题等。

    [Android稳定性] 第029篇 [问题篇] 数组越界导致Unexpected kernel BRK exception at EL1 2025-04-01 评论 林渡
      Android稳定性
      数组越界bitflip
    [Android稳定性] 第029篇 [问题篇] 数组越界导致Unexpected kernel BRK exception at EL1

    在高低温测试中,两例设备死机问题指向charger模块。分析日志发现,问题源于`status_change_work`函数中的数组越界,可能与bitflip问题相关。解决方案建议增加兼容性代码,确保`cyclecount`值在0到800之间,防止异常值导致数组越界。

    [Android稳定性] 第028篇 [问题篇] 可靠性滚筒测试中高概率自动关机问题记录 2025-04-01 评论 林渡
      Android稳定性
      LDOOCP
    [Android稳定性] 第028篇 [问题篇] 可靠性滚筒测试中高概率自动关机问题记录

    委外实验室AS2/AS4/AS5在滚筒测试中出现自动关机问题,惠州实验室AS1、AS3无此现象。分析发现LDO7触发OCP保护导致异常。验证方案将LDO7的OCP设置从LPM模式改为NPM模式,测试结果显示问题解决。

    1 … 9 10 11 … 18
  • 简述
    在万物之间穿行,也在自我之间渡过。
    liuqi20328@gmail.com
    生涯
  • 行业嵌入式
  • 职业Linux/Android内核工程师
  • 人生
  • 生活角色浪子、父母的娃、我夫人的老公
  • 社会角色公司职员、中华人民共和国公民
  • 类型
  • 星座 双子座
  • 生肖 猪
  • 血型O
  • 数据
  • 发表文章178篇
  • 发表评论66个
  • 星球加热38944度
  • 最近的心情能量
      愉快 沮丧
    • 不喜不悲 ,当时发表在「[Android稳定性] 第033篇 [问题篇] suspend时shedule io操作导致线程阻塞引发死机」
    • 不喜不悲 ,当时发表在「[Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系」
    • 不喜不悲 ,当时发表在「[Android稳定性] 第037篇 [问题篇] vote函数持锁造成经典的AB-BA死锁」
    • 没有心情 ,当时发表在「【深入内核】Linux 内核栈初步了解」
    • 不喜不悲 ,当时发表在「[Android稳定性] 第035篇 [问题篇] 中断风暴触发watchdog bite」
  • 地图数据来源于高德地图
  • intj 建筑师
    intj 建筑师
    • 外向内向
    • 远见现实
    • 理性感受
    • 评判展望
    • 坚决起伏
  • 了解更多信息
今天是云栖梦泽·

2024-11-11

随机阅读「[灵感风暴] GKI 升级不再靠人肉:Aegis 自动风险分级与测试建议生成」
阅读 Android GKI 升级带来大量碎片化 commits,人工分析压力巨大,Aegis(神盾)工具应运而生。它通过结构化 JSON 输出,将琐碎提交转化为可追踪的影响分析,智能识别变更模块、风险、核心问题并生成自动化测试优先级建议,显著提升升级评估与回归测试的精准性。最终产出 HTML 和 Markdown 报告,图表化展示高风险点与回归重点,报告可一键分享团队,有效缓解人力压力,实现升级分析自主可控。
壹行随十人
  • 菲兹克斯喵
  • 星风之痕
  • iSeekLife
  • 山海运维
  • 迷鹿屋
  • 山海云栈
  • 且听书吟
  • 问心斋
  • 谜叶象限
  • 风记星辰
云栖梦泽版权所有 · 架构于Halo及为您增强体验的THYUU/星度主题
苏ICP备2025185582号-1 苏ICP备2025185582号-1 苏公网安备32060102321049号 苏公网安备32060102321049号 BlogsClub BlogsClub 笔墨迹 笔墨迹