linux上ARM单板kdump概率性启动失败

2019-07-13 01:35发布

kdump在内核die或者panic时自动触发,保存第一个内核的现场,跳转到第二个内核执行。但是在启动到第二个内核的工程中概率性启动失败。通过启动打印信息,因为我们的单板是需要定时喂狗的,否则就看门狗溢出直接复位单板。 首先排查到定时器没有触发,那么是软中断没有触发,还是说看门狗的定时器没有初始化成功。结果是软中断没有触发,软中断是通过硬中断来出发的,使用jiffies来计时。通过时钟中断来更新时戳(jiffies)。经过定位发现确实时钟中断没有触发。为什么时钟中断概率性丢失,不触发呢?经过对比kdump加载成功与失败的打印,找到规律:启动成功的内核在复位时是CPU0上;而启动失败的内核在复位时是CPU0外的CPU上。 找到问题自然尝试解决的办法:只要保证复位时运行的CPU是0是否就可以了呢?在kdump的流程把当前线程绑定到CPU0就可以了。修改代码后果然每次kdump都能顺利加载成功。说明果然是必须要把从CPU0加载才可以。问题很清楚了,至于为什么必须绑定到CPU0,那么需要CPU的设计人员解答了。         以上情况都是在hisi的芯片上验证。