构建CF卡Linux系统的几个常见难题

2019-07-13 05:36发布

关于如何在cf卡上构建linux ,从网上可以找到很多文章,如:许德新 《嵌入式Linux在PC104平台上的构建与实现》等等。这里主要介绍我在cf卡上构建linux系统中碰到的问题和 解决方法。采用硬件是:板子是研祥 104-1621CLDN,bios是AMI的,内核2.6.28.10。采用的方法是linux from scratch(LFS)。在此过程中遇到的主要有:


一 bios的设置
      在cf卡上建立好根文件系统后,在cf卡上安装grub引导程序,然后把编译好的内核bzImage 拷贝到/boot/下,修改/boot/grub/menu.lst/。理论上来现在至少应该能够出现grub的menu画面了,可是bios自检过后出现错误:
        searching for boot record from ide-0..  not found
        boot failure
        reboot and select proper boot device or insert boot media in selected boot device
        然后怀疑是grub没有装成功,就重装了grub
grub> setup (hd1)
Checking if "/boot/grub/stage1" exists... yes
Checking if "/boot/grub/stage2" exists... yes
Checking if "/boot/grub/reiserfs_stage1_5" exists... yes
Running "embed /boot/grub/reiserfs_stage1_5 (hd1)"...  19 sectors are embedded
.
succeeded
Running "install /boot/grub/stage1 (hd1) (hd1)1+19 p (hd1,0)/boot/grub/stage2
/boot/grub/menu.lst"... succeeded
Done.
问题仍然存在,说明问题在其他地方。然后进入bios进行设置,由于cf卡在linux就相当于一个ide的硬盘,所以修改ide的相关设置,发现问题在于PCI/Plug an d Play Setup选项下PCI IDE BusMaster  必须设置为Disabled 才能进入grub画面。


二 启动内核的过程中出现 kernel panic -not syncing :vfs:unable to mount root fs on unknown-block(0,0)
     这个问题的本质原因是根文件系统所在的硬件的驱动程序没有编译进kernel或者在initrd.img 中也没有把硬盘或者cf卡的驱动程序作为模块加入。还有一种是在grub或者lilo的设置中 root=/dev/sd* 或者 /dev/hd* 的设置有误。这导致内核无法识别硬盘或cf卡。所以,建议在编译内核的时候特别细心,找出硬盘是属于ata的,还是pci的,或者scsi的,然后选择相应的选项。如果很难确定硬盘或cf卡的类型,则建议先全部选上,这样先保证能够进入系统,然后用dmesg | less 查看相应的硬盘或者cf卡的硬件信息,接下来再重新选择它们的驱动,把不要的去掉。 三 内核启动过程中出现很多DMA的错误信息
    我的cf是Kinston ELITE PRO CF CARD 8GB的,应该是不支持DMA模式,所以出现重复以下错误,导致启动时间变长了很多.
ide:failed opcode was :unknown
hdc:dma disabled
hdc:dma_timer_expiry: dma status (0x21)
hdc: dma timeout error


在网上google了很长时间,多数介绍使用hdparm 来启动或者关闭cf卡的DMA模式,或者是在kernel /boot/bzImage-ok1 root=/dev/hdc1 rw 中加入ide=nodma,可是这对我的cf卡并不起作用。煞费苦心后,终于在http://www.linuxquestions.org /questions/linux-kernel-70/compact-flash-dma-doesnt-work-and-i-cant-disable-it.-734489/ 这个网页上找到答案。在查看了./Documentation/kernel-parameters.txt和./Documentation/ide /ide.txt后发现 需要传递个内核的参数不是ide=nodma 而是ide_core.nodma=1.0 这里1.0指的就是我的cf卡对应的接口号和设备号。这样 kernel /boot/bzImage-ok1 root=/dev/hdc1 rw ide_core.nodma=1.0 就没有DMA的错误信息了。ide_core还有一些其他的选项,具体参阅内核的文档 ./Documentation/ide/ide.txt。


    总而言之,搞了一个多月虽然很辛苦,但也学了不少东西。总结一下就是:善于使用google的搜索可以减少找到答案的时间,而且尽量使用英文关键字,因为作技术使用英文的人毕竟比用中文的多;多查看内核自带的文档里面有很多好东西;多跟内行的人交流(逛论坛,QQ群);无论作什么事一定要逻辑清楚,有耐心。山穷水复疑无路,柳暗花明又一村。

构建CF卡Linux系统的风雨历程
  1、今天继续研究把裁剪过的Linux安装到CF卡里,然后要从CF卡里运行Linux系统,之前研究过一段时间,我也已经把Linux系统都重新构建完成了。但是之后试图把裁剪的系统安装到CF卡再启动时出现了问题,首先是把系统文件原样考贝进另一个硬盘,然后重新启动,但没成功,经查,是由于考贝的时候丢掉了一些文件的权限而致,于是查阅相关资料往这个方向上走,发现用cp -Rfva命令可以正常把文件属性也一起考过来,参数a是指考贝时连属性一起进来。经过测试,成功。


  2、接着试图把系统在CF卡上运行,我安上述方法把系统文件考贝进CF卡后,然后再在CF卡上手动安装了GRUB,重新启动电脑,改BIOS为从CF卡启动,结果失败。


  3、接着我分析了各种可能存在的原因,并且也做了许多尝试,最终还是失败了,并没有成功从CF卡上启动Linux。由于时间关系,我又必须转向另一个任务,这个任务也就暂时搁置了,但我通过之前的尝试,基本怀疑了CF卡系统启动失败的原因。那就是可能是CF卡不支持DMA方式传输数据,系统启动时老是在DMA一处卡住了,但当时没有太多时间去研究,也就放下了。以后有时间再搞吧。


  4、今天终于有时间继续来研究CF卡启动Linux的问题,经过上次的研究,我就在当时怀疑的可能出现问题的情况下往这个方向去解决这个问题,首先把BIOS里关于DMA的选项都关闭了,一个一个的尝试,但没有成功,最后在没有任何办法的时候我想到了可以换台电脑试试(因为我的PC硬件较新,我在想换个老的PC试试),终于,一换上去,成功进入了GRUB,哇,这个时候我的心情非常高兴。看来这个时候是成功的第一步啊。


  5、既然进行了GRUB,那说明CF卡应该能正常工作了,下一步系统的启动如果设置正确的话应该就可以成功启动。怀着这个想法我开始尝试启动Linux,首先进入GRUB,在GRUB的命令行里写了启动Linux的命令

root (hd0,4)
  kernel /boot/kernel-2.6.11.12-3 root=/dev/hda5
  boot


  然后回车,哇,系统内核正常进入了,但在内核的启动过程中,经过设置硬盘DMA的时候超级慢,并且有报错。我当时就怀疑这里肯定有问题,只是不知道如何解决,经过了漫长的等待,Linux终于进入到mount root fs了,但这一步出错了,提示说无法挂载根文件系统,这个问题我可是经常碰到的,只是出现在这里让人不好判断是哪里有问题。于是我回想系统启动时的屏幕打印信息,突然一闪(内核为什么会检查hdc设备呢?我的CF卡应该是hda啊?我在GRUB里传递给内核的参数也是写的root=/dev/hda5啊?)想到这一点的时候我心里似乎找到原因了(可能是系统把我的CF卡识别成了hdc),正常情况下这个结果应该只有一个原因所致,那就是我的CF卡接的IDE接口位置不对,于是我重新启动PC,进入到BIOS里,一看,哦,明白了,BIOS里显示我的CF卡处于第三个IDE位置,顿时确定了root fs挂不上的原因了,接着我把CF卡拔出来,插到IDE的第一个位置上,然后设置GRUB内核参数,再经过漫长的等待,哇,真激动人心啊,系统正常挂载了root fs,但别高兴太早了,问题又出来了,那就是系统正常进入启动了INIT进程,但没走几步,系统又提示说根文件系统又不能正常进入,到这时,我就觉得奇怪了,不是设置正确了吗?自己来回走了数趟,一边走一边思考,突然又是一闪,一个可能的原因又出来了,那就是我的系统是从另一个硬盘考贝过来的,而硬盘对应的分区不一样,现在问题很清楚了,就是出在fsttab文件的配置上,于是我马上把CF卡取下来,放到另一台电脑上把CF卡里面的fsttab文件更改正确了,然后再放回测试,哇,这次真是万分激动啊,系统真的起来了,出现了登录项。虽然系统在启动过程中提示了几个错误,不过那都是配置上的问题,不是什么大问题,正确配置就应该可以正常。于是我登录系统,进去了,非常正常的跑起来了,高兴啊。我这人有点完美主义,觉得这个系统还不完美,在启动的时候出现内核DMA设置出错,并且因为这个错误而停留非常长的时间。


  6、现在的问题就是解决内核启动时加载DMA时出错的问题。我首先想到的就是在编译内核时的内核配置选项里会不会有这一项呢?于是我重新make menuconfig在里面找了个遍,也没有发现关闭或设置我需要的DMA的选项,反正是尝试嘛,于是我把内核配置选项里我怀疑是的选项都关了,然后重新编译了一个内核考贝到CF卡里,接着启动系统,但是结果总是没有那么快让人满意,问题依然存在哦,我在屋子里走来走去,想招啊!最后想来想去也没有一个可能的原因说服自己再去尝试。唉,上了个厕所,然后长叹一声,真是才思枯了吗?哦,对了,我应该问问google和baidu了,也许它们知道呢?于是我在baidu里输入了


  dma error linux后回车,哇,没想到还真有许多人问这个问题,在一大堆“药”里慢慢找能医治此病的药,突然,找到了一个非常关键的一句话“启动时加了一行“ide=nodma",就好了,...”,于是我怀疑这个可能就是我需要的药哦,真是迫不及待的把系统重新启动,然后设置内核启动参数:


  root (hd0,4)
  kernel /boot/kernel-2.6.11.12-3 root=/dev/hda5 ide=nodma
  boot


  因车后,经过几十秒钟的等待,哇!结果真让人满意,问题真的解决了哦,真是高兴啊!到此为止,从CF卡里启动Linux的任务基本完成了。呵呵,高兴啊,接着要进入下一步了,系统的配置。

7、SSH服务的自启动的配置。因为这个系统是我基于LFS重新构建的系统,基本上完全靠自己去定制各种服务,平时在别的Linux发行版里如Red Hat、CentOS、ARCH、DeBian里,配置这个服务根本就不是问题,但是这个系统里就不是的哦,我通过观察系统的/etc目录下的脚本,发现没有rc.local,我自己手动创建了一个rc.local,然后把启动SSH服务的命令加到里面,重新启动系统,结果,SSH没有起来,看样子手动添加了rc.local文件没有用。于是我再进一步观察/etc/rc.d里的东西,这里面的目录我都光顾了几次,最后发现应该是在/etc/rc.d/rcsysinit.d加一个什么东西,就可以实现自启动,于是我尝试着执行了:ln -s ../init.d/sshd S100sshd命令,然后重新启动系统,呵呵,SSHD在系统启动的时候正常启动了,但是连接不上,我就怀疑可能是SSHD的启动先于了network的启动,没有读取网络信息而不能连接。然后仔细观察了一下/etc/rc.d/rcsysinit.d的文件,好像里面都是系统必须的基本服务的启动脚本。于是我在想,我的系统里的inittab设置的启动级别是“3”,应该在系统启动的时候读取rc3.d里的脚本运行,想到这一点时我就有办法了,于是我删除了/etc/rc.d/rcsysinit.d里的S100sshd文件,然后进入/etc/rc.d/rc3.d目录里执行了


  ln -s ../init.d/sshd S50sshd,然后重新启动系统,哇,成功了,SSHD正常启动与工作了,我能正常连接上去哦。呵呵,系统的构建又前进了一步哦,但是同时我明白,一个从零开始的系统发展到一个可用的服务器操作系统还有很远的路要走哦。慢慢努力吧。你能行的。