嵌入式Linux启动优化手记2 U-boot优化

2019-07-12 16:13发布

既然不能使用新的U-boot,那就优化一点是一点,慢慢干吧。
1.去掉启动时的按键等待
U-boot 启动的时候出现一个 Hit any key to stop autoboot 不爽,干吗要停上1秒?虽然可以通过设置参数bootdelay=0来关掉这个延时,但这样做了以后就再也进不去U-boot了,更烦。检查代码,发现是在main.c函数int abortboot(int bootdelay)来干这个活的,好吧,改掉它
static __inline__ int abortboot(int bootdelay)
    {
        int abort = 0;
        char inputkey;
    if (tstc())
        { 
            inputkey = getc(); 
            abort = (inputkey == 'u');
    }
#ifdef CONFIG_SILENT_CONSOLE
       if (abort)
          gd->flags &= ~GD_FLG_SILENT;
#endif
        return abort;
   }
这样,就不需要等待了,如果想进入U-boot,就在上电的时候按住u吧,把它改成一个固定的键而不是任意键,因为串口线很容易受到干扰,如果是任意键的话,运行时即使不想进去有时也会进入U-boot的命令行。 
2.去掉网卡的初始化
每次上电,U-boot 都会初始化网卡,其实这根本不需要,把配置文件中
#define CONFIG_MII   1
去掉,启动时就不会初始化了,需要使用TFTP时,它会自动初始化,又节省了3.4秒的启动时间。
3.智能读取OS Image
U-boot 通过nand read 来读取OS Image,通常为了避免麻烦,我们设置的读取长度要比实际OS长度长一些,多读的那部分纯粹是浪费CPU时间,能不能精确判断读取长度呢,当然可以,为了不影响系统的正常功能,扩展一个nand read.os 指令来读取,修改方法如下:
在 nand_read_options_t 里面添加一个成员 int is_os_img
在函数 int do_nand(cmd_tbl_t * cmdtp, int flag, int argc, char *argv[])
修改读操作的判断语句,添加 !strcmp(s, ".os"),然后设置opts.is_os_img = !strcmp(s, ".os");大概修改后结果参考第7步代码。
    最后,在函数int nand_read_opts(nand_info_t *meminfo, const nand_read_options_t *opts)中修改
代码,检测如果opts->is_os_img == 1 并且是第一次读取(2024B)之后,检查度取得结果是否是OS Image,如果是更新需要读取的长度,否则,也不需要再往下读了,直接返回错误就可以了嵌入式Linux启动优化手记2 U-boot优化
                image_header_t  *hdr = (image_header_t *)buffer;     
                if (image_check_magic(hdr) && image_check_hcrc (hdr))
                {
                    size_t ossz = uimage_to_cpu(hdr->ih_size);//+ image_get_header_size();
                    imglen = ossz + + image_get_header_size();
                    printf("## Find valid OS image, at 0x%x, Size: %d Bytes = %d KB ",
                           (unsigned int)mtdoffset, ossz, ossz/1024);
                }
                else
                {
                    printf("Invalid OS image at 0x%x ", (unsigned int)mtdoffset);
                    return -1;
                }
4.去掉OS Image 内存复制过程
使用 nand read 读取OS Image 后,U-boot 使用 bootm 指令来启动Linux,检查其实现代码
int do_bootm (cmd_tbl_t *cmdtp, int flag, int argc, char *argv[])
发现他会把已经读取到内存中的OS Image 在复制到一个指定的位置,OS Image 中的头部参数,这个值一般是固定的,本系统使用的是 0x70008000, 如果在 nand read 时读到的内存位置恰好合适,就可以省掉这些毫秒数了,做法如下:
nand read.os 0x70007FC0 0x100000 0x500000
(其中 0x70007FC0 = 0x70008000 - sizeof(sizeof(image_header_t)))
然后在内存复制的地方(函数do_bootm中),加入修改,跳过内存复制
    switch (comp) {
    case IH_COMP_NONE:
        if (load_start == (ulong)os_hdr) {
            printf ("   XIP %s ... ", type_name);
        } else {
            if (load_start != os_data)//位置不匹配,依然移动,否则就跳过此部
            {
                printf ("   Loading %s ... ", type_name);
                memmove_wd ((void *)load_start, (void *)os_data, os_len, CHUNKSZ);
                puts("OK ");
            }
        }
        load_end = load_start + os_len;
对于我们的Kernel,修改后大小是1.4M,省去这个搬移过程,节省了大约800ms的时间
5.减少内存初始化的时间
在U-boot 初始化时,在 start_armboot 函数中,多次使用到了 memset函数,其中最耗时的是在mem_malloc_init函数中调用memset 初始化 512K内存的调用,检查U-boot 1.3.4对memset的实现,发现是最简单的字节复制,把它改为按32bits复制的方式,这些memset 调用所花费的时间立即从202ms减少到了45ms
修改方法,再 string.c 中,找到memset函数,修改其实现(代码是从U-boot 2011.12 中复制过来的嵌入式Linux启动优化手记2 U-boot优化)
void * memset(void * s,int c,size_t count)
    {
        unsigned long *sl = (unsigned long *) s;
        unsigned long cl = 0;
        char *s8;
        int i;
  
        if ( ((ulong)s & (sizeof(*sl) - 1)) == 0) {
            for (i = 0; i < sizeof(*sl); i++) {
                cl <<= 8;
                cl |= c & 0xff;
            }
            while (count >= sizeof(*sl)) {
                *sl++ = cl;
                count -= sizeof(*sl);
            }
        }
   
        s8 = (char *)sl;
        while (count--)
            *s8++ = c;
        return s;
    }
6.减少NAND初始化时间
    每次 U-boot 启动,发现NAND初始化需要大约3秒的时间,仔细追踪发现,在nand_base.c文件中nand_scan函数的最后一步return this->scan_bbt (mtd);最花费时间,这个scan_bbt扫描整个NAND并检查坏块,重建坏块表,在启动过程中,这个耗时的操作毫无意义,去掉这一步,让nand_scan 函数直接返回0就可以了。
7.添加Yaffs2支持
从网上各位前辈的论述中,都发现YAFFS比JFFS2要快,也决定测试一下,从YAFFS网站下载最新的代码,按照说明加入到Linux 中,重新编译内核,让内核支持YAFFS2(按照默认的选项就可以了),弄一个空的分区,格式化成YAFFS2格式,感觉的确比较快,把ROOTFS复制到这个分区,然后修改Linux启动参数让它把YAFFS2分区当作根分区启动,发现果然快了不少,初始化和挂载根分区仅需要370ms,比JFFS2的速度快多了,决定就采用YAFFS2作为根文件系统了。自己在u-boot中添加对yaffs2 image的支持
说起来容易,真正做起来还是很麻烦的,总是不能把yaffs2的image 烧写成功,不知道是Image不正确还是Uboot没改对,折腾了几天也没搞定,最后终于发现了一个第三方的工具
http://code.google.com/p/yaffs2utils/
下载,编译,制作Image,验证,OK,把新工具生成的IMAGE与YAFFS2自带的工具对照,发现YAFFS2自带的工具生成的IMAGE不正确,晕死。
重新修改UBoot,改了很少一部份代码,就可以了。
依然是在函数do_nand中修改,添加一个扩展 nand write.y 指令来写入Image:
按照惯例,YAFFS2的第一个块不使用,留给文件系统自己使用,在 nand_write_options_t 里面添加一个成员 int skip_first_block;
在函数 int do_nand(cmd_tbl_t * cmdtp, int flag, int argc, char *argv[])
修改读写操作的判断语句,添加 !strcmp(s, ".y"),然后设置opts.is_os_img = !strcmp(s, ".os");大概修改后结果如下(红 {MOD}部分)
    s = strchr(cmd, '.');
        if (s != NULL && (!strcmp(s, ".jffs2") || !strcmp(s, ".e") || !strcmp(s, ".i") || !strcmp(s, ".os") || !strcmp(s, ".y")))     {
            if (read) {
               
                nand_read_options_t opts;
                memset(&opts, 0, sizeof(opts));
                opts.buffer    = (u_char*) addr;
                opts.length    = size;
                opts.offset    = off;
                opts.readoob = 0;//remove this function.
                opts.is_os_img = !strcmp(s, ".os");
                opts.quiet      = quiet;
                ret = nand_read_opts(nand, &opts);
                //printf("call nand_read_opts buffer %lu len %lu offset %d off, ret %d ", addr, size, off, ret);
            } else {
               
                nand_write_options_t opts;
                memset(&opts, 0, sizeof(opts));
                opts.buffer    = (u_char*) addr;
                opts.length    = size;
                opts.offset    = off;
               
                if (!strcmp(s, ".y"))
                {
                    opts.pad    = 0;
                    opts.writeoob = 1;                 
                    //opts.noecc = 1;
                    opts.skip_first_block = 1;
                    opts.autoplace = 1;
                }
                else
                {   
                    opts.pad    = 1;
                }
                opts.blockalign = 1;                 
                opts.quiet      = quiet;
                ret = nand_write_opts(nand, &opts);
            }
        } else if (s != NULL && !strcmp(s, ".oob")) {...}
在函数nand_write_opts中相应修改
int nand_write_opts(nand_info_t *meminfo, const nand_write_options_t *opts)
    {
          int yaffs_skip_first = opts->skip_first_block;
      ...
      while ((imglen > 0) && (mtdoffset < meminfo->size)) {
             ...
              while (blockstart != (mtdoffset & (~erasesize_blockalign+1))) {
                  do {
                      ...
                  } while (offs < blockstart + erasesize_blockalign);
          }
          if (yaffs_skip_first)
              {
                   yaffs_skip_first = 0;
                   mtdoffset += erasesize_blockalign;
                   continue;
               }
           readlen = meminfo->oobblock;
               if (opts->pad && (imglen < readlen)) 
           ...
          }
      ...
}
8. 其它一些优化措施
经过这些折腾之后,整个系统的启动时间大大加快,然后优化Linux自身的一些启动瓶颈
Linux的启动参数优化:加上了 lpj=99072,节约了几十个毫秒,加上quiet,节约了大约1秒时间
修改内核编译选项,把不需要的内核模块干掉
最后,Linux自身的启动速度约为1.1秒,整个系统的启动速度大约4秒多一点,初步达到了优化目标,系统的主要延时发生在U-boot 1.3.4的FLASH读取上,FLASH读取速度大约只有600KB/S。尝试把Uboot 2011.12的FLASH驱动移植到U-boot 1.3.4上,花费了几天时间,终于可以编译成功了,可惜经常出一些莫名其妙的错误,太不稳定,只好放弃。
以我的能力,U-boot优化到这里就到头了,正准备结束工作时,发现了另外一条可以加速系统启动的方法
可以继续尝试,让我最终把系统的启动时间减少到了1.7秒。
请看下篇嵌入式Linux启动优化手记2 U-boot优化