NXP

【野火®】i.MX RT1052评测——移植RT-Thread

2019-07-12 13:35发布

跨界处理器

    i.MX RT1052i.MX RT系列芯片,是由 NXP 半导体公司推出的跨界处理器芯片,该系列下又包括i.MX RT1020i.MX RT1050 i.MX RT1060等子系列芯片。所谓“跨界”,是指它自身的定位既非传统的应用处理器也非传统的微控制器。    传统的应用处理器如手机主控芯片,它们通常采用 ARM Cortex-A系列内核,配合其芯片架构使得芯片能实现更高频率的运行。传统的微控制器也称为 MCU,它们通常采用ARM Cortex-M 系列内核,相对来说该内核对中断响应更快,所以具有良好的实时性,但其芯片架构特别是集成片内闪存带来了生产技术限制和成本负担,从而限制了其性能。     i.MX RT 系列芯片集成了两者的优点,它基于应用处理器的芯片架构,采用了微控制器的内核 Cortex-M7,从而具有应用处理器的高性能及丰富的功能,又具备传统微控制器的易用、实时及低功耗的特性

野火i.MX RT1052

     野火的i.MX RT1052核心板搭载了i.MX RT1025DVL6A芯片,Cortex-M7内核,主频高达600M130IO全部引出。集成32MB SDRAM128MB NAND FLASH32MB QSPI FLASH2Kb EEPROMLCD-RGB565 FPC接口、1SWD调试接口、 1uart 调试接口、1个电源LED1个用户LED 一个复位按键、1MODE按键、 1WAKEUP按键 1Microusb接口等资源。芯片I0130个, 均通过0.8mmBTB接口在背面引出,包括SEMC总线,方便我们扩展各种模块。底板图片如下:image.png   装在mini底板上的效果图,哎,杰杰还是很羡慕Pro底板的,资源丰富。连LCD都能放在板子上,而我的LCD就只能通过排线弄出来。image.png看看火哥核心板的风骚走线:image.png顶层image.png底层这些走线骚气得一批,不过很多信号线都采用等长走线,保证了信号的稳定性,这个值得点赞!!!

 i.MX RT1052的性能

介绍一下i.MX RT1052芯片的性能优点吧:
  1. 无需片内闪存
         由于跨界处理器采用了应用处理器架构,具有大幅缩小的 SRAM 位单元,在跨界设计架构中,SRAM可以配置为具有“零等待”单周期访问的TCM,从而大幅提升系统性能。
  1. 高性能
         具备高密度片内 TCM 或缓存的跨界处理器的缓存未命中率可低至 1-2%,因此能够提供明显高于 MCU 的有效性能。
  1. 低中断延迟
         在协调对内部和外部硬件事件做出及时响应方面,中断在嵌入式系统中发挥了重要作用。在与用户交互的实时系统中,它们发挥的作用尤其重要,这是因为由用户输入触发的外部事件需要 CPU 做出可靠的低延迟即时响应。跨界处理器采用 MCU 内核构建,因此即使它们采用应用处理器架构,也延续了低中断延迟这一重要特性。跨界处理器的中断延迟最低可达到 10-20ns,而应用处理器的延迟通常长达 1毫秒。
  1. 高能效以及安全性。

野火i.MX RT1052工程

下面来说说固件库写的工程吧,按照火哥一贯舒服的代码风格
image.png而且工程中含有不同版本的工程image.png正常来说,我们写代码不可能一次成功的,需要调试很久才出结果,可以通过ram_debug或者sdram_debug版本将程序快速加载到我们的开发板上的RT1052 芯片的内部 RAM 中或者是板载的SDRAM 芯片中,实现快速调试代码,但是RAM 空间小,适用于小程序调试,而板载的sdram则有32MB的空间,适用于大程序的调试。但是掉电则丢失这些程序,无法用在产品上,仅做调试用。         而下面两个版本,则可以作为产品的最终代码,将程序下载到NOR FLASH中,但是下载速度较慢,而且运行速度较SDRAM慢,杰杰猜测,我们或许应该可以将程序写为两段,在发布产品的时候,从NOR FLASH启动,运行NOR FLASH的第一段程序,将存在NOR FLASH的第二段程序加载到SDRAM/SRAM中运行,直到掉电。这样子就能提高速度了吧。         前面的前三个模式均采用低优化等级(-O0)优化,而_flexspi_nor_release版本则采用高优化(-O3)等级,以便节约程序空间,提高运行效率。(杰杰吐槽:就是编译有点久)。         温馨提示:如果不用mdk看代码的话,可以去掉“魔术棒”->Output -> Browse Information的√。然后可以使用source insight看代码,方便很多,至少比mdk好多了。image.png         下个代码欣赏欣赏。image.png

RT-Thread物联网操作系统

  野火i.MX RT1052的程是移植了RT-Thread物联网操作系统的(还是要支持一下国产的操作系统的),来看看源码吧。       先介绍介绍RT-Thread物联网操作系统(以下简称rtt),操作系统是轻量级的,利用很小的资源完成实时操作系统的工作。image.png这些就是rtt的一些文件,bsp就是一些板级相关的东西,components就是一些组件,看英文单词都知道啦。然后就是src就是rtt的实现的源码,include就是一些头文件,而libcpu就是一些芯片的支持,tools就是一些rtt的工具,example还不会的别学嵌入式了。。。。。image.png  看源码确实是一个很轻量级的操作系统,移植起来也是很简单,重点是火哥已经帮我们移植好啦,直接用吧,杰杰在学校rtt的过程中,发现跟一些操作系统还是有点不一样的,他的启动方式就在启动文件已经做好了。来看看:components.c中的148行:1/* re-define main function */ 2int $Sub$$main(void) 3{ 4    rt_hw_interrupt_disable(); 5    rtthread_startup(); 6    return 0; 7} 先关中断,再做rtt的启动 1int rtthread_startup(void) 2{ 3    rt_hw_interrupt_disable(); 4    /* board level initalization 5     * NOTE: please initialize heap inside board initialization. 6     */ 7    rt_hw_board_init(); 8    /* show RT-Thread version */ 9    rt_show_version(); 10    /* timer system initialization */ 11    rt_system_timer_init(); 12    /* scheduler system initialization */ 13    rt_system_scheduler_init(); 14#ifdef RT_USING_SIGNALS 15    /* signal system initialization */ 16    rt_system_signal_init(); 17#endif 18    /* create init_thread */ 19    rt_application_init(); 20    /* timer thread initialization */ 21    rt_system_timer_thread_init(); 22    /* idle thread initialization */ 23    rt_thread_idle_init(); 24    /* start scheduler */ 25    rt_system_scheduler_start(); 26    /* never reach here */ 27    return 0; 28} 里面有一些函数是我们自己实现的,比如开发板初始化:rt_hw_board_initrtt还是有点好玩的,对外开放了main嘛!我们一般写程序都在main.c中,所以,它又搞了个main_thread_entry线程(其实我更喜欢把这些称作任务,不过都一样啦,既然学了rtt,那就跟官方叫吧) 1void main_thread_entry(void *parameter) 2{ 3    extern int main(void); 4    extern int $Super$$main(void); 5    /* RT-Thread components initialization */ 6    rt_components_init(); 7    /* invoke system main function */ 8#if defined (__CC_ARM) 9    $Super$$main(); /* for ARMCC. */ 10#elif defined(__ICCARM__) || defined(__GNUC__) 11    main(); 12#endif 13} 这个函数是跳转到我们的main.c中的main。下面才是真正实现我们的代码的地方。由于前面说了,rtt启动的时候,会将开发板相关资源初始化,所以,我们自己的main就不需要再初始化了,直接开启rtt的线程的创建与启动。 1lcd_thread = rt_thread_create("lcd",                     2                                 lcd_thread_entry, 3                                 RT_NULL, 4                                 LCD_THREAD_STACK_SIZE, 5                                 LCD_THREAD_PRIORITY, 6                                 LCD_THREAD_TIMESLICE);   7  if (lcd_thread != RT_NULL)  //创建成功 8    rt_thread_startup(lcd_thread);  //启动线程 9  else 10return -1;   11相关宏定义: 12#define LCD_THREAD_PRIORITY           13    /* 优先级,数值越大,优先级越低 */ 13#define LCD_THREAD_STACK_SIZE         1024  /* 线程栈大小,单位为字节 */ 14#define LCD_THREAD_TIMESLICE          5     /* 线程时间片,单位为tick */

i.MX RT1052性能测试


既然是评测,当然得有性能的评测啦,一段使用(-O0)低级优化的整形数计算,在野火i.MX RT1052板载的SDRAM上仅跑了21.487秒。在STM32H743上面跑了21.479秒(400M的工作频率,打开CaChe(高速缓存)),而在stm32f103zet6上跑了957秒多。性能可见一斑了吧???如果不信可以自行测试,我可是等了几分钟就去刷牙了,回来还没跑完。。。。。测试代码如下:(来源网络的测试代码) 1void Calculate() 2{ 3    unsigned long x; 4    unsigned long a; 5    a=1; 6    for(x=0;x<4294967294;x++) 7    { 8        a=a+1; 9    } 10} 测试结果对比:image.pngi.MX RT1052image.pngSTM32H743image.pngstm32f103zet6在性能上面,i.MX RT1052,估计是一般mcu无法跨越的存在了,性能真的是超级强悍的。看文章的网友可能有疑问了,明明400M主频的H71052快啊,在此杰杰回答一下,1052是在外部SDRAM上的程序,而H7在片内内存上,而且H7开了cache,能不快吗,如果这点小程序在1052的SRAM存上跑,绝对也能飞起。。。。。而且重要的是工业级的1052仅需3.8美金,很便宜了。据火哥测试,i.MX RT1052的刷屏速度也很快,1366*768分辨率的屏幕可以达到52HZ,而1280*800的屏幕则达到了60HZ70MHZ左右的VCLK时钟,占用SDRAM50%左右的数据吞吐量。image.png



想要了解更多1052相关的东西,欢迎与杰杰联系本次测试完结。
文章首发地址:野火i.MX RT1052开发板评测:移植RTT、与STM32H743性能对比