今天测试了下STM32F4和TI F28335的浮点性能

2019-12-12 18:22发布

这几天刚拿到STM32F4的评估板,STM32F4这次的卖点就是FPU和DSP指令集,关注了挺长时间,这次就想测试一下STM32F4的浮点性能,如果满足就升级自己飞控的架构。本来用STM32F103+28335双核架构,F28335当浮点处理器用,调试起来比较麻烦,所以一直想换了。

测试代码就是用的我飞控的算法,全部使用浮点运算,包含姿态和位置两个7阶和9阶的卡尔曼滤波器,包含大量的矩阵运算以及部分导航算法和PID控制器等,还有部分IF和SWITCH包含跳转的判定语句,相比纯算法算是一个比较综合的运算。

测试环境:
F28335:CCS V3.3,使用TI优化的数学库,不开优化,程序在RAM里执行。
STM32F4:KEIL V4.7,使用ARM优化的数学库,不开优化。

测试方法:
F28335:在飞控算法入口设置断点,清零CCS的CPU计数器(profile->clock),然后STEP OVER,记录下CPU的计数
STM32F4:在飞控算法入口设置断点,记录下Register窗口内算states计数器,然后STEP OVER,记录下新的计数器数值,与之前的数值相减得到CPU计数

测试结果:
F28335:253359个CPU周期,除以150MHZ,大约是1.69ms
STM32F4:初始值17470 结束值156740,一共139270个周期,除以168MHZ,大约是0.828ms


结论就是,对于包含相对较多跳转的综合浮点算法而言,STM32F4似乎更胜一筹。
大家对于测试过程有什么不足的地方请指出,希望能抛砖引玉,对这两款处理器性能有个更深的体会








友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
99条回答
szszjdb
2019-12-22 01:43
本帖最后由 szszjdb 于 2013-7-11 09:06 编辑

感觉TI/ADI等传统DSP厂家,在库方面比ARM好太多了,全部经过反复优化。ARM基本不重视这块,没投资源去开发,DSP库升级很慢,功能很少。所以在运算方面,ARM虽然硬件上来了但整体平台还是不行呀。当然反过来看,ARM还有潜力。

面对ARM的步步紧逼,不知传统DSP厂,TI/ADI怎么想,等哪天ARM的库完善了,主频上去了,工艺55nm, 他们怎么办,还卖那么贵?传统DSP是否会消亡?  好像在某文章看到了这个预言。

一周热门 更多>