本帖最后由 reloaded 于 2016-5-10 07:31 编辑
附件无法发送 ,给出链接 可以下载
http://www.dspconcepts.com/sites ... DSPC_Benchmarks.pdf
DSPC_Benchmarks.pdf
(240.29 KB, 下载次数: 109)
2016-5-10 07:28 上传
点击文件名下载附件
这个是cortex m7 ,m4 ,a9,a15的dsp性能比较测评的文档,比较全;
目前来看,cortex m7 的dsp性能是a9的一半,但是在一半测试中,m7的dsp性能已经
接近cortex a9,这和我之前说的m7内核是在a9的基础上做了修改有关。
http://www.roylongbottom.org.uk/android%20neon%20benchmarks.htm
这个是neon性能的benchmark,还有软件工具
通过测试看到,cortex a53的性能确实好于 cortex a9. neon就是高级的simd
在 fpu部分
Cortex-M7 SoftVFP
Cortex-M7.fp.sp FPv5-SP
Cortex-M7.fp.dp FPv5-DP 性能会比软件vfp好不少,其实m4的所谓fpu也是软指令实现,如果没有高频支持,也不台实用。当然cortex m内核的fpu一直很弱,能对这个部分进行优化的人很少。
参考
http://infocenter.arm.com/help/i ... r1359124234797.html
关于浮点的知识,需要看arm官网知识库了解更多
http://infocenter.arm.com/help/i ... r1359124234797.html
频率差不多,不优化基本没提高, 除非你看懂算法,重新写一下,充份利用stm32f7内部资源
看coremark就知道了,arm9 连2coremarks /mhz 都达不到。cortex m7 的数据至少是 5 coremark/mhz。跑分实际比同频率m4快一倍。
arm9比如 9g20 400mhz,800coremark,m7 300mhz,1500 coremark。单纯的数学运算还涉及到fpu部分。(印象里arm9 也只有32位的双精度浮点模块)
2,id cache方面 arm9 一般是双16k, cortex m7是双32k (stm32f746 是4k)
实际运算的效果受到 cache,ram,flash接口速度影响很大; 我用过某款a5,那启动速度比arm9还慢,完全没有优化
垃圾的arm9连mcu都比不上。
arm9 五级流水线
m7 六级流水线、顺序、双发射超标量流水线,拥有单精度、双精度浮点单元、指令和数据缓存、分支预测、SIMD支持、紧耦合内存
Cortex-A53也与Cortex-A7相似,顺序发射8级流水线。...
一周热门 更多>