本人新手。
想请问一下,在定点DSP上,DM6437,采用浮点运算转定点运算优化方法,优化效果怎样?
我做的优化前的相关代码运行时间为129.7ms,优化后的运行时间为2.72ms,提高将近50倍。
我被这个结果吓到了,请各位达人看看这个结果是否合理。代码如下:
优化前代码:
void backGroundUpdate(unsigned char *img_b, unsigned char *img_f, float rate)
{
int i,pixelsNum=height*width;
for(i=0;i<pixelsNum;i++,img_b++,img_f++)
*img_b=(unsigned char)((1-rate)*(*img_b)+rate*(*img_f));
}
优化后代码:
void backGroundUpdate(unsigned char *img_b, unsigned char *img_f, float rate)
{
int i,pixelsNum=height*width;
int r=(int)(rate*(1<<10));
for(i=0;i<pixelsNum;i++,img_b++,img_f++)
*img_b=(unsigned char)(((1<<10-r)*(*img_b)+r*(*img_f))>>10);
}
小弟不甚感激!!
此帖出自
小平头技术问答
定点DSP的CPU本身只支持定点运算,C语言中的浮点操作由C编译器调用编译器内建的“浮点库”来支持,而‘浮点库“中的函数用CPU直接支持的定点指令模拟浮点操作。可以想见,这样的“用定点指令模拟浮点运算”是相当耗时的,相当于每次浮点运算对应一个函数调用。直接用定点的话,每次定点运算通常对应一条指令。所以50倍的性能差异是合理的。
[ 本帖最后由 armstrongfan 于 2011-9-5 11:36 编辑 ]
一周热门 更多>