c6000系列的C代码优化(六)

2019-07-30 16:08发布

该问题目前已经被作者或者管理员关闭, 无法添加新回复

3条回答

1楼-- · 2019-07-30 18:33

十二、set_zero 程序的优化
   1、源代码：
Word16 i;
      for (i = 0; i < L; i++)
{
   x = 0;
}
2、改编代码：
   （1）数组长度能被 2 整除
  Word32 i;
      int *x1 = (int *)&x[0];
      for (i = 0; i < L/2; i++)
{
      *x1++ = 0;
}
（2）数组长度能被 4 整除
Word32 i;
      int *x1 = (int *)&x[0];
      int *x2 = (int *)&x[2];
      for (i = 0; i < L/4; i++)
{
      *x1 = 0;
      *x2 = 0;
      x1++;
      x2++;
      x1++;
      x2++;
}
3、优化方法说明：
   把一次循环为一个 word16 的数赋值改为一次为 2个或 4 个 word16 的数赋值。
   4、技巧：
   充分利用C6XX一次读取32位数的特点，并利用一个指令周期能读取两个数据的特点。

huangfeng33

2楼-- · 2019-07-30 19:48

十三、32bit数与 16bit 数相乘
   1、源代码
L_tmp0 = Mac_32_16(L_32, hi1, lo1, lo2);
2、改编代码：
L_tmp0=_sadd(_sadd(_smpyhl(hl32, lo2),
(_mpyus(hl32, lo2)>>16)<<1), L_32);
3、优化方法说明：
   hl32 是32bit 的数， hi1 和 lo1 是 16bit的数，且  hl32 = hi1<<16 + lo1 << 1  ，即 hi1 和 lo1分别是 hl32的高 16 位数和低 16 位数。函数 Mac_32_16(L_32, hi1, lo1, lo2)实现  L_32 = L_32 + (hi1*lo2)<<1 + ((lo1*lo2)>>15)<<1
   源代码是把一个 32 位的数拆成两个 16 位的数与一个 16 位的数相乘，优化后的代码不拆开 32 位的数，直接用 32 位的数与16 位的数相乘。运用这种方法必须保证 hl32 的最低一位数必须为 0，否则应用指令_clr(hl32, 0, 0)把最低位清零。
   4、技巧：
   源代码中的低 16 位数 lo1 是hl32 的低16 位右移一位得到的（留出一位符号位）。在与lo2 相乘时又右移了 15 位，所以在改编代码中右移 16 位，并且是以无符号数与 lo2 相乘。

huangfeng33

3楼-- · 2019-07-30 23:39

精彩回答 2 元偷偷看……

c6000系列的C代码优化(六)

一周热门更多>

相关问题

相关文章

c6000系列的C代码优化(六)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

一周热门 更多>

相关问题

相关文章

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

一周热门更多>