DSP TMS320C6000基础学习(2)——体系结构

2019-07-29 16:30发布

主要内容:
1.jpg
1. CPU架构
一幅图片搞定
2.jpg
2. C6000基本指令集

在“DSP TMS320C6000基础学习(1)”中已经说过:SOP是大部分DSP算法的关键单元。C6000的寄存器包括A,B两组。
我们将看看下面的表达式通过DSP指令是怎么一步步实现的,
Y=∑an*xn withn = 1...N


(1)an*xn乘法实现,DSP中有专门的硬件乘法模块,因此只需要一个指令就能完成乘法操作,而且指令周期为1
MPY .M a1,x1,Y1  

其中MPY为乘法指令,.M表示DSP的乘法单元,上面指令执行Y1=a1*x1。

(2)加法实现,ADD指令,加法单元用.L表示,下面指令执行Y=Y+Y1
ADD .L Y,Y1,Y  

(3)内存数据装载(上面的操作其实是有问题的,MPY和ADD不能直接操作内存),只能使用如下命令:
<p>LDB *Rn, Rm:转载一个字节(8bits)</p><p>LDH *Rn, Rm:装载一个半字(16bits)</p><p>LDW *Rn, Rm:装载一个字(32bits)</p><p>LDDW *Rn, Rm:装载一个double字(64bits)</p>
其中Rn包含要装载操作数内存地址(32bits)的寄存器,Rm为目标寄存器。装载的DSP执行单元称为.D。

(4)将常量装入寄存器指令——MVKL和MVKH

<p>MVKL const, Rn(低16bits)</p><p>MVKH const Rn(高16bits)</p>
const是一个常量或标签值,只能先装低位再装高位。
比如(3)中,先要将操作数内存地址载入Rn中,因为地址长度为32bits,必须依次使用上面的2条指令完成地址到寄存器的载入工作,

<p>MVKL Addr_low8 Rn  </p><p>MVKL Addr_high8 Rn  </p>
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
5条回答
tianli1980
2019-07-29 21:59
(5)综合(1)~(4)指令完成a1*x1的过程
1.jpg


其中pt1和pt2分别为a与x地址。

(6)循环指令
为完成Y=∑an*xn withn = 1...N,还有一个循环求和的过程,与其它平台类似,DSP中通过跳转指令和计数器实现循环,实现循环的步骤为:
========================================================
添加一个标签(下一次要跳转到何处);
添加跳转指令(B);
创建一个循环计数器;
添加一条指令用于对循环计数器更新;
使跳转指令根据计数器的值做相应的跳转;
=========================================================
下面为一个示例,

<p>MVKL .S count, B0        ; 计数器寄存器B0初始化为count  </p><p>..... </p><p>SUB .S B0,1B0            ; 计数器减1  </p><p>B .S loop                ; 当B0不为0时跳转  </p>

上面用到了条件指令[Reg],还有取反的条件指令[! Reg]。条件寄存器可以为A0,A1,B0,B1,B2。

到此,我们已经在DSP上使用指令完全实现了Y=∑an*xn withn = 1...N
2.jpg

这里考虑一个问题,如果我们要提高DSP的处理能力,有什么方法么?很容易想到,一方面可以提高时钟频率,从而减小单周期的时间;另一方面是增加处理单元的个数(指上面提到的.D .M .L .S等)。
3.jpg
4.jpg

另外,针对高性能的处理器还有更高处理性能的指令

一周热门 更多>