DSP

TI OMAPL处理器介绍

2019-07-13 10:55发布

曾经,会单片机的工程师牛得一塌糊涂。想十年前一个会单片机的工程师几乎就是嵌入式工程师的代名词。 若干年前,ARM开始暂露头角,看到单片机工程师的牛气,ARM工程师笑了。而从包括合众达在内的中国DSP三巨头开始在中国推广DSP时,所有开始使用DSP的工程师笑了。他们有理由笑,他们有资格笑。因为在那时,DSP就代表着高高在上,收入高、职位高、声誉高,典型的三高。而经过若干年的推广,DSP已经脱下了神的外衣,走下了神坛。会DSP的人越来越多。但随着DSP开发者的日渐增多,DSP的娘嫁人(TI)发现,纯DSP血统的姑娘们越来越难嫁了。时代的青年对于姑娘的要求已经不再在能做一手漂亮而高效的女红(计算)。人们希望娶到家的姑娘是出得厅堂,进得厨房,能歌而善舞。大户人家的公子希望媳妇儿如DSP般贤良淑德,又像ARM般千妖百媚。 2005TI推出了DaVinci技术,这一血统的姑娘既贤良淑德又千娇百媚。ARM926 + 64x+在世界各地的选美比赛中,DaVinci小姐一路过关斩将,一届又一届地当选为世界小姐。但后来人们发现,所有的评委都是对AV比较感兴趣的。一时间,AV门事件波及全球。在人民大众强大的呼声里,OMAPL小姐,姗姗来迟。 ARM+674x(定浮点DSP)。她是如此的大方美丽,如此的平易近人,她是无冕的后冠。 接下来的几天,我会继续介续OMAPL处理器家族。在我做完基本介绍之后,我的同事even会讲述如何实现ARM+DSP的通信。
1 器件功能组成 名词解释: OMAPL = Oh My Application Processor Low-power edition. (Blacksword独家解释) OMAPL处理器内部构成: 介绍OMAPL内部构成之前,我们先来回顾一下TIDSP功能结构。 下图是TMS320C6748blockdiagram 从图上可以看出DSP器件其实本质上就是一个DSP运算核心,通过Switch Fabric/EDMA连接了一堆片上外设而已。至于核心那部分,我们大部分只是DSP器件的使用者,而不是设计者,不需要花过多的精力去深究。 我们以前讲DSP的开发:就硬件而言即将需要用到的片内外设引出来而已,把片外的外设连接到总线上而已;而做硬件,我个人认为都无所谓是否DSP工程师,因为DSP也好、ARM也好、X86也好,考验工程师的都是指定的板子硬件线路连接正确性,能不能在指定面积上布完,电路会否出现局部过热,电磁兼容性好否,高速接口线长线宽是否合理等,而这一切不会因是否DSP而有任何的不同。 个人认就DSP而言,软件的开发,才是真正的DSP开发。而就软件而言,即设置好SwitchFabric以便能够选中指定的外设,然后读取指定外设上的数据,将这此处理好的数据再写到其它指定的外设上而已。从这一点上讲,开发DSP本身并非高高在上的神话。大部分所谓的DSP高手,其实严格来讲应该说是数学高手,逻辑高手,他们小小的一点手段,就可以让算法效率提高很多。真正的高手,只有实在在算法没什么可以抠的,才会使用汇编。 那我们不管高手不高手的,总之其实要会写一个简单的DSP程序,做基本的处理,大家都觉得比较容易的。 在第0讲中,我们提到TI2005年推出了DaVinci系列平台。但很多人用了后,心里有着说不出的委屈,尤其是少部分因为DaVinci而被减员下来的。 这部分人看到了OMAP-L,觉得OMAP-L这个平台非常亲切亲切得让他们牙痒痒。怎么看怎么像DaVinci。且放下亲切的问题不谈,我们先来看看DaVinci的表妹OMAP-L到底长得什么样。盖头掀开,OMAP-L的脸蛋身材如下图(图为OMAP-L138): 与表姐DaVinci相好过的人,一定能看出来。表姐表妹的区别仅在于一个胸大(在VICP),一个秀气(DSP为定浮点) 但我更希望大家将目光从胸部移开,这样才有助于我们从整体上认识DaVinciOMAP-L这对姐妹花。 请大家看看OMAP-L138TMS320C6748(代表了传统DSP)之间的联系与区别。你一定会很容易就发现: 共同点就是同样是处理器核心通过Switch连接到各种不同的片上外设。 而最大的不同点就是OMAP-L片内有两个处理器核心,一个ARM 一个DSP 你要是问一下有经验的DSP开发工程师,开发DSP难不难,你会得到什么答案? 同样你可以问一下有经验的ARM开发工程,开发ARM难不难,你会得到什么答案? 很多公司在很多项目中已经同时使用ARMDSP,那怎么将ARMDSP混搭出来的DaVinci/OMAP-L怎么就有很多人觉得不好用呢? 其实这个问题诚然有TI的原因,但与我们本身的用法也有很大的关系。觉得他不好用、不美是很正常的。不信: 你去问一下有经验的DSP工程师,ARM开发容易否? 很多早期开发DaVinci的公司,一个像样的ARM工程师都拿不出来,然后就在那里叫嚷TI提供的东西不全,DaVinci的架构不好,到今天他们也还在说OMAP-L架构不好,就是看着OMAP-L看着像DaVinci 我们承认对于你的应用TI提供的软件可能相当不全。但这正在DaVinci的魅力所在,毕竟DaVinci提供的不是山寨货,而是提供给大家实现无限创意的能力。 那么在基本组件方面,TI会致力于提供给大家符合Linux标准的各种驱动及软件中间件。有了标准的保证,你会发现如GUI或是RTP/RTSP等更上一个层次的软件组件上,你根本就不缺软件,因为大量的开源项目都是你的项目。 我曾经有一个移植Gnash(Linux下的Flash播放器)的惨痛教训,在TI DaVinci平台仅花了几天时间,所有软件就移植成功。D1以下的基本上能达到15FPS 但在另一个厂商所谓完善的平台,确认有对于某几个特定应用的完整方案,几乎可以直接将代码用于量产。但当客户需要Flash时,找到了我。我遇到的第一个问题是该平台提供的C语言库是不完整的,不得已我给客户重新移植了C语言库以及编译器。我们都知道在嵌入式产品上要显示就通常会用到Framebuffer。我的第二个问题,就是Gnash要用到SDLSDL最轻量的backend就是framebuffer。但我无比痛苦的发现,该平台上的framebuffer的驱动并不标准...... 做了无数的修改之后,终于将Gnash在客户的平台上运行起来,新的问题是该平台提供的那些完整解决方案,不能运行在新的C库上,然后是非常痛苦的改解决方案中程序的过程,总共浪费了好几个月。 因此,我们认为TI的平台还是比较容易使用的,关键是你得让合适的人干合适的事情。后面我们会分析这个架构,并讲述基本的开发流程。 下面我们看一下OMAP-L处理器家族都有哪些成员及旁系。 OMAPL处理器家族成员:
型 号 主频(MHz) PWM DMA CPU RAM L1 L2 封装 McASP McBSP MMC/SD Timer(64bit) uPP PRU 其它 OMAPL137 375, 456 3 32ch EDMA ARM9, 674x SDRAM 64K 256K 256BGA 3   1 1GP, 1GP/WD     UART, USB, LCD, I2C, HPI, eCAP, EMAC, SATA OMAPL138 375, 456 2 2 32ch EDMA ARM9, 674x SDRAM, DDR/2 64K 256K 361 NFBGA 1 2 2 3GP, 1GP/WD 1 2 UART, USB, LCD, I2C, HPI, eCAP, EMAC, SATA

OMAPL旁系之ARM成员:
AM1808 OMAPL138的无DSP版本 AM1806 AM1808的无EMACSATA版本 AM1707 OMAPL137的无DSP版本
OMAPL旁系之DSP成员:
TMS320C6748 OMAPL138的不带ARM版本 TMS320C6746 TMS320C6748EMACSATA后的版本 TMS320C6742 阉得就更多了 TMS320C6747 OMAPL138的阉DSP版本
暂时讲到这里,稍候继续
2 SCR Switch Central Resource介绍 关于ARM的核心,由于我们不再介绍,它不会因为披上了TI的外衣就不是ARM 关于DSP的核心本身,我们也不再介绍,毕竟,这里我们不是要讲如何做算法的优化。因此流水线与指令集,都不在考虑之内。 就一个应用而言,最主要的就是各种外设的使用。 而对外设的使用而言,最重要的就是这堆玩意儿是怎么连接到CPU上的。 如我们在《OMAP-L处理器介绍 1》中所讲,在OMAP-L处理器上,外设与CPU们是通过SCR连接在一起的。 好,废话少说。上图先!
1 OMAP-L138 Switched Central Resource 看到这个图,肯定很多人与我最开始的感觉一样,什么乱七八糟的呀。 里面的SCR还好说,肯定是Switch Central Resource BR是什么呢?TI没有给出缩略语说明,但在SPRUGM7D那篇名为《OMAP-L138 Application Processor System Referrence Guide》第4.1节,也就是上面这个图的上面一段文字里列到"The switch fabric is composed of multiple switched central resources (SCRs) and multiple bridges" 显然这里的 BR就是BRidge的意思。 这样这个图的作用,就显然了,就是说数据可以从哪里到哪里。 而在这个算是器里面有能力决定哪个使用哪个SCRBR的核心为ARM, DSP, EDMA以及PRU. 讲到这可能已经有很多朋友在骂我罗嗦了。 那么到底该怎么决定哪个SCR甚至哪一个BR被使用才能访问到一个外设比如说串口?你要不说清楚,今天别想走!(腹黑中) 我们TI,把所有的这些挂在SCR上的外设,统一进行了编址?每个设备都对应在特定的地址上,比如说串口0, 0x01c4 2000 ——0x01c4 2034分别对应着串口寄存器RDRMDR。客户只需要大CPU上访问0x01c4 2000就可以访问相应串口寄存器,对应的SCRBR会自动选上” (想知道我们TI是怎么设计器件,嘿嘿嘿!) 被忽悠了半天看这个图,比较不爽!(权当消遣了,学习一下芯片的实现原理) 对于我们要用好器件上的外设而言,比较实惠的还是memoryMap。 下图为OMAPL138器件的MemoryMap(摘自OmapL138datasheet. 2 OMAPL138 MemoryMap 从数据表我们可以看出如果要从DSP访问DSPL2RAM,只要在DSP代码里访问0x0080,00000x0083,ffff 有的人可能要问题,要是我候通过ARM