专家
公告
财富商城
电子网
旗下网站
首页
问题库
专栏
标签库
话题
专家
NEW
门户
发布
提问题
发文章
DSP
【ARM-Linux开发】【DSP开发】AM5728介绍
2019-07-13 10:29
发布
生成海报
站内文章
/
DSP
13755
0
1051
AM5728 Sitara Processors
1.
介绍
1.1
AM572x
概述
AM572x
是高性能,
Sitara
器件、以
28nm
技术集成:
结构设计主要考虑
嵌入式
应用,包括工业通讯,人机接口(
HMI
),自动化控制,其它高性能通用的应用,
流视频,支持到全高清
1920x1080p@60Hz
2D
和
3D
图形和合成。
器件的组成由下面几个部分:
Cortex-A15
微处理器单元(
MPU
)子系统,包括
2
个
ARM Cortex-A15
核
2
个数字信号处理器(
DSP
)
C66x
子系统
2
个基于
Cortex-M4
的图像处理单元(
IPU
)子系统,每个
IPU
包括
2
个
ARM Cortex-M4
微处理器。
IPU1
子系统可用于通用目的的用处
IPU2
子系统专用于
IVA-HD
,不可用作它用。
显示子系统(
DSS
)
视频处理子系统(
VPE
)
视频输入捕捉(
VIP
)
3D-
图形处理单元(
GPU
)子系统,包括
POWERVR
的
SGX544
双核
2D-
图形加速(
BB2D
)子系统,包括
Vivante
的
GV329
核
3
个
PWM
子系统
RTC
子系统
两个双核可编程实时单元和工业通讯子系统(
PRU-ICSS
)。
调试子系统。
器件提供一套丰富的互联外设,这些包括:
一个
USB3.0
和一个
USB2.0
子系统
SATA 2
子系统
2
个
PCIe Gen2
子系统
Gigabit
以太网交换系统,提供
2
个外部以太网端口和一个内部
CPPI
接口端口
器件还包括:
错误检测和纠正
在
C66x DSP L1
程序
cache
上的每个字节都有校验位,以及在
DSP
的
L2
内存上的单错误的校正和双错误的检测(
SECDED
)
在大的
L3
内存上的
SECDED
在外部
DDR
内存接口上的
SECDED
(仅
EMIF1
支持)
MMU/MPU
MMU
用于关键
Masters
(
Cortex A15 MPU
,
Cortex-M4 IPU
,
C66x DSP
,
EDMA
)
C66x
核的内存保护
在动态内存管理器里的
MMU
器件还包括了代表目前技术水准的电源管理技术,这是高性能嵌入式产品所必须的。
器件还集成了:
片上内存
外部内存接口
内存管理
L3
和
L4
互联
系统和串行外设
1.2 AM572x
环境
1.3 AM572x
描述
AM572x
封装为大小
23x23mm
,有
760
个球,球间距
0.8mm
的
BGA
。
1.3.1 MPU
子系统
Cortex-A15 MPU
子系统集成了下面的子模块:
ARM Cortex-A15 MPCore
两个中央处理单元(
CPUs
)
ARM Version 7 ISA
:标准
ARM
指令集加
Thumb-2
,
Jzaelle RCT
Java
加速器,硬件虚拟支持,大物理地址扩展(
LPAE
:
large address extensions
)
每个
CPU
有:
Neon SIMD
协处理器和
VFPv4
中断控制器支持
160
个中断请求
每个
CPU
有:一个通用目的的定时器和一个看门狗定时器
调试和追踪特征
每个
CPU
有:
32-KiB
指令和
32KiB
数据
L1 cahce
共享
2-MiB L2 Cache
48-KiB
可引导
ROM
局部电源、复位、时钟(
PRCM
)管理模块
可仿真调试
数字锁相环(
DPLL
)
1.3.2 DSP
子系统
器件里有
2
个
DSP
子系统,每个
DSP
子系统包含下面子模块:
TMS320C66x VLIW DSP
核,可用于音频处理、通用目的的图像处理、视频处理,它扩展了
C64x+
和
C647x DSP
的性能,并增加了一些新的特征。
32KiB L1D
和
32KiB L1P Cache
或可寻址
SRAM
288KiB L2 Cache
256KiB
可配置为
Cache
或
SRAM
32KiB SRAM
EDMA
引擎,用于视频和音频数据传输
用于寻址管理的内存管理单元(
MMU
)
中断控制器(
INTC
)
仿真调试能力
1.3.3 PRU-ICSS
子系统
器件里有
2
个可编程实时单元和工业通讯子系统(
PRU-ICSS
:
Programmable Real-time and Industrial Communication Subsystems
),每个
PRU-ICSS
由两个
32bit RISC
核组成(可编程实时单元
PRUs
:
ProgrammableReal-TimeUnits
),共享数据和指令内存、内部外设模块、中断控制器(
INTC
)。
在
PRU-ICSS
支持的接口中,都是用在主模式和从模式的实时工业协议,比如
:
EtherCAT
PROFINET
EtherNet/IP
PROFIBUS
Ethernet Powerlink
SERCOS
1.3.4 IPU
子系统
器件中有
2
个基于
Cortex-M4 IPU
子系统:
IPU1
子系统可用于通用目的。
IPU2
子系统专用于
IVA-HD
,不可干别的用。
每个
IPU
子系统包括下面:
2
个
Cortex-M4 CPUs
ARMv7E-M
和
Thum-2
指令集
架构
硬件除法和单周期的乘法加速
专用的
INTC
,具有
63
个物理中断事件和
16
个级别
2
级内存子系统结构:
L1
(
32KiB
共享
cache
内存)
L2 ROM+RAM
64KiBRAM
16KiB Bootable ROM
用于地址翻译的
MMU
集成的电源管理
仿真调试内嵌在
Cortex-M4
上
1.3.5 IVA-HD
子系统
IVA-HD
子系统是一组视频编解码硬件加速器,其所支持的
Codecs
可以见软件
SDK
文档。
注:目前
Linux
SDK
文档上说:视频解码支持
H264
、
MPEG4
、
MPEG2
和
VC1
;视频编码支持
H264
和
MPEG4
;图像解码
JPEG
。
1.3.6
显示子系统(
DSS
)
显示子系统提供控制信号,这些信号是设备系统内存帧缓冲(
SDRAM
)与显示设备连接时需要的,它支持硬件光标,所有的接口上具支持独立的
gamma
曲线矫正,多缓冲,可编程颜 {MOD}相位旋转,显示子系统允许低功耗显示刷新和在正常与低优先级流水之间的仲裁。
显示子系统由下面几部分组成:
显示控制器:对编码存储在内存里的像素数据进行读并显示,将
overlay
之一或流水线之一的输出写到系统内存中,显示控制器有下面部分组成:
三个视频流水线,一个图形流水线,一个回写流水线。图形流水线支持像素格式有:
ARGB16-4444
,
RGB16-565
,
ARGB161-1555
,
ARGB32-8888
,
RGBA32-8888
,
RGB24-888
,
BITMAP
(每像素
1
,
2
,
4
,
8bit
),允许进行 {MOD}彩深度扩展选择
回写流水线:使用
poly-phase
滤波,独立的水平和垂直重采样(上采样和下采样),它支持可编程的 {MOD}度空间转换:将
RGB24
转成
YUV422-UYVY
,
YUV422-YUV2
或
YUV420-NV12
或
NV21
,以及 {MOD}度深度降低的选择:从
RGB24
降到
RGB16
三个
LCD
输出,每个都有自己的
overlay
管理器,支持有效的矩阵颜 {MOD}显示(高达
24bit
的接口),不能在所有输出上同时支持列出的最高分辨率。
第一个主
LCD
输出,送到
MIPI DPI1.0 LCD
像素接口,支持
WUXGA
(
1920x1200
),减少空时间。
第二和第三
LCD
输出,送到
MIPI DPI2.0 LCD
像素接口,支持
WUXGA
(
1920x1200
),减少空时间。
一个
TV
输出,具有专用的
overlay
管理器,支持
HDMIV1.4a
接口(
1080p@60fps
视频和多通道音频)
自己专属的
DMA
引擎
高清多媒体接口(
HDMI
)编码器,具有下面特征:
兼容
HDMI1.4a
和
DVI1.0
1.3.7
视频处理子系统(
VPE
)
视频处理引擎(
VPE
)模块提供下面内存到内存操作的支持:
光栅读或
tiled YUV420coplanar
。
YUV422 coplanar
、
YUV422
隔行视频
对
2
个
1080i@60fps
视频流去隔行
缩放输入视频到
1080p(1920x1080)
{MOD}度上下采样
VC-1
范围映射和范围减少
{MOD}度空间转换
写最终视频,格式有:
YUV420coplanar
(光栅或
tiled
)、
YUV422 coplanar
(光栅或
tiled
)、
YUV422
隔行
coplanar
(光栅或
tiled
)、
YUV444
单
plane
(仅光栅)或
RGB888
(仅光栅)
1.3.8
视频捕捉(
VIP
)
有三个视频输入端口(
VIP
)模块,支持视频捕捉功能:
VIP1
和
VIP2
模块,每个都支持:
2
个独立的
24bit
视频端口,用于捕捉并行的
RGB/YUV/RAW
(或
BT656/1120
)数据,速率高达
165MHz
2
个独立的
8bit
视频端口,用于捕捉
YUV/RAW
(或
BT656
)数据,速率高达
165MHz
VIP3
模块,支持
2
个独立的
16bit
视频端口,用于捕捉并行的
RGB/YUV/RAW
(或
BT656/1120
)数据,速率达
165MHz
。
每个
VIP
模块还支持:
内嵌同步(多个源)和离散同步(单个源)数据接口模式
{MOD}度空间转换或缩放
支持
1920
像素宽的输入,带缩放
支持
3840
像素宽输入, {MOD}度上
/
下采样,不带缩放
支持更高分辨率,不缩放, {MOD}度也不进行上下采样
内嵌
DMA
引擎,支持
tiled
(
2D
)和光栅寻址。
1.3.9 3D GPU
子系统
3D
图形处理单元(
GPU
)子系统是基于
ImaginationTechnology
公司的
POWERVR SGX544
子系统。它支持通用的
嵌入式
应用,
GPU
能同时处理不同数据类型,比如:像素数据、矢量数据、视频数据和通用目的数据。
GPU
子系统具有下面特点:
多核
GPU
结构:
2
个
SGX544
核,共享
128KiB
系统级
cache
Tile-based deferred rendering
结构
第二代通用缩放渲染引擎(
USSE2
),多线程引擎,包含像素和矢量渲染功能
呈现和文本加载加速器
使能移动、旋转、转动、缩放文本表面
支持
RGB
、
ARGB
、
YUV422
、
YUV420
格式
支持双线性放大
支持源的 {MOD}键
工业标准的
API
支持
OpenGL-ES1.1
和
2.0
精细任务切换、负荷平衡和电源管理
可编程高质量图像去锯齿
双线性、三线性、各向异性纹理滤波
高级几何
DMA
驱动操作以使得
CPU
干预最少。
通过统一的内存
架构
(
MMU
),
OS
操作使用全虚拟内存寻址。
1.3.10 BB2D
子系统
2D BitBlt
(
BB2D
)图形加速器子系统是基于
Vivante
公司的
GC320
核的,它具有下面的特征:
API
支持:
OpenWF
、
DirectFB
GDI/DirectDraw
BB2D
架构:
BitBlt
和
StretchBlt
DirectFB
硬件加速
ROP2
、
ROP3
、
ROP4
全
alpha
融合和透明操作
支持方形剪切
Alpha
融合包括
Java
2 Porter-Duff
复合规则
90-
,
180
,
270-
度旋转
YUV-to-RGB
{MOD}度空间转换
可编程显示格式转换,带
14
个源和
7
个目的格式
高质量
9
阶
32
相位滤波器,用于对
1080p
图形和视频的缩放
单 {MOD}扩展用于文本着 {MOD}
32k x 32k
坐标系统
1.3.11
片上调试支持
片上调试支持下面的特征:
支持多处理器的调试,让用户控制内嵌在器件中的多
CPU
核,比如:
单个或多个处理器的全局启动调试和停止
每个处理器能产生触发,这可用于改变其它处理器的执行流程
系统时钟定时和掉电
多器件的互联
通道触发
目标调试,使用:
IEEE1149.1
(
JTAG
),或
IEEE1149.7
端口
在正常运行模式下,功耗的降低
调试子系统包括:
IEEE1149.7
适配器
模拟和
测试
控制使用通用的
TAP
调试存取端口(
DAP
)
内嵌的追踪宏(
ETM
)
追踪端口接口单元(
EPIU
)
内嵌的追踪缓冲(
ETM
)
模拟脚管理(
EPM
)
交叉触发(
XTRIG
)
调试子系统还提供:
CJTAG_ADAPTER
基本的扫描配置支持
ICEMelter
,用于控制模拟电源域的唤醒和掉电
Ta的文章
更多
>>
【ARM-Linux开发】【DSP开发】AM5728介绍
0 个评论
Linux Essential tools&commands
0 个评论
热门文章
×
关闭
举报内容
检举类型
检举内容
检举用户
检举原因
广告推广
恶意灌水
回答内容与提问无关
抄袭答案
其他
检举说明(必填)
提交
关闭
×
打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮