一种基于DSP的中文语音合成系统设计

2019-07-19 16:50发布

摘要：本文提出了基于TI公司的TMS320VC5402的中文语音合成系统方案。整个系统以TMS320VC5402为核心电路进行设计，采用以音节为单位的中性语调，配合基于基音同步重叠相加的PSOLA算法，并用码激励线性预测（CELP）GAL20V8A编码方法对原始采样音库进行编码压缩。
关键词：DSP；SCM；PSOLA；文本分析；语音合成0 引言随着语音信号处理技术的不断发展与成熟，HT7150A语音合成正逐步成为信息技术中人机接口的关键技术。DSP芯片，即数字信号处理器，是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器，其处理速度比最快的CPU还快10~50倍。本文介绍的就是一种基于DSP的中文语音合成系统的实现方法。 1 系统总体方案语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来[1]。为了做到这一点，本系统设计了由（1）前端预处理模块将输入文本文件转换成系统可以处理的标准格式；（2）韵律规则库给出当前语言环境下各个音节的韵律特征参数；（3）语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整；（4）将经过调整的各个语音单元拼接在一起，得到相应于输入文本的连续语音输出等4个基本流程组成。2 硬件系统设计 该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行显示，再送TMS320VC5402处理，最后将合成结果输出。2.1 键盘电路和显示电路AT89S52的键盘接口电路是采用中断方式的，SKM150GB124D有键按下时，就产生中断请求，进入中断处理，然后通过查询P1.0和P1.1的情况，进行相应的处理。用电阻和电容够成了消抖电路，以防止电路的误操作。 AT89S52把从键盘输入的文本信息送给LCD显示，同时把数据写到外部存储器CY7C133，然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示：表1 LCD的指令格式RS R/WDB7 DB6 DB5 DB4 DB3 DB2 DB1 DB0

友情提示: 此问题已得到解决，问题已经关闭,关闭后问题禁止继续编辑，回答。