一个简单的语音识别程序

2020-01-15 19:24发布

本帖最后由 lcw_swust 于 2012-5-19 22:57 编辑

最近想做语音识别玩玩,网上查了查,找到一个用Atmega32实现的语音识别机械车
地址是:http://courses.cit.cornell.edu/e ... h8_css34/index.html
貌似是利用带通滤波取得频谱(或者叫功率谱?),看不太懂.我决定用DFT算法,因为它节约内存

DFT程序借借鉴了 hendry 单片机 DTMF 软解码算法的实现
http://www.ourdev.cn/forum.php?m ... &highlight=dtmf

//--------------------------------------------------
//DFT运算
//注意，ad是有符号数，无符号的AD值需减128
//返回值为1表示已经计算了功率谱
//--------------------------------------------------
U8 dft(S8 ad)
{
U8 i;
U8 offset;//查表指针
U32 temp;
//ad-=128;//去直流分量
for(i=0;i<NFREQ;i++)//每个频点计算实部和虚部
{
offset=tabp;//取查表指针
s_dft_image += (S16)ad * sintab[offset];//>>8;
offset+=PI2/4;//偏移1/4周期为cos表
s_dft_real += (S16)ad * sintab[offset];//>>8;//cos表
tabp+=tabinc;//指针下移
}

s_dft_p ++;
if (s_dft_p == NSAMP) //采样点已达到设定值,计算功率
{
s_dft_p = 0; //点数清0
for (i = 0; i < NFREQ; i ++)//每个频点计算功率
{
s_dft_real/=NSAMP*6; //除以合适的值能使得功率在一字节内
s_dft_image/=NSAMP*6;
temp=s_dft_real*s_dft_real + s_dft_image*s_dft_image;
if(temp>65535)temp=65535;
s_dft_real = sqrt16(temp);
//s_dft_real = sqrt32(((s_dft_real*s_dft_real) + (s_dft_image*s_dft_image)));
}
return 1;
}
return 0;
}

本程序流程大概是这样:
定时读取ADC,计算5个频率点的实部与虚部,采集64点后计算5个频率点的功率,称之为功率谱
当功率值达到一定值后,认为是一帧语音开始,此后计算的34次功率谱分别存入数组中.
若是在训练状态,则将这34个功率谱存入模板数组,训练完毕后进入识别状态.
在识别状态下,用这34个功率谱去与模板匹配,找出误差最小的,若误差小于一定值,则识别成功.
目前程序只识别两个命令,识别率还不太理想,偶尔会有误码.
如果把模板存进EEPROM,则可以增加命令的个数.
程序量较小,占用内存也小,可以很方便的移植到AVR单片机.

电路用了AGC,就是把2SK30A当作可变电阻,GS间负电压越大,DS间电阻越大.
据说可以用发光二极管+光敏电阻来做AGC.
初步的实验也可以用电脑音频输出串联电容到ADC输入口,至少这样每次放出来的声音是一样的,便于验证

频谱计算是否正确.

附件中有一个用VB写的查看波形的程序,只需通过串口向它发送数据就行了,格式是0xAA+数据字节数+数据
识别结果.jpg里每行最后一个字节是结果,为0表示未能识别,前10行是对命令1的识别,后10行是对命令2的识别

友情提示: 此问题已得到解决，问题已经关闭,关闭后问题禁止继续编辑，回答。

该问题目前已经被作者或者管理员关闭, 无法添加新回复

99条回答

downtoearth
1楼-- · 2020-01-16 00:10

这个厉害呀，顶帖！

加载中...

Rick123
2楼-- · 2020-01-16 04:31

语音图像这一块其实前景挺大的
因为用户会觉得交互越来越好了

加载中...

wxw123321
3楼-- · 2020-01-16 09:49

精彩回答 2 元偷偷看……

加载中...

xsh2005105326
4楼-- · 2020-01-16 11:49

用光耦做AGC应该可行

加载中...

xsh2005105326
5楼-- · 2020-01-16 17:37

wxw123321 发表于 2012-5-19 23:19
这个得好好看看，我们现在的语音合成方案，声音不怎么好。

LZ的是语音识别喔

加载中...

wxw123321
6楼-- · 2020-01-16 21:03

对的，是看错了，不过这个也不容错过哈，业余学习一下

加载中...

1 2 3 4 5 6 7 8 下一页最后一页

一周热门更多>

相关问题

【东软载波ESF0654 PDS开发板活动】开箱
1 个回答

东软载波ESF0654 PDS开发板外部中断
1 个回答

东软载波ESF0654 PDS开发板高级控制定时器AD16C4T
1 个回答

用串口调试助手为什么只能在hex模式接收发送而在文本模式不行
9 个回答

触摸芯片SC02B/SC04B在地砖灯的设计方案
1 个回答

东软载波ESF0654 PDS开发板串口USART0代码分享
1 个回答

普通32位单片机使用linux的应用代码
5 个回答

东软载波ESF0654 PDS开发板AT24C04的调试
9 个回答

相关文章

51单片机与蓝牙模块连接
0个评论

51单片机的硬件结构
0个评论

基于51单片机的无线遥控器制作
0个评论

51单片机 AD转换
0个评论

51单片机数码管递增显示
0个评论

如何实现对单片机寄存器的访问
0个评论

基于51单片机的指纹密码锁
0个评论

采纳回答

向帮助了您的网友说句感谢的话吧!

非常感谢!