开源的语音识别的STM32程序,作者宋健.

2020-01-04 19:01发布

新年想搞点好玩的,看到这个,F103做的,不知道效果如何,作者描述很详细,给的资料也很足,包括Matlab。

http://gk969.com/stm32-speech-recognition/
https://github.com/gk969/stm32-speech-recognition
摘要:语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器。本设计研究孤立词语音识别系统及其在STM32嵌入式平台上的实现。识别流程是:预滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。端点检测(VAD)采用短时幅度和短时过零率相结合。检测出有效语音后,根据人耳听觉感知特性,计算每帧语音的Mel频率倒谱系数(MFCC)。然后采用动态时间弯折(DTW)算法与特征模板相匹配,最终输出识别结果。先用Matlab对上述算法进行仿真,经多次试验得出算法中所需各系数的最优值。然后将算法移植到STM32嵌入式平台,移植过程中根据嵌入式平台存储空间相对较小、计算能力也相对较弱的实际情况,对算法进行优化。最终设计并制作出基于STM32的孤立词语音识别系统。

源码。
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
99条回答
codefish
1楼-- · 2020-01-05 13:36
好东西,谢谢分享!
xinmulan
2楼-- · 2020-01-05 19:06
楼主实际测试过没有呢。我以前搞过这样的(DTW),感觉效果不理想哦
FORDREAM0
3楼-- · 2020-01-05 21:23
 精彩回答 2  元偷偷看……
gmyu
4楼-- · 2020-01-06 01:56
xinmulan 发表于 2016-1-3 17:14
楼主实际测试过没有呢。我以前搞过这样的(DTW),感觉效果不理想哦

没有测试过,这个我无法评论,只是转过来。

里面的一些东西可以借鉴,比如滤波加窗,端点检测,底噪和预加重处理等等。

感觉采样2秒有点长,平时说话一个字不过0.5秒,这样data就只有4K*2,用更便宜的103C8就能实现了。
li99932li
5楼-- · 2020-01-06 05:26
记号,准备上语音项目
hpy168888
6楼-- · 2020-01-06 06:53
好用么

一周热门 更多>