DSP

MFCC整理

2019-07-13 17:37发布

问题:
1.为什么MFCC是声纹特征参数
2.MFCC是怎么提取的,步骤
3.基于Mel刻度的三角滤波器组滤波的目地是什么?

1.为什么说MFCC是声纹特征参数
   首先要理解声音是怎么传出的,人耳又是怎么获取识别的。激励源经过声道的振动(相当于滤波器组)后传出后被人耳所接收进行分析。
   人耳耳蜗可以听取识别不同频率和强弱的声音,声波通过介质传入内耳,当橙骨足板推动前庭窗运动后,耳蜗内的液体也会运动,导致基底膜发生位移,其上外毛细胞弯曲,底部的神经末梢产生神经冲动,传到大脑我们就听到了声音。耳蜗常被认为是一组带通滤波器组,能将不同频率映射到基底膜的不同位置,基底膜每一个位置都对应一个特征频率,将这个频率的纯音信号传入时,该位置会发生最大幅度的振动。
   MFCC是指Mel频率倒谱系数,Mel频率正是基于人耳耳蜗和基底膜的特性提出来的,与实际频率成非线性对应关系。在Mel频率的基础上进行滤波和倒谱分析,提取语音信号的频谱的包络信息,也就是反应声道和声门的信息。因为人体构造独特性的关系,所以我们将提取出来的信息作为特征值来标明人体身份。
2.MFCC是怎么提取的,步骤 声学特征(二) MFCC特征原理 - xmdxcsj的专栏 - 博客频道 - CSDN.NET 语音特征参数MFCC计算的详细过程 - xiaoding133的专栏【Stay hungry,Stay foolish】 - 博客频道 - CSDN.NET Mel倒谱系数 - 北海石松 - 博客园 3.基于Mel刻度的三角滤波器组滤波的目地是什么?   首先滤波是因为频域信号有很多冗余,滤波器组可以对频域的幅值进行精简,每个频段用一个值来表示。用Mel刻度的原因在于,Mel刻度滤波器组在低频部分的分辨率高,跟人耳的特性相符。这一步的含义在于,对时域信号进行傅里叶变换转到频域,然后再利用Mel频率刻度的滤波器组对应频域信号进行切分,最后每个频率段对应一个数值。

热门文章