前言
CMVN在语音识别中的作用
noun 翻译
CMN:Cepstral Mean Normalisation,倒谱均值归一化;
CMVN:Cepstral Mean Variance Normalisation,倒谱均值方差归一化;
CMVN
CMVN与数据归一化相似,但CMVN的意义更偏向于对音频数据进行滤波,可提升识别精度。
在线的CMVN是基于滑动窗口进行的,会影响语音识别响应时间;feature norm是对所有训练数据进行统计,然后单帧计算
因CMVN占用识别响应时间,最新的端到端识别中未使用
CMVN详细原理可参考References中的论文[1]