%0 Journal Article %A 张岩 %A 艾斯卡尔·艾木都拉 %A 米吉提·阿不里米提 %T 基于不同单元的端到端语音识别 %D %R %J 中文信息学报 %P 166-172 %V 38 %N 1 %X 端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序分类(CTC)的基础上,实现维吾尔语不同粒度的端到端的语音识别系统,且在较少的语料库(THUYG公开语料库)上将该方法和传统的HMM语音识别框架进行比较。单音素基础上端到端方法的表现超过传统HMM-GMM框架,CER下降10.6%,而且经过稍微减少冗余后的以单字符作为建模单元的端到端语音识别系统对比基于三音素的HMM-GMM系统CER下降2.23%。对于资源匮乏语言,粒度单元的优化方法将是提高性能的下一个研究目标。 %U http://jcip.cipsc.org.cn/CN/abstract/article_3674.shtml
Baidu
map