宽窄带语谱图融合分带投影的特定人汉语词汇识别
发布时间:2017-08-03 18:01
本文关键词:宽窄带语谱图融合分带投影的特定人汉语词汇识别
更多相关文章: 语音识别 语谱图 特征融合 行投影 列投影 支持向量机(SVM)
【摘要】:提出一种基于宽窄带语谱图融合分带投影的方法对特定人二字汉语词汇进行识别。该方法将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对窄带语谱图进行等宽度分带行投影和二进宽度分带行投影,并将其分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将窄带语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。然后对宽带语谱图进行等宽度分带列投影,作为第4个特征集合。将上述特征集合作为识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,采用前3个特征集合的特征向量对特定人二字汉语词汇识别的正确识别率可达92.4%,采用第4个特征集合的特征值对特定人二字词汇识别的正确识别率可达80%,而采用上述4个特征集合的特征值融合对特定人二字汉语词汇识别的正确识别率可达95.4%。该特征融合的方法为汉语词汇的识别提供了新的思路。
【作者单位】: 东北师范大学物理学院;长春理工大学理学院;北京理工大学光电成像技术与系统教育部重点实验室;
【关键词】: 语音识别 语谱图 特征融合 行投影 列投影 支持向量机(SVM)
【基金】:国家自然科学基金项目(61471111)资助
【分类号】:TP391.41;TN912.34
【正文快照】: 本文受国家自然科学基金项目(61471111)资助。1前言语音信号是一种非平稳随机信号,考虑到人类发音器官在发声过程中的变化速度具有一定的限度,可以认为语音信号是短时平稳的,即在10~30ms的时间段内可以应用平稳随机过程的分析方法。然而,汉语语音清辅音多,开口呼出的音节占全,
本文编号:615591
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/615591.html