【摘要】:伴随着科学技术的不断发展,目前已经将机器人应用到了生产生活中的各个方面,从而使其替代人类进行繁琐和高危的的任务,使得人们生活质量得到不断的提高。而语音识别作为人机交互技术的重要环节,越来越受到探讨者的关注[1]。目前对越南语语音识别方面的探讨主要集中在声学模型、语言模型等关键技术上。但在不同的领域当中,无论是声学层面还是语言层面,不同的领域术语之间都存在着明显的异同性,导致这些通用领域的语音识别措施很难直接适用于特定领域。本文就是针对越南语旅游领域问句语音识别系统构建措施的探讨。主要研讨了基于领域术语声学特性的声学模型构建措施和融入领域知识的语言模型构建措施。本文的主要工作包括以下几个部分:(1)探讨了针对越南语旅游领域问句的声学模型构建措施。该措施首先确定了以音素作为识别基元,从而使得所构建的声学模型规模适中。然后对语音语料库中音素的上下文分布情况进行了略论和统计,确定了构建三音素声学模型来解决越南语协同发音的问题。接着,建立了基于音素发音特性的决策树问题集,采用决策树状态共享策略对声学模型的训练过程进行优化,从而解决了数据稀疏的问题。最后,通过对比试验,验证了基于决策树状态共享的三音素声学模型构建措施的有效性。(2)探讨了针对越南语旅游领域问句的语言模型构建措施。该措施首先确定了适合于旅游领域问句语音识别的语言模型类别。然后,根据旅游领域问句中询问对象的不同对问句形式进行了划分。其次,对越南语问句所需要遵循的语法规则进行了总结。接着,基于这些语法规则对不同形式的问句结构进行了统计,确定了语言模型中的具体描述内容,从而构建了适合于旅游领域问句识别的规则语言模型。(3)通过实验,采用不同的评价指标对旅游领域问句语音识别系统的性能进行了略论与总结,验证了此措施的有效性。
【关键词】:越南语 旅游领域 问句 语音识别
摘要5-6 Abstract6-11 第一章 绪论11-15 1.1 探讨背景及意义11-12 1.2 国内外探讨近况12-14 1.3 本文探讨内容及结构安排14-15 1.3.1 探讨内容14 1.3.2 论文结构安排14-15 第二章 语音识别基础理论15-21 2.1 语音识别的系统结构15 2.2 语音识别系统的分类15-16 2.3 语音识别中的关键技术16-19 2.3.1 预处理16-18 2.3.2 特征提取18 2.3.3 声学模型18-19 2.3.4 语言模型19 2.3.5 模式匹配19 2.4 本章小结19-21 第三章 越南语旅游领域问句语料库的构建21-25 3.1 越南语旅游领域问句文本语料库21-22 3.1.1 越南语旅游领域术语问句词典构建21-22 3.1.2 越南语旅游领域问句文本语料库的构建22 3.2 旅游领域问句语音语料库的构建22-23 3.2.1 录制环境与设备22-23 3.2.2 录音人员安排23 3.3 本章小结23-25 第四章 越南语旅游领域问句的声学模型构建措施25-39 4.1 引言25 4.2 适合旅游领域问句的识别基元选择与略论25-27 4.2.1 识别基元的选择25-26 4.2.2 越南语旅游领域问句的声学特性略论与处理26-27 4.3 旅游领域问句上下文相关联的三音子模型构建27-34 4.3.1 上下文相关联的三音子模型27-28 4.3.2 旅游领域问句中的三音子略论28-29 4.3.3 状态共享策略的略论与选择29-31 4.3.4 融入领域术语声学特性构建音子类别集31-33 4.3.5 决策树的构建33-34 4.4 实验结果与略论34-36 4.4.1 实验环境34-35 4.4.2 实验设置35 4.4.3 高斯混合模型混合分量数目选择实验35-36 4.4.4 对比实验36 4.5 本章小结36-39 第五章 越南语旅游领域问句的语言模型构建措施39-45 5.1 引言39 5.2 基于规则的语言模型39-40 5.3 越南语旅游领域问句特点略论40-41 5.3.1 询问地点的特指问句略论40-41 5.3.2 询问事物的特指问句略论41 5.4 基于领域术语知识构建规则语言模型41-44 5.5 本章小结44-45 第六章 识别实验与结果略论45-53 6.1 实验环境45-49 6.1.1 HTK工具包介绍45-46 6.1.2 越南语旅游领域问句语音识别系统的构建46-49 6.2 识别结果的评价标准49-51 6.3 实验结果及略论51-52 6.4 越南语旅游领域问句语音识别系统识别结果略论52 6.5 本章小结52-53 第七章 结论与展望53-55 7.1 结论53 7.2 展望53-55 致谢55-57 参考文献57-61 附录A 期间探讨成果61-63 附录B 期间所参与项目63 ,越南语论文,越语论文题目 |