【摘要】:语音合成就是使用专用的硬件设备或计算机再现人能够听得懂的语音信号的过程。语音合成技术是实现人机语音通信,建立一个有听说能力的口语系统所必需的关键技术之一。纵观语音合成技术的探讨已有二百多年的历史,但是真正具有实用意义的近代语音合成技术是随着计算机技术以及数字信号处理技术的发展而逐渐发展起来的。
近几十年来语音合成的措施主要有:发音器官参数合成法、源-滤波器模型合成法、单元挑选合成法和可训练语音合成法等等。这几种措施各有优缺点,但是相比较而言,可训练语音合成技术的自动化程度较高,关于不同发音人、不同发音风格、甚至不同语种的依赖性非常小。基于这些特点,本文选用了基于隐马尔可夫模型(HMM)的可训练语音合成措施来进行合成系统的构建。
越南位于东南亚中南半岛东部,与中国云南交界,由此带来了两地语言文化及相关人才的频繁交流,以及探讨越南语语音新技术的区域优势。所以本文探讨了越南语语音合成系统,并希望最终能把探讨成果应用到实际中,实现越南语的人机交互。论文的主要工作包括:
(1)阐述HMM的基本原理,介绍基于HMM的可训练语音合成系统架构过程。
(2)介绍越南语的语音特征、综述越南语语音合成近况,在此基础上进行越南语语音合成系统的数据准备工作。数据准备工作主要包括:语料库构建、音素列表确定、训练数据的标注以及上下文属性和问题集设计。其中最重要的一部分工作就是对训练数据进行标注。本论文中我们采用手工与程序相结合的方式进行语料库标注。
(3)在Cygwin平台,根据STRAIGHT合成器的训练流程,用500句已标注的语句完成越南语语音合成系统的模型训练,以及后端合成器的构建。在对待合成语句进行韵律标注后,用合成器生成其语音波形。
实验结果表明:利用STRAIGHT合成器进行越南语语音合成是可行的。后续工作重点应为实现越南语文本的自动略论,以及提高合成语音的自然度。
【关键词】:语音合成 越南语 隐马尔可夫模型 可训练语音合成 STRAIGHT合成器
摘要3-5 Abstract5-9 第1章 绪论9-15 1.1 引言9-10 1.2 语音合成技术的进展10-13 1.2.1 发音器官参数语音合成10-11 1.2.2 源-滤波器模型语音合成11 1.2.3 单元挑选语音合成11-12 1.2.4 可训练语音合成12-13 1.3 论文的探讨思路13 1.4 作者的工作13-14 1.5 论文的组织14-15 第2章 基于HMM的可训练语音合成15-22 2.1 HMM简介15-17 2.2 基于HMM的可训练语音合成系统架构17-18 2.3 可训练语音合成系统优劣势略论18-20 2.4 STRAIGHT合成器20-22 第3章 越南语语音合成数据准备22-34 3.1 越南语语音合成概述22-24 3.1.1 越南语概述22-24 3.1.2 越南语语音合成近况24 3.2 语料库构建24-25 3.3 音素列表确定25-26 3.4 标注26-32 3.5 上下文属性和问题集设计32-34 第4章 越南语语音合成器的构建34-46 4.1 模型训练构建34-40 4.1.1 参数配置34-35 4.1.2 训练流程35-40 4.2 后端合成构建40-42 4.3 实验结果与讨论42-46 4.3.1 实验结果42-43 4.3.2 讨论43-46 第5章 总结和展望46-48 5.1 总结46 5.2 展望46-48 参考文献48-51 致谢51-52 在读探讨生期间参加项目和论文情况52 ,越南语论文,越语毕业论文 |