1引言语音合成是让计算机像人一样将要表达的信息以普通人可以听得懂的语音播放出来的技术。依据现有的语音合成探讨水平,可以解决并已得到运用的是从文字到语音的合成,即文语转换(Text-To-Speech,TTS)。一般认为,语音合成系统包括两个主要组成部分:文本略论模块(前端处理)、语音合成模块(后端处理),因此可以说TTS系统是语言学和声学有效结合的产物。近几年来,常用的语音合成的措施有基于大语料库的单元挑选合成和以基于隐马尔可夫模型(HMM)的语音合成为代表的统计参数语音合成。单元挑选合成的优势是合成语音的音质保持了原始发音人的音质,但也存在一些不足之处,例如,合成语音的音质有时不够稳定,语音库构建周期长、成本高,以及合成系统的可扩展性较差等。统计参数语音合成具有可训练的特性,其基本原理是基于一套自动化的流程,根据输入的语音数据进行训练,最后形成一个相应的合成系统。与大语料库单元挑选合成措施相比,统计参数语音合成的优势在于可以在短时间内、在基本不需要人工干预的情况下,能自动构建一个新的合成系统,以适应不同发音人、不同发音风格、甚至不同的语种[1]。现在的越......(论文页数是:5页) ,越南语毕业论文,越语毕业论文 |