到稿日期:2017-03-20返修日期:2017-06-17本文受国家自然科学基金:面向互联网的泰语-汉语双语语料获取及对齐措施探讨1引言音节切分是语音合成、语音识别的基础。在音节特性显著的语言中,语音识别通常选择音节作为识别的基本单元[1],泰语语音识别中也广泛使用了音节信息[2]。在语音合成(TTS)中,音节特征显著的语言也选择音节作为合成的基本单元[3]。音节切分可以作为词法略论的特征来辅助词法略论,提高词法略论的准确率。泰语属于音位文字类型,主要由元音字母、辅音字母和声调符号组成,是音节特征显著的语言。泰语词汇由音节构成,包括单音节词、双音节词和多音节词。泰国本土泰语的基本词汇中很大一部分是单音节词。音节一般由元音(V)字母、辅音(C)字母和声调(T)3部分组成;但由于第一声调没有声调标识符,所以有的音节只由一个辅音(C)字母和一个元音(V)字母构成,一般构成形式为CTV、CCTV、CVCT、CCVCT等,如泰语句子(我们得到老师的帮助。)泰语中除缩写词中使用“.”和部分对话句子中可能用“?、!”标点外,句子之间都使用空格作为分割符。若使用“-”作......(论文页数是:4页) ,泰语论文范文,泰语毕业论文 |