越南语文语转换系统中的前端文本略论措施[越南语论文]

资料分类免费越南语论文 责任编辑:阮圆圆更新时间:2017-06-19
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

越南语文语转换系统中的前端文本略论措施The analysis method of the front end of the Vietnamese language transfer system

摘要:(摘要内容经过系统自动伪原创处理以避免复制,下载原文正常,越语专业论文越语论文范文,内容请直接查看目录。)

越南语是越南的官方说话,属南亚语系孟一高棉语族。越南语相似于汉语通俗话,也采取“声、韵、调”标志其音节。文本以开辟越南语文语转换(TTS)应用体系为目标,研究越南语文天职析办法,摸索进步分解语音天然度的门路。一个完全的TTS体系包含前端文天职析模块和后端语音分解模块。前端文天职析对进步分解语音的天然度、可懂度起相当主要的感化。文天职析触及文本归一化、分词、词性标注和韵律短语(L3)界限猜测等技巧。论文的重要任务包含:1.采取规矩加症结字的办法完成越南语文本归一化。经测试,文本归一化的精确率达97.2%。2.采取前后向最年夜婚配联合词频统计的办法完成越南语分词。经测试,分词的精确率、召回率和F-1值分离为:97.24%、91.35%和94.20%。3.采取N-gram说话模子建模,Viterbi解码的办法停止越南语词性标注。集表里测试精确率分离为82.42%和71.28%。4.采取C4.5算法树立越南语韵律短语界限决议计划树范型,运用剪枝后的决议计划树停止L3界限猜测。集表里测试的F-1值分离为60.73%和57.96%。以上文天职析的测试成果解释,本文所评论辩论的办法可以知足越南语语音分解体系的初步应用需求,并为进一步进步越南语TTS体系的机能奠基了基本。

Abstract:

Vietnamese is Vietnam's official language, is a Khmer language and Bangladesh in South asia. Vietnamese is similar to Chinese popular words, also take "sound, rhyme and tone" sign syllable. Text to open Vietnam text to speech (TTS) system with the target, study Vietnamese language analysis method, and explore the progress decompose the natural speech. A complete TTS system includes front-end and back-end module of text analytics speech decomposition module. The front-end text analytics on the progress of decomposition degree, natural speech intelligibility plays a very important role. Analysis of text text analytics touch normalization, segmentation and POS tagging and prosodic phrase boundaries (L3) guessing skills. An important task of this paper includes: 1 take to complete the word rules with the crux of the Vietnamese language normalization. After testing, the accuracy of text normalization was 97.2%. 2 to take the biggest joint before and after mating to complete the Vietnamese word frequency statistics. After testing, the accuracy of segmentation, recall rate and F-1 value was 97.24%, and 91.35% from 94.20%. Take 3 N-gram. Viterbi mold modeling, decoding way stop Vietnamese POS tagging. In table 82.42% the separation rate of accurate test and 71.28%. 4. Take the C4.5 algorithm to establish the Vietnamese prosodic phrase boundary decision tree paradigm, using the pruning of decision tree stop L3 limit speculation. Set and test F-1 value were 60.73% and 57.96%. The comment debate can satisfy the Vietnamese speech decomposition system preliminary application demand, and the functioning of the further progress of Vietnamese TTS system has laid the foundation for the above Wentian post analysis of test results of explaining.

目录:

摘要   3-4   Abstract   4   第一章 绪论   8-14       1.1 文语转换系统的基本原理   8-9       1.2 语音合成技术的发展   9-10       1.3 越南语简介   10       1.4 越南语语音合成近况   10-11       1.5 论文的探讨背景及作者的工作   11-13           1.5.1 论文的探讨背景   11-12           1.5.2 作者的主要工作   12-13       1.6 论文的组织结构   13-14   第二章 越南语文本归一化   14-23       2.1 文本归一化   14       2.2 非标准词与分类   14-17           2.2.1 非标准词   14-15           2.2.2 非标准词分类   15-17       2.3 非标准词归一化   17-20           2.3.1 非标准词识别   17-18           2.3.2 非标准词消歧   18-20           2.3.3 生成标准词   20       2.4 越南语文本归一化方案   20-21       2.5 实验   21       2.6 实验结果与略论   21-22       2.7 本章小结   22-23   第三章 越南语分词   23-31       3.1 分词技术   23-25           3.1.1 基于字符串匹配分词法   23-24           3.1.2 基于统计的分词法   24-25           3.1.3 基于知识理解的分词措施   25       3.2 分词主要技术难点   25-26           3.2.1 歧义检测与识别   25-26           3.2.2 未登录词识别   26       3.3 越南语分词方案   26-27       3.4 实验   27-29       3.5 实验结果与略论   29       3.6 本章小结   29-31   第四章 越南语词性标注   31-39       4.1 词性标注技术   31-32       4.2 N-GRAM模型   32-33       4.3 越南语语法模型训练   33-34       4.4 VITERBI算法   34-35       4.5 越南语词性标注方案   35-36       4.6 实验   36-37       4.7 实验结果和略论   37       4.8 本章小结   37-39   第五章 越南语韵律短语边界预测   39-49       5.1 韵律结构   39-43           5.1.1 停顿   39-40           5.1.2 韵律层级结构   40-41           5.1.3 韵律短语边界预测   41-43       5.2 C4.5决策树   43-44           5.2.1 CLS学习系统   43           5.2.2 ID3算法   43-44           5.2.3 C.45算法   44       5.3 越南语韵律短语预测方案   44-45       5.4 实验   45-47       5.5 实验结果与略论   47-48       5.6 本章小结   48-49   第六章 总结与展望   49-51   参考文献   51-54   致谢   54-55   参加的项目和的论文   55  

免费论文题目: