【摘要】:
本文是面向语言工程的,主要阐述汉语越南语机器翻译实验系统HanViet 0.1的理论基础和实现过程。据我们所知,这是第一个汉越机器翻译系统。
本文一共分为5章。
第1章简要回顾了中国和越南机器翻译的历史和近况,阐述我们开发汉越机器翻译系统的必要性、可行性和优势,最后给出了系统的构建准则。
第2章阐述系统的总体构架及机器翻译的流程。
第3章详细讨论翻译引擎的各个模块。翻译引擎包括3大部分:略论、转换、生成。其中略论部分由汉语词法略论模块、汉语句法略论模块组成,转换部分由汉越句法转换模块、汉越词法转换模块组成,生成部分由越语句法生成模块、越语词法生成模块组成。
第4章讨论系统各部分目前存在的问题及可能的解决办法,并指出语义略论和面向对象编程范式是下一步的主要努力方向。
第5章是对我们开发机器翻译实验系统的一个小结。
机器翻译系统的设计与实现是一项浩大的工程,它必须通过最低限度的开发成本来实现,否则将一事无成(Jurafsky2000)。因时间、资源及学识所限,HanViet 0.1所采用的措施未必是最理想的。因而本文虽主要研讨HanViet 0.1的理论和实现,但也涉及了相当多的那些可能更好但因条件所限而没有采用的措施,以及对该系统的进一步改进方案。
【关键词】:
第1章 导论12-22 1.1 程序运行界面12-13 1.2 机器翻译的本质13-15 1.3 世界上第一个与越南语有关的机器翻译系统15-16 1.4 中国和越南机器翻译的历史和近况16-19 1.5 汉越机器翻译的必要性及可行性19-20 1.6 系统构建的基本准则20-22 第2章 机译系统构架22-33 2.1 机译系统总体构架22-23 2.2 知识库23 2.3 翻译引擎23-27 2.3.1 翻译引擎流程23-25 2.3.2 翻译引擎工作实例25-27 2.4 人机界面27 2.5 VC 实现27-33 2.5.1 知识库27-28 2.5.2 界面28-33 2.5.2.1 MFC28-31 2.5.2.2 越南语字符集、UNICODE 及其编程31-33 第3章 翻译引擎各模块详解33-51 3.1 略论部分33-43 3.1.1 汉语词法略论模块33-34 3.1.2 汉语句法略论模块34-43 3.1.2.1 概率结构上下文相关句法34-38 3.1.2.1.1 CFG 及PCFG34-37 3.1.2.1.2 PRORD-PCFG37-38 3.1.2.2 角色反演算法38-43 3.1.2.2.1 Chart 算法39-40 3.1.2.2.2 角色反演算法40-43 3.2 转换部分43-49 3.2.1 汉越句法转换模块43-49 3.2.1.1 定中短语与状中短语的转换45-49 3.2.2 汉越词法转换模块49 3.3 生成部分49-51 3.3.1 越语句法生成模块50 3.3.2 越语词法生成模块50-51 第4章 进一步的工作51-59 4.1 略论部分的问题51-52 4.1.1 词法略论模块的问题51-52 4.1.2 句法略论模块的问题52 4.2 转换部分的问题52-55 4.2.1 句法转换模块的问题52-54 4.2.2 词法转换模块的问题54-55 4.3 生成部分的问题55 4.4 展望55-59 4.4.1 语言层级的提升57-58 4.4.2 面向对象编程范式58-59 第5章 结论59-61 参考资料61-65 附录 HanViet 0.1 形式句法各要素65-72 ,越语论文,越语论文网站 |