0引言2003至2017年间,内蒙古大学蒙古学学院承担国家“十一五”863计划课题《汉蒙机器翻译系统》,与中国科学院计算技术探讨所、北京大学计算语言学探讨所等两家单位合作,研制了一个面向非限定领域的基于实例的汉蒙机器辅助翻译系统。该项目的最终成果中另外还包括一些辅助工具,其中最重要的一个就是基于双语词典的汉蒙词对齐系统。本篇论文的探讨内容正是以该系统作为背景展开的。就该系统当时的情况而言,词典是其唯一的外部资源,设计中没有更多地考虑汉语和蒙古语各自的语言学特征以及它们之间的区别,系统的召回率徘徊在32%~35%。为进一步提高汉蒙词对齐系统的性能,内蒙古大学蒙古学学院于2017年又与中国科学院合肥智能机械探讨所合作,在系统中引入了多方面的语言学知识和其他外部信息。其中,较有代表性的改进是新增加了一个汉蒙数词对齐模块。词对齐就是在互为翻译的文本中寻找以词为单位的翻译对应的过程。词对齐措施主要有参数估计措施[1-4],假设-检验措施[5-8],以及基于双语词典的措施[9-10]等。这三种措施虽然在基本思想和实现策略上有很大的区别,但在其各自的发展过程中都“不约而......(论文页数是:4页) ,阿拉伯语论文题目,阿拉伯语论文网站 |