修回日期:2017-10-13随着世界经济文化的融合,大量的外来词纷纷涌现到本土文化中,这些外来词多为命名实体:人名、地名和机构名等。外来词只有部分可以直接使用,大部分都需要进行翻译。翻译外来词的措施主要有两种:意译和音译。意译是根据词语的意思把词语从一种语言翻译到另一种语言,而音译是根据其发音来翻译的。例如“Penicillin”,翻译为“青霉素”是意译措施,翻译为“盘尼西林”是音译措施。由于命名实体是一个开放集,很难在词典中来获得相应翻译,因此主要使用音译措施来翻译。命名实体的音译在机器翻译、跨语言信息检索、多语言命名实体对抽取、平行语料库对齐等自然语言处理领域占据重要地位。根据音译措施的不同,音译被分为基于语音(phoneme-based)的音译和基于字形(grapheme-based)的音译[1]。基于语音的音译需要3个转换步骤:首先将源语言词语转换成其发音符号(音素),然后再转换为目标语言的近似音素,最后再转换成目标词语。基于语音的音译需要通过机器学习来获取转换规则,转换过程中信息容易丢失,并且多个步骤错误的累加会作用整个音译的准确率。基于字形的......(论文页数是:4页) ,越南语毕业论文,越语论文网站 |