0.引言命名实体识别是自然语言处理的基础性工作之一,也是难点之一。地名是1998年召开的MUC-7会议划分的7大类命名实体之一,地名实体的识别在自然语言处理中占有重要地位。目前,还没有对于越南语地名识别的专门探讨,也缺乏针对越南语地名识别所做的越南语地名语词特征探讨。本文拟通过考察大量真实文本,从语源、拼写、组词、用字等方面定量探讨越南语文本中地名的语词特征,以期为越南语地名的信息处理提供语言学支持。鉴于信息全球化带来的信息开放性和多元性,本文探讨的地名是越南语文本中包括越南地名和其他国家地名在内的所有地名,以下简称“越南语地名”。1.相关探讨从能够搜集到的资料看,对于越南语地名的探讨,主要在于语源(陆利军,2017;陈继华,2017)、翻译(丛国胜,2004;陈继华,2017)和文化(Nguy n KiênTr ng,1997;华林甫,2001)等方面。越南语的自然语言处理(NLP)探讨起步较晚,成果不多。已有的相关探讨(主要是越南自然语言处理界)均将地名识别纳入越南语命名实体一体化识别的探讨工作中。其中,基于统计机器学习的探讨有:Thao PhamT.......(论文页数是:6页) [继续阅读本文] ,越语论文范文,越语毕业论文 |