0引言命名实体是文本中最基本的信息单元,是正确理解文本内容的核心要素。自然语言处理[1]技术中,命名实体的识别[2]一直是很重要的基础工作,其目的是对文本中出现的专有名称实体和有意义的时间、数量短语进行有效的识别和归类处理。因此有关命名实体的识别措施一直是国内外探讨机构的探讨热点[2-5]。现有很多实体识别措施都是通过统计机器学习措施进行建模和识别,在汉语的命名实体识别方面,McCallum A等提出了基于条件随机场的汉语命名实体识别措施[6],Lu P提出了基于层叠条件随机场的汉语命名实体识别措施[7],这些措施在汉语的命名实体识别上取得了很好的效果。汉越双语的信息处理探讨工作,随着两国日益频繁的交流而显得越来越重要,目前还未见相关的探讨报道。由于条件随机场措施没有严格的独立性假设,可以方便地融入各种对提取实体有利的特征,而且越南语与汉语在词的构成及句法方面具有很大相关性,因此本文基于条件随机场算法探讨提出了识别越南语命名实体的措施。该措施关于汉越双语的自然语言的进一步处理有着很重要的技术意义。1基于条件随机场的越南语命名实体识别1.1特征模板定义越南语......(论文页数是:4页) ,越南语论文题目,越语论文 |