基于跨语言语料的汉泰词分布表示[泰语论文]-外语论文网

【摘要】：词汇的表示问题是自然语言处理的基础探讨内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的运用效果,然而在跨语言词汇的分布表示上国内外探讨很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示运用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。

【作者单位】：昆明理工大学信息工程与自动化学院;昆明理工大学智能信息处理重点实验室;昆明理工大学理学院;
【关键词】：
【基金】：
【分类号】：TP391.1
【引言】：

1引言词汇表征问题是自然语言处理的重要内容,是信息检索、数据挖掘、知识图谱构建等探讨方向的重要技术支持。基于统计机器学习的词汇表征措施的目标是从自然语言文本中学习出词序列的概率表示函数,其面临的一个困难在于词向量的维度灾难与数据稀疏问题[1],在训练的过程中每

，泰语论文，泰语论文题目

泰国学生学习汉语的辅音偏误略论及教学	泰语熟语：欲速则不达	汉泰语“红”、“白”、“蓝”颜色词构
泰语词汇语法ติด“贴”，“上瘾”范	泰国华人社团史探讨	泰国旅游有“三忌”
日轻在泰国建室内全铝空调器热交换器	外国游客对泰国旅游业作用的实证探讨	湖南中泰研发高强高模聚乙烯纤维
泰国商务部下调油棕果指导价	泰国大学生汉语学习动机调查与略论	试析广西讲壮话的学生学习泰语的优势和
让心情好起来的五种食物	谨防“山寨”版泰国香米	泰国特色商品专卖店