【摘要】:文本情感略论采用计算语言学的措施,可以对带有情感色彩的主观性文本进行略论、处理、归纳和推理。区别于现有类别型措施,维度型措施可以提供更为细致的情感信息。但目前面向中文的维度型情感略论措施仍然面临着诸如文化异同,缺少维度型情感词典和语料资源,现有情感词典的覆盖性差及情感略论准确度低等多个问题,设计可靠的中文维度型文本情感略论运用仍然是一项具有挑战的工作。针对这些问题,本文基于Valence-Arousal空间,探讨词汇层次和文本层次的中文文本情感略论技术,主要内容包括以下三个方面。(1)针对跨语言的词汇情感标记,本文提出一种局部加权法,改进了线性回归模型,该措施对预测目标词汇周围的训练种子词汇进行加权,并降低其他无关噪音词汇的权重,解决了线性回归模型中的欠拟合问题。实验结果表明,基于局部加权线性回归措施获得了最小的预测误差及最佳的相关系数。(2)针对同语言的词汇VA值预测,本文提出一种基于社区的加权图模型,该模型使用社区发现机制进行邻接词汇的选取,并利用加权图模型改进了PageRank算法,解决了预测过程中的噪音词汇问题。实验结果显示,所提出的措施有效地减少邻接词汇中的噪音词汇数量,提高预测的效果。(3)针对文本层次的情感略论,本文提出了一种基于区域划分的深度神经网络模型。通过区域划分,模型利用卷积神经网络提取各区域中可用的情感信息,并使用长短期记忆模型进行区域间语言逻辑的序列整合,最终用于文本的VA值预测,解决了现有维度型情感略论准确度低的问题。对比实验结果表明该模型的准确度优于现有维度型略论措施和其他神经网络模型。
【关键词】:情感计算 文本情感略论 维度型情感略论 局部加权线性回归 卷积神经网络
摘要3-4 Abstract4-9 第一章 绪论9-21 1.1 连续维度型文本情感略论9-11 1.2 文本情感略论的层次划分11-14 1.3 探讨近况及存在问题14-17 1.4 论文的主要探讨内容17-19 1.5 论文的结构安排19-21 第二章 文本情感略论的相关工作21-43 2.1 针对词汇的Valence-Arousal情感值标记措施探讨21-25 2.1.1 自我评定模型21-23 2.1.2 基于回归模型的情感词汇标记措施23-25 2.1.3 基于图模型的情感词汇标记措施25 2.2 针对文本的Valence-Arousal情感略论探讨25-27 2.2.1 基于情感词典的文本情感略论措施26-27 2.2.2 基于回归模型的文本情感略论措施27 2.3 语义嵌入技术27-31 2.3.1 词嵌入技术28-30 2.3.2 句嵌入技术30-31 2.4 面向离散类别型文本情感略论的深度神经网络算法31-36 2.4.1 多层感知器31-32 2.4.2 卷积神经网络32-34 2.4.3 递归神经网络34-35 2.4.4 长短期记忆35-36 2.5 语料资源36-43 2.5.1 语料库与情感词典36-38 2.5.2 中文情感词汇和中文情感文本语料库38-43 第三章 基于局部加权线性回归的跨语言词汇情感标记措施43-57 3.1 探讨动机43-44 3.2 局部加权线性回归模型44-48 3.2.1 特征选取45-46 3.2.2 模型设计46-48 3.3 实验评估48-55 3.3.1 实验语料库48-49 3.3.2 数值评价指标49-50 3.3.3 参数选取50-51 3.3.4 对比实验结果51-55 3.3.5 实例略论55 3.4 本章小结55-57 第四章 基于社区加权图模型的同语种词汇情感标记措施57-77 4.1 探讨动机57-60 4.2 基于社区聚类的加权图模型60-66 4.2.1 语义相似度计算60 4.2.2 加权图模型60-63 4.2.3 基于社区聚类的邻接词汇选取63-66 4.3 实验评估66-74 4.3.1 实验语料库66 4.3.2 数值评价指标66 4.3.3 加权图模型的评估实验66-69 4.3.4 邻接词汇选取的对比实验69-74 4.4 本章小结74-77 第五章 基于区域划分CNN-LSTM模型的文本情感略论措施77-89 5.1 探讨动机77-79 5.2 基于区域划分CNN-LSTM模型79-82 5.2.1 卷积层79-80 5.2.2 最大池化层80 5.2.3 序列整合层80-81 5.2.4 线性解码器81-82 5.3 实验评估82-88 5.3.1 实验语料库82-83 5.3.2 数值评价指标83 5.3.3 实验措施83-85 5.3.4 对比实验结果85-88 5.4 本章小结88-89 第六章 总结89-93 6.1 论文的主要工作及贡献89-90 6.2 今后的探讨工作90-93 参考文献93-103 攻读学位期间完成的科研成果103-105 ,西班牙语论文,西语论文范文 |