摘要 3-4 ABSTRACT 4 第1章 绪论 9-17 1.1 探讨背景 9-10 1.2 国内外探讨情况和发展趋势 10-12 1.2.1 输入法国内外的探讨情况 10-11 1.2.2 搭配国内外的探讨情况 11-12 1.2.3 存在的主要问题 12 1.3 论文的目的和意义 12-15 1.3.1 汉字语法语义智能输入法的整体方案设计 12-15 1.3.2 本课题探讨结果在汉字语法语义智能输入法中的运用 15 1.4 本文的探讨工作 15-17 第2章 建立搭配知识库理论基础介绍 17-24 2.1 统计语言学介绍 17 2.2 统计语言学措施 17-21 2.2.1 频率计数 18 2.2.2 平均值和方差 18-19 2.2.3 互信息 19-20 2.2.4 假设检验 20-21 2.2.5 最大似然估计 21 2.2.6 统计措施的优缺点略论 21 2.4 语料库介绍 21-23 2.5 同义词词林 23-24 2.5.1 同义词词林简介 23 2.5.2 同义词词林的运用 23-24 第3章 搭配库的结构设计和统计模型 24-31 3.1 有关概念 24-25 3.2 两词语搭配库的结构设计 25-26 3.3 三词语搭配库的结构设计 26-27 3.4 语法搭配知识库结构 27 3.5 语义搭配知识库结构设计 27 3.6 搭配知识库实现统计模型 27-31 3.6.1 搭配强度 27-28 3.6.2 搭配离散度 28-29 3.6.3 尖峰值 29 3.6.4 隐马尔可夫模型(HMM) 29-31 第4章 搭配知识库探讨方案 31-42 4.1 探讨方案 31-39 4.1.1 词语基本频度表的建立 31-32 4.1.2 两词语候选搭配对的抽取及统计值准备 32-35 4.1.3 两词语候选搭配对的筛选 35 4.1.4 三词语候选搭配对的抽取及统计值准备 35 4.1.5 三词语候选搭配对的筛选 35 4.1.6 建立抽象语法搭配规则知识库 35-36 4.1.7 语法搭配实例的自动抽取 36-37 4.1.8 语义知识的编码 37-39 4.1.9 语义搭配的统计 39 4.2 评价措施 39-42 4.2.1 正确率和召回率 40 4.2.2 两个指标的物理意义 40-41 4.2.3 两个指标的关系 41-42 第5章 软件实现搭配库的关键技术和主要算法 42-52 5.1 软件实现搭配库的主要技术 42 5.1.1 Microsoft Visual Studio.NET 42 5.1.2 SQL Server 42 5.2 词语基本频度表算法 42-44 5.3 候选搭配词语统计算法 44-46 5.4 搭配词语判定算法 46-49 5.5 尖峰值判断算法 49-50 5.6 具体语法搭配实例自动抽取算法 50-51 5.7 义类代码标注算法 51-52 第6章 实验结果示例 52-56 6.1 语料来源及加工层次 52 6.2 词语基本频度表建立实验结果示例 52-53 6.3 两词语搭配知识库建立实验结果示例 53-54 6.4 具体语法搭配知识库实验结果示例 54 6.5 语义搭配知识库实验结果示例 54-55 6.6 三词语搭配知识库实验结果 55-56 总结与展望 56-58 致谢 58-59 参考文献 59-63 附录1 语料库样例 63-64 附录2 符号代码说明 64-65 攻读硕士学位期间的论文及科研成果 65 |