摘要 5-7 Abstract 7-8 图表目录 11-12 第一章 绪论 12-28 1.1 探讨背景及意义 12-13 1.2 文本分类探讨综述 13-15 1.3 多语言检索系统探讨综述 15-26 1.3.1 多语言检索系统探讨面临的问题 16 1.3.2 多语言检索系统设计的整体思路和实践 16-18 1.3.3 多语辞典与多语检索 18-19 1.3.4 语料库与多语言检索 19-20 1.3.5 本体与多语言检索 20-21 1.3.6 机器翻译与多语言检索 21-25 1.3.7 多语言检索的其他思路 25-26 1.4 本文解决的问题及创新点 26-27 1.4.1 论文解决的问题 26-27 1.4.2 论文创新点 27 1.5 论文组织结构 27-28 第二章 语言识别程序的理论和实践基础 28-34 2.1 N-Gram理论 28-32 2.1.1 理论阐述 28 2.1.2 国内外探讨概况 28-30 2.1.3 相关运用 30-32 2.2 语言识别工具调研 32-34 第三章 多语言识别实验 34-46 3.1 系统核心权重算法及重要参数设计 34 3.2 实验概述 34-35 3.3 实验样本来源 35 3.4 实验文本获取 35-37 3.5 测试用例设计 37-38 3.5.1 语言识别功能测试 37-38 3.5.2 编码问题处理功能测试 38 3.6 实验结果及略论 38-44 3.6.1 实验结果评价指标 38-39 3.6.2 语言识别功能测试结果 39-42 3.6.3 日文编码识别功能测试结果 42-44 3.7 实验结论 44-46 第四章 借助语言识别技术实现Lucene多语言检索接口 46-59 4.1 Lucene索引及搜索架构 46-50 4.1.1 Lucene索引架构及核心代码剖析 46-48 4.1.2 Lucene搜索架构及核心代码剖析 48-50 4.2 Lucene与多语言检索 50-56 4.2.1 Lucene多语言检索探讨近况 50-54 4.2.2 Lucene内建Analyzer类略论 54-56 4.2.3 Lucene多语言检索面临的问题 56 4.3 多语言识别技术在Lucene中的运用 56-59 4.3.1 多语言识别模块与Lucene架构的衔接 56-58 4.3.2 多语言识别与索引构建 58 4.3.3 多语言识别与搜索 58-59 第五章 总结与展望 59-61 5.1 本文所作工作回顾 59 5.2 不足之处及展望 59-61 参考文献 61-67 附录 科研成果与学术活动 67-68 致谢 68-69 |