【摘要】:脱机手写体文字识别技术无论是在科学探讨还是日常生活中,都具有重要的理论意义和广泛的运用前景,它涉及到模式识别领域中的许多经典问题,如特征提取、分类器设计以及样本集的选择等等。文字识别问题的探讨通常分为印刷体文字识别和手写体文字识别,关于手写体文字识别又可细分为脱机手写体文字识别和联机手写体文字识别。从文字识别的难易程度来看,脱机手写体文字识别技术比联机手写体文字识别要复杂和困难的多,而相对来说印刷体文字的识别要比手写体文字识别轻松容易的。并且相关于脱机手写体文字识别技术,印刷体文字识别技术的探讨和运用已近非常成熟,无论是在汉字识别还是其它语言文字的识别方面,都有相对成熟的运用产品。而脱机手写体文字的识别如今只是在阿拉伯数字的识别方面取的较好的成绩,汉字和阿拉伯文字的脱机手写体识别的效果还不尽人意,需要继续探究和提高。脱机手写体文字识别的探讨使得文字信息处理的自动化以及进一步提升计算机智能输入提供重要的理论意义及广阔的运用前景。
由于阿拉伯手写字符具有它独有的特性,识别起来不能完全照搬现有的手写字符识别措施,它有着自身的特点和难点,导致现在越来越多的探讨机构投入到脱机手写体阿拉伯文字识别这项探讨中来。国内外科技工作者已对该领域从不同的角度进行了广泛的探讨,并且取得了许多阶段性的探讨成果,但由于阿拉伯本身的形状和手写产生的变形,同时现有的脱机阿拉伯手写字符识别系统的识别率及对测试数据集的有选择性等都有待改善,其效果与实际需要还有很大的距离。到目前为止,脱机阿拉伯手写字符识别还没有商用的产品问世。
本文首先对脱机手写字符识别过程中的关键技术进行相关探讨,评估了现有的相关算法,分别从预处理、特征提取和分类器设计等识别的主要方面进行相关探讨。并对隐马尔科夫模型在文字识别领域的运用进行了详细的略论和探讨。
然后提出一种基于高斯混合的半连续隐马尔科夫模型的脱机阿拉伯手写识别措施。该措施采用滑动窗口技术直接从数字图像提取像素密度和凹度特征,没有复杂的预处理操作,每个窗口被划分为前景像素数目相同的4个子窗口,前后相邻窗口的重叠为窗口宽度的一半,并且特征的维数仅为36维,节约了系统的计算量。采用半连续隐马尔科夫模型对字符进行建模,而词的模型采用嵌入式训练的措施,无需对词进行预先分割,从而避免了切分引入的误差。在IFN/ENIT测试数据库上的测试结果表明一个最佳输出时平均识别率能够达到86.6%。
最后,对本文作了相关总结,并提出了以后探讨重点和方向。
【关键词】:文字识别 脱机 阿拉伯手写 高斯混合 半连续隐马尔科夫模型
摘要4-6 Abstract6-10 第1章 绪论10-16 1.1 课题背景及意义10-12 1.2 脱机手写体字符识别探讨略论12-13 1.3 脱机阿拉伯手写体字符识别难点及趋势13-15 1.3.1 阿拉伯文字的基本特点13 1.3.2 阿拉伯手写识别的技术难点13-14 1.3.3 阿拉伯手写识别的发展趋势略论14-15 1.4 文章组织结构及内容15-16 第2章 字符识别关键技术略论16-29 2.1 预处理17-21 2.1.1 二值化处理技术17-18 2.1.2 字符矫正18-19 2.1.3 去噪处理19-20 2.1.4 细化20-21 2.2 特征提取21-26 2.2.1 结构特征22-23 2.2.2 统计特征23-25 2.2.3 基于结构和统计的交叉组合特征25-26 2.3 分类器设计26-27 2.3.1 支持向量机(Support Vector Machines,SVM)26 2.3.2 人工神经网络(Artificial Neural Networks,ANN)26-27 2.3.3 最小距离分类法27 2.4 后处理27-28 2.5 本节内容小结28-29 第3章 半连续隐马尔科夫模型29-41 3.1 隐马尔科夫模型原理及其基本算法29-32 3.1.1 隐马尔科夫模型的基本原理29-30 3.1.2 隐马尔科夫模型的相关算法30-32 3.2 隐马尔科夫模型的运用略论32-35 3.2.1 隐马尔科夫模型的典型运用32-33 3.2.2 HMMs在脱机手写识别的运用及识别措施33-35 3.3 半连续隐马尔科夫模型(SEMI-CONTINUOUS HMMs,SCHMMs)35-40 3.3.1 半连续系统理论35-37 3.3.2 半连续隐马尔科夫模型基本理论37 3.3.3 HTK简介37-40 3.3.4 半连续隐马尔科夫模型参数滤波40 3.4 本节内容小结40-41 第4章 半连续隐马尔科夫模型脱机阿拉伯文手写识别41-50 4.1 脱机阿拉伯文手写识别的过程41-42 4.2 基于GSC的阿拉伯手写字符图像的特征提取42-46 4.2.1 滑动窗口42-43 4.2.2 基于GSC特征的提取43-46 4.3 基于高斯混合的半连续隐马尔科夫模型分类识别器设计46-49 4.3.1 高斯混合半连续隐马尔科夫模型参数估计46-47 4.3.2 建立阿拉伯手写字符和词的模型47-48 4.3.3 训练和测试48-49 4.4 本章小结49-50 第5章 结果与略论50-54 5.1 IFN/ENIT数据库50 5.2 手写体阿拉伯字符识别标准50-51 5.3 结果略论51-52 5.4 手写体阿拉伯文的后处理52-53 5.5 本章小结53-54 第6章 总结与展望54-56 6.1 论文探讨总结54 6.2 未来探讨方向54-56 参考文献56-60 致谢60-61 攻读期间的论文及科研情况61 ,阿拉伯语专业论文,阿拉伯语论文题目 |