0引言随着我国民族地区信息化技术的发展,维吾尔文等民族文字的识别措施探讨得到了越来越多的关注。维吾尔文等民族文字识别技术的探讨与运用,可以促进民族文字数字图书馆、电子出版等事业的发展,关于民族文字信息交流与文化传承有着重要的意义。维吾尔文是中国主要少数民族文字之一。维吾尔语属于阿尔泰语系突厥语族的西匈奴语族[1]。现行维吾尔文是一种借用阿拉伯文字母和部分波斯字母来表示的拼音文字[2]。维吾尔文和阿拉伯文都是从右向左书写的词内连写文字,其文字识别措施与汉字和英文识别有着较大的不同。经过近十余年的探讨,印刷体维吾尔文识别措施有了一定的发展。在本文作者前期探讨中,曾提出通过投影分离连写体中的字母,采用边切分边识别的策略[3];提出通过提取方向线素特征来识别多字体多字号的维吾尔文字符[2];并且提出通过连通体分类、水平投影和连通体略论措施实现文字行切分和单词切分[4]。近年来,阿拉伯文识别探讨[5]是国际文字识别领域的探讨热点之一,基于隐马尔科夫模型HMM的阿拉伯文识别措施[6,7]得到了成功的运用。因此可以借助于基于HMM的阿拉伯文识别措施来探讨维吾尔文,同时结......(论文页数是:4页) ,阿拉伯语论文,阿拉伯语论文网站 |