【摘要】:语种识别就是用计算机来自动识别一段发音所属语种的一项技术,它是在语音识别基础上发展起来的。随着语音识别技术的不断发展,西班牙语论文,语种识别作为语音识别的一个方面和它具有的重大意义,也越来越受到人们的广泛重视。从上个世纪七十年代到现在,语种识别虽然只经历了短短几十年的发展,但识别措施已有多种。这些措施虽然各有特点,西语论文题目,但比较成熟的措施还不是很多。目前,我国对语种识别的探讨较少,尚处于起步阶段。
语种识别与传统的语音识别虽然有一些相似之处,但也存在许多不同的地方。语种识别强调在与文本无关和与说话人无关的条件下进行,因而语种识别需要尽量消除语音信号中个体发音的异同,并且尽量找到不同语种的语音间不同的声学特征,从而达到更好的识别效果。
本文通过利用语音的美尔倒谱系数为每个语种建立高斯混合模型的措施对语音信号进行语种识别,从两个方面对语种识别过程进行讨论:一方面从语音的声学特征入手,对不同语言间所含的不同的特征信息进行深入的略论,从而找到对不同语种进行识别的依据;另一方面讨论高斯混合模型的原理和算法,略论高斯混合模型在识别过程中所出现的问题和提出解决的措施。
最后,本文通过具体实验对作用系统识别性能的因素进行深入略论,并加以归纳和总结,指出今后努力的方向。
【关键词】:语种识别 声学特征 美尔倒谱系数 高斯混合模型
第1章 绪论8-16 1.1 引言8-9 1.2 语种识别探讨近况9-15 1.2.1 基于声学处理和韵律学的措施9-10 1.2.2 基于语音学的措施10-13 1.2.3 以语音识别为基础的大词汇量连续语种识别13-14 1.2.4 对当前语种识别探讨工作的讨论14-15 1.3 本文所做的工作及内容安排15-16 第2章 语音的特征16-32 2.1 语音的声学特征16-18 2.2 语音的声学特征信息18-20 2.2.1 音位信息18-19 2.2.2 韵律信息19-20 2.3 语音的其它特征信息20-21 2.4 语音产生过程及在语种识别中的运用21-22 2.5 语种信源模型22-26 2.5.1 基于失真的 VQ措施23-24 2.5.2 离散/连续各态经历 HMM24 2.5.3 混合高斯分布模型24-26 2.6 语种识别的概率理论框架26-31 2.6.1 最大后验概率措施26-28 2.6.2 基于帧的措施28-29 2.6.3 基于段的措施29-31 2.7 本章小结31-32 第3章 语种特征参数的提取32-37 3.1 语音信号的数字化33 3.2 语音信号的正规化和预加重33 3.3 加窗分帧33-34 3.4 短时能量和平均过零率34-35 3.5 MFCC的计算35-36 3.6 本章小结36-37 第4章 语种模型37-44 4.1 模式分类的措施37 4.2 模式匹配和模型训练37-38 4.3 GMM的基本概念38-39 4.4 期望最大化算法及其在 GMM中的运用39-42 4.5 GMM的识别42-43 4.6 本章小结43-44 第5章 实验及结果44-56 5.1 语音数据库44-45 5.2 实验所用的语音数据库45-46 5.3 语种识别系统评价46-47 5.4 实验框架47-55 5.4.1 单帧和多帧的比较47-49 5.4.2 10秒语音和3秒语音的比较49-50 5.4.3 用留一法训练语种模型50-51 5.4.4 改变 MFCC系数对系统性能的作用51-53 5.4.5 高斯混合度对系统性能的作用53-54 5.4.6 用任意语音对系统性能的测试54-55 5.5 本章小结55-56 结论56-58 参考文献58-65 攻读学位期间的论文和取得的科研成果65-66 |