摘要 3-5 ABSTRACT 5-7 第一章 绪论 11-17 1.1 课题探讨背景与意义 11-12 1.2 国内外探讨近况及存在的问题 12-14 1.3 论文的探讨内容及章节安排 14-17 第二章 情感语音识别概述 17-29 2.1 情感的分类 17-18 2.2 情感语音数据库 18-21 2.2.1 国内外情感语音库介绍 19-20 2.2.2 本文采用的情感语音库 20-21 2.3 情感语音识别系统介绍 21-22 2.4 情感语音识别分类器 22-28 2.5 本章小结 28-29 第三章 语音信号略论及其情感特征参数提取 29-43 3.1 语音信号的产生机理 29-31 3.2 语音信号产生的物理模型 31-33 3.2.1 激励源—滤波器模型 31-32 3.2.2 非线性模型 32-33 3.3 语音信号的前端处理 33-35 3.4 情感语音特征介绍 35-39 3.4.1 线性预测系数(LPC) 35-36 3.4.2 线性预测倒谱系数(LPCC) 36-37 3.4.3 美尔频率倒谱系数(MFCC) 37-38 3.4.4 过零峰值幅度特征参数(ZCPA) 38-39 3.5 几种经典特征参数的情感识别实验 39-40 3.6 本章小结 40-43 第四章 基于人耳听觉特性的谱能量特征及其在情感语音识别中的运用 43-57 4.1 引言 43-44 4.2 基本的谱能量特征介绍 44-45 4.2.1 AUSEES特征 44 4.2.2 AUSEEG特征 44-45 4.3 人耳听觉特性 45-48 4.3.1 听觉系统介绍 45-46 4.3.2 掩蔽效应 46 4.3.3 临界带与频率群 46-48 4.4 基于Bark尺度频带划分的谱能量特征 48-52 4.4.1 Bark尺度频带划分 48 4.4.2 AUSEES-Bark/AUSEEG-Bark特征提取 48-49 4.4.3 情感识别实验 49-52 4.5 基于ERB尺度频带划分的谱能量特征 52-55 4.5.1 ERB尺度频带划分 52-53 4.5.2 AUSEES-ERB/AUSEEG-ERB特征提取 53 4.5.3 情感识别实验 53-55 4.6 本章小结 55-57 第五章 对基于人耳听觉特性的谱能量特征的优化改进 57-69 5.1 声道响应对谱能量特征的补偿算法 57-59 5.1.1 AUSEEG-Bark-LPCC特征 57 5.1.2 情感识别实验 57-59 5.2 基于TEO的谱能量特征 59-61 5.2.1 Teager能量算子 59 5.2.2 AUSEES-Bark-TEO/AUSEEG-Bark-TEO特征提取 59-60 5.2.3 情感识别实验 60-61 5.3 多种特征的情感识别率对比 61-68 5.3.1 多种特征对汉语的情感识别率对比 61-64 5.3.2 多种特征对英语的情感识别率对比 64-65 5.3.3 多种特征对德语的情感识别率对比 65-67 5.3.4 略论与结论 67-68 5.4 本章小结 68-69 第六章 总结与展望 69-71 6.1 工作总结 69-70 6.2 下一步工作展望 70-71 参考文献 71-75 致谢 75-77 攻读学位期间的学术论文 77 |