摘要:说话人识别是一种按照语音波形图中反映说话人个性语音特征的参数,以此来识别说话人身份的技术。
本文首先介绍了说话人识别技术的发展历史和研究现状,说话人识别系统的基本概念、原理、特征参数的提取方法、模式匹配及说话人识别系统实现的方法。之后,本文通过在Matlab仿真软件上对语音的线性预测倒谱系数和Mel频率倒谱系数等特征参数进行提取、分析、对比,最后在基于VQ矢量量化的匹配方法下进行了基本的说话人辨认实验,在实验训练阶段采用矢量量化的聚类(LBG)算法生成训练码本,在识别阶段,通过将待识别语音的特征参数矢量与训练码本进行失真测度运算,最后将最小的失真测度所对应的语音输出,完成说话人辨认实验。最后通过分析得出不同阶数下特征参数的识别性能和选用不同特征参数对识别性能的影响结果。
关键词:说话人识别;特征参数;线性预测倒谱;Mel频率倒谱;矢量量化
目录
摘要
Abstract
1 绪论-1
1.1 研究意义-1
1.2 研究现状-1
1.3 研究内容与章节安排-2
2 说话人识别的基本介绍-3
2.1 说话人识别的基本原理-3
2.2 预处理-3
2.3 特征参数提取-5
2.3.1 线性预测倒谱系数LPCC-5
2.3.2 Mel频率倒谱系数MFCC-7
2.4 模式识别-8
2.4.1 模板匹配法-8
2.4.2 矢量量化法-9
2.4.3 识别判断-10
3 仿真实验及分析-11
3.1 基于VQ方法的说话人辨认实验简介-11
3.1.1 实验原理-11
3.1.2 LPCC提取-11
3.1.3 MFCC提取-13
3.1.4 LPCC特征参数下的说话人辨认-14
3.1.5 MFCC特征参数下的说话人辨认-16
3.2 实验结果分析-19
结 论-21
参 考 文 献-22
附录A Matlab主要实验程序-23
致 谢-29