摘要:多基频估计是指对同一时间内有多个音源发声的音乐信号进行基频的估计,这项技术可以被应用于自动音乐记谱、和弦识别和钢琴音乐检索等领域。由于多种因素影响,目前多基频估计技术还不够成熟,不能满足人们对这方面的需求,所以继续深入研究多基频估计方法具有重大的实际意义。
本文以钢琴和弦作为研究对象,对两种特征参数下的多基频估计方法进行研究与分析,主要研究内容如下:首先,对音乐端点和音符起点进行检测,音乐端点检测采用双门限法,可以标记出一段音乐的起点和终点;音符端点检测采用时域短时能量检测法,该方法可以标记出音乐中每个音符的起点和终点。然后,选择Mel频率倒谱系数和半音作为特征参数分别进行多基频估计研究,提取出多组和弦的MFCC参数和半音值作为数据,经过人工神经网络中的BP算法计算出多基频估计的准确率并进行对比。在MFCC作为特征参数的测试中,三音和弦的测试准确率为55%,两音和弦的测试准确率为80%;在半音作为特征参数的测试中,三音和弦的测试准确率为90%,两音和弦的测试准确率为100%。研究表明,基于半音的多基频估计方法比基于MFCC的方法准确率更高,且在两种方法中,二音和弦的多基频估计准确率都比三音和弦的高。
关键词:多基频估计;神经网络;MFCC参数;半音
目录
摘要
Abstract
1 绪论-1
1.1研究背景与意义-1
1.2研究现状与发展趋势-2
1.3本文主要工作与内容安排-2
2音符端点检测-4
2.1检测起点的方法分析-4
2.2实验过程与结果分析-4
3 基于MFCC的多基频估计方法-8
3.1乐音特征参数的提取-8
3.1.1Mel频率倒谱系数-8
3.1.2实验过程和结果分析-10
3.2人工神经网络训练-11
3.2.1人工神经网络基本概念-11
3.2.2反向传播算法-12
3.2.3实验过程与结果分析-13
4基于半音的多基频估计方法-18
4.1实验过程和结果分析-18
结 论-21
参 考 文 献-22
附录A 程序-23
致 谢-32