音频处理中的尺度--Bark尺度与Mel尺度

来源:互联网 发布:oracle数据库监听日志 编辑:程序博客网 时间:2024/06/11 21:03

由于人耳对声音的感知(如:频率、音调)是非线性的,为了对声音的感知进行度量,产生了一系列的尺度(如:十二平均律),这里重点说下Bark尺度与Mel尺度。刚开始的时候,我自己也没弄明白这两个尺度的区别。后来才逐渐的明白他们的思考出发点,这里简单分享出来。

 

  Bark(巴克)频率尺度是以Hz为单位,把频率映射到心理声学的24个临界频带上,第25个临界频带占据约:16K~20kHz的频率,1个临界频带的宽度等于一个Bark,简单的说,Bark尺度是把物理频率转换到心理声学的频率。Bark尺度频率的中心频率与临界带宽边界频率如下表所示:

 

临界频带频率/HzBark频带中心频率下界频率上界频率150010021501002003250200300435030040054504005106570510630770063077088407709209100092010801011701080127011137012701480121600148017201318501720200014215020002320152500232027001629002700315017340031503700184000370044001948004400530020580053006400217000640077002285007700950023105009500120002413500120001550025187751550022050

 

  我发现有不少式子试图对上表进行建模,用的比较多的一个式子是(Zwicker,Terhardt 1980):

B=13tan1(0.76f1000)+3.5tan1(f7500)2

  上式中频率f代表中心频率,我把上面的式子在Matlab中代入进行计算,发现前5个Bark频带与计算出来的出入比较大,尚不知道这是什么原因。

 

  Mel频率尺度也是一种频率映射感知模型,它描述的是音高感知的非线性映射,函数表示如下:

m=1127.01048loge(1+f700)

  要注意的一点是,这里的频率f单位是1kHz,也就是说,1kHz是Mel频率与以赫兹为单位的真实频率之间的参考点(1kHz=1000mel),另一方面,Mel一词来源于音乐术语melody,是旋律的频率分量与与音高感知之间距离的度量。

0 0
原创粉丝点击