音频处理中的尺度--Bark尺度与Mel尺度
来源:互联网 发布:android 存储数据 编辑:程序博客网 时间:2024/06/12 01:43
由于人耳对声音的感知(如:频率、音调)是非线性的,为了对声音的感知进行度量,产生了一系列的尺度(如:十二平均律),这里重点说下Bark尺度与Mel尺度。刚开始的时候,我自己也没弄明白这两个尺度的区别。后来才逐渐的明白他们的思考出发点,这里简单分享出来。
Bark(巴克)频率尺度是以Hz为单位,把频率映射到心理声学的24个临界频带上,第25个临界频带占据约:16K~20kHz的频率,1个临界频带的宽度等于一个Bark,简单的说,Bark尺度是把物理频率转换到心理声学的频率。Bark尺度频率的中心频率与临界带宽边界频率如下表所示:
临界频带频率/HzBark频带中心频率下界频率上界频率150010021501002003250200300435030040054504005106570510630770063077088407709209100092010801011701080127011137012701480121600148017201318501720200014215020002320152500232027001629002700315017340031503700184000370044001948004400530020580053006400217000640077002285007700950023105009500120002413500120001550025187751550022050
我发现有不少式子试图对上表进行建模,用的比较多的一个式子是(Zwicker,Terhardt 1980):
\[B = 13{\tan ^{ - 1}}\left( {\frac{{0.76f}}{{1000}}} \right) + 3.5{\tan ^{ - 1}}{\left( {\frac{f}{{7500}}} \right)^2}\]
上式中频率f代表中心频率,我把上面的式子在Matlab中代入进行计算,发现前5个Bark频带与计算出来的出入比较大,尚不知道这是什么原因。
Mel频率尺度也是一种频率映射感知模型,它描述的是音高感知的非线性映射,函数表示如下:
\[m = 1127.01048{\log _e}\left( {1 + \frac{f}{{700}}} \right)\]
要注意的一点是,这里的频率f单位是1kHz,也就是说,1kHz是Mel频率与以赫兹为单位的真实频率之间的参考点(1kHz=1000mel),另一方面,Mel一词来源于音乐术语melody,是旋律的频率分量与与音高感知之间距离的度量。
- 音频处理中的尺度--Bark尺度与Mel尺度
- 音频处理中的尺度--Bark尺度与Mel尺度
- 统计降尺度与动力学降尺度
- 数字图像处理9--尺度空间
- 什么是尺度
- 尺度空间
- 尺度空间
- 尺度空间
- 尺度空间
- 尺度效应
- 无线通信中的小尺度衰落
- 由尺度空间理论得出sift中的尺度不变性
- 大幅面遥感影像多尺度分割与尺度转换-初探
- 小波分析中的尺度函数与小波函数
- 图像处理里面的尺度是什么
- 计算机视觉中的曲率尺度空间技术
- Android开发中的各种尺度单位
- 图像分割任务中的尺度问题
- C#转换全角半角方法示例
- poj 7222 怀表问题(递推+空间压缩)
- 爱丽丝的发丝──《爱丽丝惊魂记:疯狂再临》制作点滴
- Mac 教程:告别 Dashboard,教你禁用 OS X 下的仪表盘教程
- 使用ORMLite(框架)创建SQLite数据库
- 音频处理中的尺度--Bark尺度与Mel尺度
- 苹果AppStore审核规则标准指南!
- Git 常用命令大全
- 二叉树的建立和遍历算法 --->树
- C# 十六进制转换ASCII
- 每天一个linux命令(17):whereis 命令
- Java 内存管理
- 很全的ABAP入门资料(待整理)
- MathType怎么编辑双箭头