飞利浦公司音频指纹识别算法解析

来源：互联网发布：mac搜狐视频怎么缓存编辑：程序博客网时间：2024/06/08 01:08

飞利浦公司音频指纹识别算法解析

一个音频指纹系统通常包括两个部分：即一个计算听觉重要特征的指纹提取算法和一个在指纹数据库中进行有效搜索的比对算法．当要识别一段未知音频时，首先按照指纹提取算法计算其音频特征，然后和数据库中存储的大量音频指纹相比对从而进行识别．一个有效的指纹提取算法和指纹比对算法能够在数据库中正确识别出可能经受各种信号处理失真的未知音频的原始版本．若识别到对应的原始指纹，则可提取出相应的元数据信息返回给用户．

Philips公司开发了一种经典的鲁棒音频指纹识别系统．该系统音频指纹提取算法框架参考《A Highly Robust AudioFingerprinting System》

1、音频信号首先被分割为0.37秒的帧，相互之间有31／32的重叠，使用Hanning窗平滑帧边缘．

2、对帧信息FFT变换，提取幅度信息，并计算功率谱。

3、从估计的功率谱密度中选取33个非重叠的频带，分布于300-2000 Hz范围（人耳对音频的鉴别主要集中在这一范围内），频带之间是等对数间隔的（按照人耳对不同频率的反应不是线性的）。

4、计算每帧的32比特子指纹，在一定程度上近似于人耳听觉系统HAS．具体计算公式如下所示：

5、使用误码率BER作为未知音乐指纹和数据库中指纹间的相似性测量标准。如果BER小于0.35，则认为在数据库中找到目标。

仿真结果：

图1、原始音乐，图2、EQ滤波处理后的音乐

阅读全文

0 0