签到

06月20日
尚未签到

共有回帖数 0

    长街旧港00

    等级:
    终于放假有空写点东西。虽然这和C语言没什么关系,反正这里人多我就在这投了,趁着离贴吧实名制还有些时日,在我匿之前发点东西上来还能混个精。@寒云似雾

    这次我事先写好了:https://github.com/Sleepwalking/prometheus-spark/blob/master/writings/gtfb_properties_implementation_application.md,markdown+TeX,不过发在那种地方估计也没人会去看……
    对一般不做语音识别的应该也没什么用,大概也就相关领域的研狗用得上?于是有了这个奇怪的标题前缀。



    照惯例一楼是不是得有个图?

    本文是一篇对Gammatone滤波器组(Gammatone Filter Bank)的介绍,总结了此主题下的几篇重要论文(Darling-1991, Slaney-1993, Ellis-2009, 见末尾的引用部分)。


    0. 前言


    0.1 Gammatone滤波器组是干什么的?
    一种在语音识别、语音分析领域中常用的时频转换方法,作用类似短时傅立叶变换(STFT),但Gammatone滤波器组(以下简称GTF滤波器组)结合了人耳的听觉特性。它是一种听觉滤波器组(Auditory Filter Bank)。基于GTF的语音识别系统能获得较高的准确度。


    0.2 这篇文章有什么用?
    本文主要是因为网上鲜有此类总结性的文章而写。省略了繁杂的推导,着重于应用。如果你在做语音科学或音频处理方面的研究,但愿本文能帮你节省一些读论文的时间。


    0.3 学习这篇文章需要哪些基础知识?
    这篇文章并不是面向大众的科普,然而个人完全能够从网络上习得这些基础知识:


    需要数字信号处理(DSP)基础,我个人推荐Coursera上EPFL的DSP课(https://www.coursera.org/course/dsp),或者CCRMA的Spectral Audio Signal Processing(https://ccrma.stanford.edu/~jos/sasp/)一书;
    最好会使用Matlab或Octave;
    最好掌握一些单变量微积分;
    最好了解一些音频处理,会很有帮助(例如Coursera上UPF的ASPMA课(https://www.coursera.org/course/audio))。


    0.4 声明
    作者本人买不起Matlab,所以这篇文章中所有的Matlab代码都是在GNU Octave(http://www.gnu.org/software/octave/)上测试运行的,本人不保证代码不经修改即可在Matlab上执行。
    1. 概念 - 什么是滤波器组?

    顾名思义,一个滤波器组(Filter Bank)就是一组(n个)滤波器,对同一个信号进行滤波,输出n个同步的信号。我们可以给每个滤波器指定不同的响应函数、中心频率、增益、带宽。

    假如一个滤波器组中各个滤波器的频率按升序排列,各集中在不同的频率,且滤波器数量足够多,我们可以计算出在不同时间的各个输出信号的短时能量,画成一串功率频谱(Power Spectrum),或连起来成为声谱图(Spectrogram)。




    楼主 2016-03-25 13:20 回复

共有回帖数 0
  • 回 帖
  • 表情 图片 视频
  • 发表

登录直线网账号

Copyright © 2010~2015 直线网 版权所有,All Rights Reserved.沪ICP备10039589号 意见反馈 | 关于直线 | 版权声明 | 会员须知