平码五不中公式规律
  • / 33
  • 下载费用:30 金币  

异常声音的分类方法和装置.pdf

关 键 ?#21097;?/dt>
异常 声音 分类 方法 装置
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201611262895.1

申请日:

2016.12.30

公开号:

CN106683687A

公开日:

2017.05.17

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G10L 25/51申请日:20161230|||公开
IPC分类号: G10L25/51(2013.01)I; G10L25/18(2013.01)I; G10L25/21(2013.01)I; G10L25/24(2013.01)I; G10L15/08 主分类号: G10L25/51
申请人: 杭州华为数字技术有限公司
发明人: 秦宇; 唐少华; 李伟红; 李正浩
地址: 310052 浙江省杭州市滨江区滨兴路301号3幢A楼301室
优?#28909;ǎ?/td>
专利代理机构: ?#26412;?#40857;双利达知识产权代理有限公司 11329 代理人: ?#21363;?#23077;;毛威
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201611262895.1

授权公告号:

|||

法律状态公告日:

2017.06.09|||2017.05.17

法律状态类型:

实质审查的生效|||公开

摘要

本申请实施例提供了一种异常声音的分类方法和装置,该方法包括:对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异常声音信号的能量特征信息,该滤波器模型包括M个子滤波器,该M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈值,M为大于1的整数;根据该异常声音信号的能量特征信息,确定该异常声音信号的分类结果。采用本申请实施例提供的异常声音的分类方法和装置,能够提高异常声音分类的准确度。

权利要求书

1.一种异常声音的分类方法,其特征在于,包括:
对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;
根据滤波器模型对所述N帧信号中的每帧信号进行滤波处理,得到所述异常声音信号
的能量特征信息,所述滤波器模型包括M个子滤波器,所述M个子滤波器中每个子滤波器的
起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样
本的统计梅尔频谱在所述M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈
值,所述异常声音信号的能量特征信息包括所述N帧信号中的每帧信号在所述M个子滤波器
中第i个子滤波器上输出的能量的和,M为大于1的整数,i为大于或等于1且小于或等于M的
整数;
根据所述异常声音信号的能量特征信息,确定所述异常声音信号的分类结果。
2.根据权利要求1所述的分类方法,其特征在于,所述根据所述异常声音信号的能量特
征信息,确定所述异常声音信号的分类结果,包括:
根据所述异常声音信号的能量特征信息,确定所述异常声音信号的能量差分特征信
息,所述异常声音信号的能量差分特征信息包括所述N帧信号中的每帧信号在所述第i个子
滤波器上输出的差分能量的和,所述N帧信号中第k帧信号在所述第i个子滤波器上输出的
差分能量为第k+1帧信号与第k-1帧信号在所述第i个子滤波器上输出的能量的差值,k为大
于1且小于N的整数;
根据所述异常声音信号的能量特征信息和所述异常声音信号的能量差分特征信息,确
定所述异常声音信号的分类结果。
3.根据权利要求2所述的分类方法,其特征在于,所述根据所述异常声音信号的能量特
征信息和所述异常声音信号的能量差分特征信息,确定所述异常声音信号的分类结果,包
括:
对所述异常声音信号的能量特征信息和所述异常声音信号的能量差分特征信息进行
规范化处理,得到规范化能量特征信息和规范化能量差分特征信息;
根据所述规范化能量特征信息和所述规范化能量差分特征信息,确定所述异常声音信
号的分类特征信息;
根据所述异常声音信号的分类特征信息,确定所述异常声音信号的分类结果。
4.根据权利要求3所述的分类方法,其特征在于,
所述异常声音信号在所述第i个子滤波器上输出的能量mi?#19978;率?#30830;定:
<mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>m</mi> <mi>i</mi> <mi>j</mi> </msubsup> <mo>,</mo> </mrow>
其中,为所述N帧信号中第j帧信号在所述第i个子滤波器上输出的能量;
所述异常声音信号的能量特征信息?#19978;率?#30830;定:
<mrow> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>m</mi> <mn>2</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>m</mi> <mi>M</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,j为大于或等于1,且小于或等于N的整数。
5.根据权利要求4所述的分类方法,其特征在于,所述N帧信号中第k帧信号在所述M个
子滤波器中的第i个子滤波器上输出的差分能量?#19978;率?#30830;定:
<mrow> <msubsup> <mi>&Delta;</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>;</mo> </mrow>
所述异常声音信号在所述第i个子滤波器上输出的差分能量Δi?#19978;率?#30830;定:
<mrow> <msub> <mi>&Delta;</mi> <mi>i</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mrow> <mo>(</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
所述异常声音信号的能量差分特征信息?#19978;率?#30830;定:
<mrow> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>&Delta;</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>&Delta;</mi> <mn>2</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>&Delta;</mi> <mi>M</mi> </msub> <mo>)</mo> </mrow> <mo>.</mo> </mrow>
6.根据权利要求5所述的分类方法,其特征在于,所述规范化能量特征信息?#19978;率?#30830;
定:
<mrow> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <mover> <mn>1</mn> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mo>(</mo> <mover> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>&RightArrow;</mo> </mover> <mo>)</mo> <mo>)</mo> <mo>&CenterDot;</mo> <mo>(</mo> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mo>(</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,包括所述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音
信号样本进行滤波后,所述M个子滤波器中每个子滤波器上输出的最小能量,包括所述
M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信号样本进行滤波后,所
述M个子滤波器中每个子滤波器上输出的最大能量。
7.根据权利要求6所述的分类方法,其特征在于,所述规范化能量差分特征信息?#19978;?br />式确定:
<mrow> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <mover> <mn>1</mn> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mo>(</mo> <mover> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>&RightArrow;</mo> </mover> <mo>)</mo> <mo>)</mo> <mo>&CenterDot;</mo> <mo>(</mo> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mo>(</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>max</mi> </msub> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,包括所述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信
号样本进行滤波后,所述M个子滤波器中每个子滤波器上输出的最小差分能量,包括所
述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信号样本进行滤波后,
所述M个子滤波器中每个子滤波器上输出的最大差分能量。
8.根据权利要求7所述的分类方法,其特征在于,所述异常声音信号的分类特征信息
?#19978;率?#30830;定:
<mrow> <mover> <mi>F</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mn>1</mn> </msub> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>,</mo> <msub> <mi>&alpha;</mi> <mn>2</mn> </msub> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,α1和α2是根据所述异常声音信号的能量特征信息和能量差分特征信息的分类能
力确定的,α1和α2均大于0,且α1+α2=1。
9.根据权利要求1至8中任一项所述的分类方法,其特征在于,在所述根据滤波器模型
对所述N帧信号中的每帧信号进行滤波处理,得到所述异常声音信号的能量特征信息之前,
所述分类方法还包括:
建立所述滤波器模型,所述滤波器模型包括所述M个子滤波器。
10.根据权利要求9所述的分类方法,其特征在于,所述建立所述滤波器模块包括:
对统计的多个不同类型的异常声音信号样本的梅尔频率谱进行频谱归一化处理,得到
所述多个不同类型的异常声音信号样本的统计梅尔频谱;
根据所述不同类型的异常声音信号样本的统计梅尔频谱,确定所述统计梅尔频谱的线
?#38405;?#21512;函数,所述线?#38405;?#21512;函数用于表示所述统计梅尔频谱中梅尔频率与所述梅尔频率对
应的幅度响应值之间的?#25104;?#20851;系,所述线?#38405;?#21512;函数包括第一线性函数和第二线性函数;
根据所述线?#38405;?#21512;函数和所述M个子滤波器的数量,确定所述M个子滤波器中每个子滤
波器的起始频率和截止频率,以及所述每个子滤波器的幅度响应值,其中,所述M个子滤波
器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类
型的异常声音信号样本的统计梅尔频谱在所述M个子滤波器中的每个子滤波器上的输出能
量的差值小于所述能量阈值;
根据所述M个子滤波器中每个子滤波器的起始频率和截止频率,以及所述每个子滤波
器的幅度响应值,建立所述滤波器模型。
11.根据权利要求10所述的分类方法,其特征在于,所述线?#38405;?#21512;函数A(fmel)?#19978;率?#30830;
定:
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1.0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&le;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfrac> <mrow> <mo>-</mo> <mn>0.85</mn> </mrow> <mn>940</mn> </mfrac> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>+</mo> <mn>2.72</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&gt;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>
其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。
12.根据权利要求11所述的分类方法,其特征在于,所述M个子滤波器包括M+1个梅尔频
?#23454;悖?#25152;述M+1个梅尔频?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率?#19978;率?#30830;定:
当且时:

当?#19968;?#32773;且时:
<mrow> <mfrac> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <mfrac> <mn>2440</mn> <mi>M</mi> </mfrac> <mo>,</mo> </mrow>
其中,所述M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整数。
13.根据权利要求12所述的分类方法,其特征在于,所述M个子滤波器中第i个子滤波器
的幅度响应值Ai?#19978;率?#30830;定:
<mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mn>2440</mn> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>.</mo> </mrow>
14.根据权利要求1至13中任一项所述的分类方法,其特征在于,所述M个子滤波器均为
矩形滤波器。
15.根据权利要求1至14中任一项所述的分类方法,其特征在于,所述异常声音信号的
分类结果为:所述异常声音信号为爆炸声、尖叫声、玻璃破碎声或枪声。
16.一种建立滤波器模型的方法,其特征在于,所述滤波器模型包括M个子滤波器,所述
方法包括:
对多个不同类型的异常声音信号样本中每个异常声音信号样本的梅尔频率谱进行频
谱归一化处理,得到所述多个不同类型的异常声音信号样本的统计梅尔频谱;
根据所述多个不同类型的异常声音信号样本的统计梅尔频谱,确定所述统计梅尔频谱
的线?#38405;?#21512;函数,所述线?#38405;?#21512;函数用于表示所述统计梅尔频谱中梅尔频率与所述梅尔频
率对应的幅度响应值之间的?#25104;?#20851;系,所述线?#38405;?#21512;函数包括第一线性函数和第二线性函
数;
根据所述线?#38405;?#21512;函数和所述M个子滤波器的数量,确定所述M个子滤波器中每个子滤
波器的起始频率和截止频率,以及所述每个子滤波器的幅度响应值,其中,所述M个子滤波
器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类
型的异常声音信号样本的统计梅尔频谱在所述M个子滤波器中的每个子滤波器上的输出能
量的差值小于能量阈值,M为大于1的整数;
根据所述M个子滤波器中每个子滤波器的起始频率和截止频率,以及所述每个子滤波
器的幅度响应值,建立所述滤波器模型。
17.根据权利要求16所述的方法,其特征在于,所述线?#38405;?#21512;函数A(fmel)?#19978;率?#30830;定:
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1.0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&le;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfrac> <mrow> <mo>-</mo> <mn>0.85</mn> </mrow> <mn>940</mn> </mfrac> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>+</mo> <mn>2.72</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&gt;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>
其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。
18.根据权利要求17所述的方法,其特征在于,所述M个子滤波器包括M+1个梅尔频率
点,所述M+1个梅尔频?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率?#19978;率?#30830;定:
当且时:

当?#19968;?#32773;且时:
<mrow> <mfrac> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <mfrac> <mn>2440</mn> <mi>M</mi> </mfrac> <mo>,</mo> </mrow>
其中,所述M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整数。
19.根据权利要求18所述的方法,其特征在于,所述M个子滤波器中第i个子滤波器的幅
度响应值Ai?#19978;率?#30830;定:
<mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mn>2440</mn> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,i为大于或等于1且小于或等于M的整数。
20.根据权利要求16至19中任一项所述的方法,其特征在于,所述M个子滤波器中的每
个滤波器均为矩形滤波器。
21.根据权利要求16至20中任一项所述的方法,其特征在于,所述异常声音信号样本
为:爆炸声、尖叫声、玻璃破碎声或枪声。
22.一种异常声音的分类装置,其特征在于,包括:
处理单元,用于对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;
滤波单元,用于根据滤波器模型对所述处理单元得到的所述N帧信号中的每帧信号进
行滤波处理,得到所述异常声音信号的能量特征信息,所述滤波器模型包括M个子滤波器,
所述M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重
叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在所述M个子滤波器中的每个子
滤波器上的输出能量的差值小于能量阈值,所述异常声音信号的能量特征信息包括所述N
帧信号中的每帧信号在所述M个子滤波器中第i个子滤波器上输出的能量的和,M为大于1的
整数,i为大于或等于1且小于或等于M的整数;
确定单元,用于根据所述滤波单元得到的所述异常声音信号的能量特征信息,确定所
述异常声音信号的分类结果。
23.根据权利要求22所述的分类装置,其特征在于,所述确定单元具体用于:
根据所述异常声音信号的能量特征信息,确定所述异常声音信号的能量差分特征信
息,所述异常声音信号的能量差分特征信息包括所述N帧信号中的每帧信号在所述第i个子
滤波器上输出的差分能量的和,所述N帧信号中第k帧信号在所述第i个子滤波器上输出的
差分能量为第k+1帧信号与第k-1帧信号在所述第i个子滤波器上输出的能量的差值,k为大
于1且小于N的整数;
根据所述异常声音信号的能量特征信息和所述异常声音信号的能量差分特征信息,确
定所述异常声音信号的分类结果。
24.根据权利要求23所述的分类装置,其特征在于,所述确定单元具体用于:
对所述异常声音信号的能量特征信息和所述异常声音信号的能量差分特征信息进行
规范化处理,得到规范化能量特征信息和规范化能量差分特征信息;
根据所述规范化能量特征信息和所述规范化能量差分特征信息,确定所述异常声音信
号的分类特征信息;
根据所述异常声音信号的分类特征信息,确定所述异常声音信号的分类结果。
25.根据权利要求24所述的分类装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述异常声音信号在所述第i个子滤波器上输出的能量mi:
<mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>m</mi> <mi>i</mi> <mi>j</mi> </msubsup> <mo>,</mo> </mrow>
其中,为所述N帧信号中第j帧信号在所述第i个子滤波器上输出的能量;
?#19978;率?#30830;定所述异常声音信号的能量特征信息
<mrow> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>m</mi> <mn>2</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>m</mi> <mi>M</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,j为大于或等于1,且小于或等于N的整数。
26.根据权利要求25所述的分类装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述N帧信号中第k帧信号在所述M个子滤波器中的第i个子滤波器上输出
的差分能量
<mrow> <msubsup> <mi>&Delta;</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>;</mo> </mrow>
?#19978;率?#30830;定所述异常声音信号在所述第i个子滤波器上输出的差分能量Δi:
<mrow> <msub> <mi>&Delta;</mi> <mi>i</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mrow> <mo>(</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>m</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
?#19978;率?#30830;定所述异常声音信号的能量差分特征信息
<mrow> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>&Delta;</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>&Delta;</mi> <mn>2</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>&Delta;</mi> <mi>M</mi> </msub> <mo>)</mo> </mrow> <mo>.</mo> </mrow>
27.根据权利要求26所述的分类装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述规范化能量特征信息
<mrow> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <mover> <mn>1</mn> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mo>(</mo> <mover> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>&RightArrow;</mo> </mover> <mo>)</mo> <mo>)</mo> <mo>&CenterDot;</mo> <mo>(</mo> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mo>(</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,包括所述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音
信号样本进行滤波后,所述M个子滤波器中每个子滤波器上输出的最小能量,包括所述
M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信号样本进行滤波后,所
述M个子滤波器中每个子滤波器上输出的最大能量。
28.根据权利要求27所述的分类装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述规范化能量差分特征信息
<mrow> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <mover> <mn>1</mn> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mo>(</mo> <mover> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>&RightArrow;</mo> </mover> <mo>)</mo> <mo>)</mo> <mo>&CenterDot;</mo> <mo>(</mo> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mo>(</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>max</mi> </msub> <mo>-</mo> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,包括所述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信
号样本进行滤波后,所述M个子滤波器中每个子滤波器上输出的最小差分能量,包括所
述M个子滤波器中每个子滤波器在对所述多个不同类型的异常声音信号样本进行滤波后,
所述M个子滤波器中每个子滤波器上输出的最大差分能量。
29.根据权利要求28所述的分类装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述异常声音信号的分类特征信息
<mrow> <mover> <mi>F</mi> <mo>&RightArrow;</mo> </mover> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mn>1</mn> </msub> <msub> <mover> <mi>m</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>,</mo> <msub> <mi>&alpha;</mi> <mn>2</mn> </msub> <msub> <mover> <mi>&Delta;</mi> <mo>&RightArrow;</mo> </mover> <mi>g</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,α1和α2是根据所述异常声音信号的能量特征信息和能量差分特征信息的分类能
力确定的,α1和α2均大于0,且α1+α2=1。
30.根据权利要求22至29中任一项所述的分类装置,其特征在于,所述分类装置还包
括:建模单元,所述建模单元用于在所述根据滤波器模型对所述N帧信号中的每帧信号进行
滤波处理,得到所述异常声音信号的能量特征信息之前,建立所述滤波器模型,所述滤波器
模型包括所述M个子滤波器。
31.根据权利要求30所述的分类装置,其特征在于,所述建模单元具体用于:
对统计的多个不同类型的异常声音信号样本的梅尔频率谱进行频谱归一化处理,得到
所述多个不同类型的异常声音信号样本的统计梅尔频谱;
根据所述不同类型的异常声音信号样本的统计梅尔频谱,确定所述统计梅尔频谱的线
?#38405;?#21512;函数,所述线?#38405;?#21512;函数用于表示所述统计梅尔频谱中梅尔频率与所述梅尔频率对
应的幅度响应值之间的?#25104;?#20851;系,所述线?#38405;?#21512;函数包括第一线性函数和第二线性函数;
根据所述线?#38405;?#21512;函数和所述M个子滤波器的数量,确定所述M个子滤波器中每个子滤
波器的起始频率和截止频率,以及所述每个子滤波器的幅度响应值,其中,所述M个子滤波
器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类
型的异常声音信号样本的统计梅尔频谱在所述M个子滤波器中的每个子滤波器上的输出能
量的差值小于所述能量阈值;
根据所述M个子滤波器中每个子滤波器的起始频率和截止频率,以及所述每个子滤波
器的幅度响应值,建立所述滤波器模型。
32.根据权利要求31所述的分类装置,其特征在于,所述建模单元具体用于:
?#19978;率?#30830;定所述线?#38405;?#21512;函数A(fmel):
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1.0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&le;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfrac> <mrow> <mo>-</mo> <mn>0.85</mn> </mrow> <mn>940</mn> </mfrac> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>+</mo> <mn>2.72</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&gt;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>
其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。
33.根据权利要求32所述的分类装置,其特征在于,所述M个子滤波器包括M+1个梅尔频
?#23454;悖?#25152;述建模单元具体用于:
?#19978;率?#30830;定所述M+1个梅尔频?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率:
当且时:

当?#19968;?#32773;且时:
<mrow> <mfrac> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <mfrac> <mn>2440</mn> <mi>M</mi> </mfrac> <mo>,</mo> </mrow>
其中,所述M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整数。
34.根据权利要求33所述的装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述M个子滤波器中第i个子滤波器的幅度响应值Ai:
<mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mn>2440</mn> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,i为大于或等于1且小于或等于M的整数。
35.根据权利要求22至34中任一项所述的分类装置,其特征在于,所述M个子滤波器中
的每个滤波器均为矩形滤波器。
36.根据权利要求22至35中任一项所述的分类装置,其特征在于,所述异常声音信号的
分类结果为:所述异常声音信号为爆炸声、尖叫声、玻璃破碎声或枪声。
37.一种建立滤波器模型的装置,其特征在于,所述滤波器模型包括M个子滤波器,所述
装置包括:
处理单元,用于对多个不同类型的异常声音信号样本中每个异常声音信号样本的梅尔
频率谱进行频谱归一化处理,得到所述多个不同类型的异常声音信号样本的统计梅尔频
谱;
确定单元,用于根据所述处理单元处理得到的多个不同类型的异常声音信号样本的统
计梅尔频谱,确定所述统计梅尔频谱的线?#38405;?#21512;函数,所述线?#38405;?#21512;函数用于表示所述统
计梅尔频谱中梅尔频率与所述梅尔频率对应的幅度响应值之间的?#25104;?#20851;系,所述线?#38405;?#21512;
函数包括第一线性函数和第二线性函数;
所述确定单元还用于根据所述线?#38405;?#21512;函数和所述M个子滤波器的数量,确定所述M个
子滤波器中每个子滤波器的起始频率和截止频率,以及所述每个子滤波器的幅度响应值,
其中,所述M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?br />不重叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在所述M个子滤波器中的每
个子滤波器上的输出能量的差值小于能量阈值,M为大于1的整数;
建模单元,用于根据所述确定单元确定的所述M个子滤波器中每个子滤波器的起始频
率和截止频率,以及所述每个子滤波器的幅度响应值,建立所述滤波器模型。
38.根据权利要求37所述的装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述线?#38405;?#21512;函数A(fmel):
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1.0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&le;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfrac> <mrow> <mo>-</mo> <mn>0.85</mn> </mrow> <mn>940</mn> </mfrac> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>+</mo> <mn>2.72</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </msub> <mo>&gt;</mo> <mn>1900</mn> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>
其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。
39.根据权利要求38所述的装置,其特征在于,所述M个子滤波器包括M+1个梅尔频率
点,所述确定单元具体用于:
?#19978;率?#30830;定所述M个子滤波器包括M+1个梅尔频?#23454;悖?#25152;述M+1个梅尔频?#23454;?#20013;每个梅
尔频?#23454;?#23545;应的梅尔频率:
当且时:

当?#19968;?#32773;且时:
<mrow> <mfrac> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <mi>A</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <mfrac> <mn>2440</mn> <mi>M</mi> </mfrac> <mo>,</mo> </mrow>
其中,所述M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整数。
40.根据权利要求39所述的装置,其特征在于,所述确定单元具体用于:
?#19978;率?#30830;定所述M个子滤波器中第i个子滤波器的幅度响应值Ai:
<mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mn>2440</mn> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mi>p</mi> </msubsup> <mo>-</mo> <msubsup> <mi>f</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>l</mi> </mrow> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,i为大于或等于1且小于或等于M的整数。
41.根据权利要求37至40中任一项所述的装置,其特征在于,所述M个子滤波器中的每
个子滤波器均为矩形滤波器。
42.根据权利要求37至41中任一项所述的装置,其特征在于,所述异常声音信号的样本
为爆炸声、尖叫声、玻璃破碎声或枪声。

?#24471;?#20070;

异常声音的分类方法和装置

技术领域

本申请实施例涉及音频信号处理领域,更具体地,涉及音频信号处理领域中异常
声音的分类方法和装置,以及建立滤波器模型的方法和滤波器模型。

背景技术

公共场所是指公众从?#24459;?#20250;生活的各种场所如广场、车站、学校等。公共场所中所
发生的各种异常事件、犯罪事件等?#21152;?#20154;们的生命财产与安全息息相关。目前,公共场所安
全监视主要以视频监视平台为核?#27169;?#22823;多还没有音频监控能力。由于大多数公共场所发生
的异常事件?#21450;?#38543;有异常声音的产生,如枪声、爆炸声、玻璃破碎声、尖叫声等。异常声音的
产生标明异常事件已发生或者即将发生。通过音频监控技术弥补视频监控平台的不足,已
成为公共场所安全监控的发展方向。由于音频监控领域相关理论与技术的缺乏,对公共场
所异常声音的确定和分类具有重要的研究意义。

对于公共场所异常声音特征的提取方法,大多沿用传统的语音信号处理方法,如
梅尔频?#23454;?#35889;系数(Mel Frequency Cepstrum Coefficient,MFCC)。但是由于公共场所异
常声音包含语音信号(如尖叫声),还包括非语音信号(如枪声、爆炸声、玻璃破碎声),由于
公共场所异常声音信号的基频频率分散,信号能量在不同宽度的频率域集中分布,同时在
整个频率域呈?#22336;?#22343;匀分布的特点,上述传统方法对异常声音的特征描述有限,导致分类
结果不?#36873;?br />

发明内容

本申请提供了一种异常声音的分类方法和装置,能够提高异常声音分类的准确
度。

本申请还提供了一种建立滤波器模型的方法和装置,能够提高对异常声音特征的
描述能力,从而提高异常声音分类的准确度。

第一方面,本申请实施例提供了一种异常声音的分类方法,该方法包括:

对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;

根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异常声音信号
的能量特征信息,该滤波器模型包括M个子滤波器,该M个子滤波器中每个子滤波器的起始
频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样本的
统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈值,该
异常声音信号的能量特征信息包括该N帧信号中的每帧信号在该M个子滤波器中第i个子滤
波器上输出的能量的和,M为大于1的整数,i为大于或等于1且小于或等于M的整数;

根据该异常声音信号的能量特征信息,确定该异常声音信号的分类结果。

具体而言,对于待确定分类的异常声音信号,先对该异常声音进行分帧处理,然后
将每一帧利用滤波器模型进行滤波,得到该帧信号不同频率成分的能量信息,形成该帧信
号的能量特征信息,逐帧计算该异常声音信号所有帧的能量特征信息,并根据该异常声音
信号的能量特征信息确定该异常声音信号的分类。

应理解,该滤波器模型可以为M个子滤波器组成的滤波器组。

还应理解,本申请实施例中的异常声音例如可以为枪声、爆炸声、玻璃破碎声或尖
叫声等公共场所中影响公共安全的声音,这些声音在整个频带上的能量统计不均匀,沿用
经典的MFCC的滤波器会导致特征信息量?#26723;停?#20174;而异常声音的鉴别能力也比?#31995;汀?br />

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

根据信息论原理可知,利用滤波器组对信号进行处理时,当该M个子滤波器中每个
子滤波器输出的能量统计均等时,信号的特征能够表达的信息量最大。

应理解,该异常声音信号的能量特征信息包括该N帧信号中的每帧信号在该M个子
滤波器中第i个子滤波器上输出的能量的和,可以理解为该异常声音信号的能量特征信息
为由该N帧信号中每帧信号在该M个子滤波器中第i个子滤波器上输出的能量的和组成的能
量特征向量。

可选地,根据该异常声音信号的能量特征信息确定该异常声音信号的分类,可以
为根据该异常声音信号的能量特征信息,和预先训练的异常声音识别的支持向量机
(Support Vector Machine,SVM)模型,得到分类结果。

可选地,该SVM模型可通过建立异常声音样本库,该异常声音样本库中可以包括大
量不同类型的异常声音,选择一定数量的每种类型的异常声音训练成训练集,确定该训练
集中每个异常声音信号的能量特征信息,然后基于支持向量机理论,训练得到该类型异常
声音识别的SVM模型。

可选地,根据该异常声音信号的能量特征信息,和预先训练的异常声音识别的SVM
模型,得到分类结果,可以为将该异常声音信号的能量特征信息与SVM模型进行比较,获得
该异常声音信号的分类结果。

本申请实施例提供的异常声音信号的分类方法,通过滤波器模型对异常声音信号
包括的N帧信号进行滤波处理,得到该异常声音的能量特征信息,并根据该异常声音信号的
能量特征信息,确定该异常声音信号的分类结果,其中,该滤波器模型包括M个子滤波器,该
M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间在频率上连续?#19968;?#19981;
重叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子
滤波器上的输出能量均等,能够提高异常声音的分类准确度。

在一个可能的实现方式中,该根据该异常声音信号的能量特征信息,确定该异常
声音信号的分类结果,包括:根据该异常声音信号的能量特征信息,确定该异常声音信号的
能量差分特征信息,该异常声音信号的能量差分特征信息包括该N帧信号中的每帧信号在
该第i个子滤波器上输出的差分能量的和,该N帧信号中第k帧信号在该第i个子滤波器上输
出的差分能量为第k+1帧信号与第k-1帧信号在该第i个子滤波器上输出的能量的差值,k为
大于1且小于N的整数;根据该异常声音信号的能量特征信息和该异常声音信号的能量差分
特征信息,确定该异常声音信号的分类结果。

应理解,该异常声音信号的能量差分特征信息包括该N帧信号中的每帧信号在该M
个子滤波器中第i个子滤波器上输出的差分能量的和,可以理解为该异常声音信号的差分
能量特征信息为由该N帧信号中每帧信号在该M个子滤波器中第i个子滤波器上输出的差分
能量的和组成的能量差分特征向量。

还应理解,为了提升声音特征对异常声音信号的分类的鉴别能力,本申请实施例
根据异常声音信号在不同频带能量分布差异明显,且不同时刻信号能量变化大的特点,进
一步计算前后帧能量特征之间的差分,得到每帧信号的能量差分特征信息。

可选地,可以根据现有模式识别技术通过每帧信号的能量特征信息确定该帧信号
的能量差分特征信息,本申请实施例对此不作限定。

本申请实施例提供的确定异常声音的分类方法,通过异常声音信号的能量特征信
息和该异常声音信号的能量特征信息能量差分特征信息,确定该异常声音信号的分类结
果,能够提高特征对异常声音信号的分类鉴别能力。。

在一个可能的实现方式中,该根据该异常声音信号的能量特征信息和该异常声音
信号的能量差分特征信息,确定该异常声音信号的分类结果,包括:对该异常声音信号的能
量特征信息和该异常声音信号的能量差分特征信息进行规范化处理,得到规范化能量特征
信息和规范化能量差分特征信息;根据该规范化能量特征信息和该规范化能量差分特征信
息,确定该异常声音信号的分类特征信息;根据该异常声音信号的分类特征信息,确定该异
常声音信号的分类结果。

应理解,本申请实施例中的规范化特征融合可以采用现有的规范化方法。

采用规范化多特征加权融合的方法对异常声音信号的能量特征信息和能量差分
特征信息进行融合,得到异常声音信号的分类特征信息,并根据该分类特征信息,确定该异
常声音的分类,能够进一步提高异常声音的分类的准确度,并且能够避免某种特征在分类
过程中占主导,影响分类结果的准确度。

在一种可能的实现方式中,该异常声音信号在该第i个子滤波器上输出的能量mi
?#19978;率?#30830;定:


其中,为该N帧信号中第j帧信号在该第i个子滤波器上输出的能量;

该异常声音信号的能量特征信息?#19978;率?#30830;定:


其中,j为大于或等于1,且小于或等于N的整数。

在一种可能的实现方式中,该N帧信号中第k帧信号在该M个子滤波器中的第i个子
滤波器上输出的差分能量?#19978;率?#30830;定:


该异常声音信号在该第i个子滤波器上输出的差分能量Δi?#19978;率?#30830;定:


该异常声音信号的能量差分特征信息?#19978;率?#30830;定:


在一种可能的实现方式中,该规范化能量特征信息?#19978;率?#30830;定:


其中,包括该M个子滤波器中每个子滤波器在对该多个不同类型的异常声音
信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小能量,包括该M个
子滤波器中每个子滤波器在对该多个不同类型的异常声音信号样本进行滤波后,该M个子
滤波器中每个子滤波器上输出的最大能量。

应理解,该为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小能量组成的最小
能量特征向量。

还应理解,为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最大能量组成的最大
能量特征向量。

在一种可能的实现方式中,该规范化能量差分特征信息?#19978;率?#30830;定:


其中,包括该M个子滤波器中每个子滤波器在对该多个不同类型的异常声音
信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小差分能量,包括该
M个子滤波器中每个子滤波器在对该多个不同类型的异常声音信号样本进行滤波后,该M个
子滤波器中每个子滤波器上输出的最大差分能量。

应理解,该为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小差分能量组成的
最小能量差分特征向量。

还应理解,为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最大差分能量组成的
最大能量差分特征向量。

在一种可能的实现方式中,该异常声音信号的分类特征信息?#19978;率?#30830;定:


其中,α1和α2是根据该异常声音信号的能量特征信息和能量差分特征信息的分类
能力确定的,α1和α2均大于0,且α1+α2=1。

在一种可能的实现方式中,在该根据滤波器模型对该N帧信号中的每帧信号进行
滤波处理,得到该异常声音信号的能量特征信息之前,该分类方法还包括:建立该滤波器模
型,该滤波器模型包括该M个子滤波器。

在一种可能的实现方式中,该建立该滤波器模块包括:对统计的多个不同类型的
异常声音信号样本的梅尔频率谱进行频谱归一化处理,得到该多个不同类型的异常声音信
号样本的统计梅尔频谱;根据该不同类型的异常声音信号样本的统计梅尔频谱,确定该统
计梅尔频谱的线?#38405;?#21512;函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅
尔频率对应的幅度响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性
函数;根据该线?#38405;?#21512;函数和该M个子滤波器的数量,确定该M个子滤波器中每个子滤波器
的起始频率和截止频率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波器中每个
子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常
声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小
于该能量阈值;根据该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子
滤波器的幅度响应值,建立该滤波器模型。

具体而言,在统计多个不同类型的梅尔频率域归一化幅度谱的基础上,通过线性
拟?#20808;?#23450;了梅尔频率域的M个子滤波器包络曲线,然后基于该包络曲线下统计能量均等的
原则,将梅尔频率域划分为若干区间,并以区间的起止频?#23454;?#20316;为该M个子滤波器中每个子
滤波器的起始频率和截止频率,建立梅尔频率域内的该M个子滤波器,使得多个不同类型的
异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量均
等。

应理解,该滤波器模型可以为M个子滤波器组成的滤波器组,统计梅尔频谱在该M
个子滤波器中的每个子滤波器上的输出能量均等,表示在统计梅尔频谱的频率域内,每个
滤波器的起始频率、截止频率与包络曲线所围成的部分面积相同。

还应理解,本申请实施例中的异常声音例如可以为枪声、爆炸声、玻璃破碎声或尖
叫声等公共场所中影响公共安全的声音,这些声音在整个频带上的能量统计不均匀,沿用
经典的MFCC的滤波器会导致特征信息量?#26723;停?#20174;而异常声音的鉴别能力也比?#31995;汀?br />

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

根据信息论原理可知,利用滤波器组对信号进行处理时,当该M个子滤波器中每个
子滤波器输出的能量统计均等时,信号的特征能够表达的信息量最大。

本申请实施例提供的异常声音的分类方法,能够提高对异常声音特征的描述能
力,从而提高异常声音分类的准确度。

在一种可能的实现方式中,该线?#38405;?#21512;函数A(fmel)?#19978;率?#30830;定:


其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。

在一种可能的实现方式中,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;M+1个梅尔频
?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率?#19978;率?#30830;定:

当且时:


当?#19968;?#32773;且时:


其中,该M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整
数。

在一种可能的实现方式中,该M个子滤波器中第i个子滤波器的幅度响应值Ai?#19978;?br />式确定:


在一种可能的实现方式中,该M个子滤波器中的每个滤波器均为矩形滤波器。

在一种可能的实现方式中,该异常声音的类型包括:爆炸声、尖叫声、玻璃破碎声
或枪声。

在一种可能的实现方式中,该异常声音信号的分类结果为:该异常声音信号为爆
炸声、尖叫声、玻璃破碎声或枪声。

第二方面,本申请实施例提供了一种建立滤波器模型的方法,该滤波器模型包括M
个子滤波器,该方法包括:

对多个不同类型的异常声音信号样本中每个异常声音信号样本的梅尔频率谱进
行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅尔频谱;

根据该多个不同类型的异常声音信号样本的统计梅尔频谱,确定该统计梅尔频谱
的线?#38405;?#21512;函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅尔频率对应
的幅度响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性函数;

根据该线?#38405;?#21512;函数和该M个子滤波器的数量,确定该M个子滤波器中每个子滤波
器的起始频率和截止频率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波器中每
个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异
常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值
小于能量阈值,M为大于1的整数;

根据该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子滤波
器的幅度响应值,建立该滤波器模型。

应理解,该滤波器模型可以为M个子滤波器组成的滤波器组,统计梅尔频谱在该M
个子滤波器中的每个子滤波器上的输出能量均等,表示在统计梅尔频谱的频率域内,每个
滤波器的起始频率、截止频率与包络曲线所围成的部分面积相同。

还应理解,本申请实施例中的异常声音例如可以为枪声、爆炸声、玻璃破碎声或尖
叫声等公共场所中影响公共安全的声音,这些声音在整个频带上的能量统计不均匀,沿用
经典的MFCC的滤波器会导致特征信息量?#26723;停?#20174;而异常声音的鉴别能力也比?#31995;汀?br />

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

根据信息论原理可知,利用滤波器组对信号进行处理时,当该M个子滤波器中每个
子滤波器输出的能量统计均等时,信号的特征能够表达的信息量最大。

本申请实施例提供的建立滤波器模型的方法,能够提高对异常声音特征的描述能
力,从而提高异常声音分类的准确度。

在一个可能的实现方式中,该线?#38405;?#21512;函数A(fmel)?#19978;率?#30830;定:


其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。

在一个可能的实现方式中,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;M+1个梅尔频
?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率?#19978;率?#30830;定:

当且时:


当?#19968;?#32773;且时:


其中,该M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1的整
数。

在一个可能的实现方式中,该M个子滤波器中第i个子滤波器的幅度响应值Ai?#19978;?br />式确定:


其中,i为大于或等于1且小于或等于M的整数。

在一个可能的实现方式中,该M个子滤波器中的每个滤波器均为矩形滤波器。

在一个可能的实现方式中,不同类型的异常声音信号样本包括:爆炸声、尖叫声、
玻璃破碎声或枪声。

第三方面,本申请提供了一种异常声音的分类装置,用于执行上述第一方面或第
一方面的?#25105;?#21487;能的实现方式中的异常声音的分类方法。具体地,该异常声音的分类装置
包括用于执行上述第一方面或第一方面的?#25105;?#21487;能的实现方式中的异常声音的分类方法
的单元。

第四方面,本申请提供了一种建立滤波器模型的装置,用于执行上述第二面或第
二方面的?#25105;?#21487;能的实现方式中的建立。具体地,建立滤波器模型的装置包括用于执行上
述第二方面或第二方面的?#25105;?#21487;能的实现方式中的建立滤波器模型的方法。

第五方面,本申请提供了一种异常声音的分类装置,包括:存储单元和处理器,该
存储单元用于存储指令,该处理器用于执行该存储器存储的指令,并且当该处理器执行该
存储器存储的指令时,该执行使得该处理器执行第一方面或第一方面的?#25105;?#21487;能的实现方
式中的异常声音的分类方法。

第六方面,本申请提供了一种建立滤波器模型的装置,包括:存储单元和处理器,
该存储单元用于存储指令,该处理器用于执行该存储器存储的指令,并且当该处理器执行
该存储器存储的指令时,该执行使得该处理器执行第二方面或第二方面的?#25105;?#21487;能的实现
方式中的建立滤波器模型的方法。

第七方面,本申请提供了一种计算机可读介?#21097;?#29992;于存储计算机程序,该计算机程
序包括用于执行第一方面或第一方面的?#25105;?#21487;能的实现方式中的异常声音的分类方法的
指令。

第八方面,本申请提供了一种计算机可读介?#21097;?#29992;于存储计算机程序,该计算机程
序包括用于执行第二方面或第二方面的?#25105;?#21487;能的实现方式中的建立滤波器模型的方法
的指令。

附图?#24471;?br />

图1是本申请实施例的建立滤波器模型的方法的示意性流程图;

图2是本申请实施例的多个不同类型的异常声音的统计梅尔频谱;

图3是本申请实施例的滤波器模型的频谱图;

图4是本申请实施例的异常声音的分类方法的示意性流程图;

图5是本申请实施例的建立滤波器模型的装置的示意性框图;

图6是本申请实施例的异常声音的分类装置的示意性框图;

图7是本申请实施例的另一建立滤波器模型的装置的示意性框图;

图8是本申请实施例的另一异常声音的分类装置的示意性框图。

具体实施方式

下面将结合附图,对本申请实施例中的技术方案进行描述。

图1示出了本申请实施例提供的建立滤波器模型的方法100的示意性流程图,该滤
波器模型包括M个子滤波器,M为大于1的整数,该方法100例如可以由建立滤波器模型的装
置执行。

S110,对多个不同类型的异常声音信号样本中每个异常声音信号样本的梅尔频率
谱进行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅尔频谱。

S120,根据该多个不同类型的异常声音信号样本的统计梅尔频谱,确定该统计梅
尔频谱的线?#38405;?#21512;函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅尔频
率对应的幅度响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性函
数。

S130,根据该线?#38405;?#21512;函数和该M个子滤波器的数量,确定该M个子滤波器中每个
子滤波器的起始频率和截止频率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波
器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类
型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量
的差值小于能量阈值,M为大于1的整数;

S140,根据该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子
滤波器的幅度响应值,建立该滤波器模型。

应理解,该滤波器模型可以为M个子滤波器组成的滤波器组,统计梅尔频谱在该M
个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该M个子滤波器
的输出能量均等,表示为在统计梅尔频谱的频率域内,每个滤波器的起始频率、截止频率与
包络曲线所围成的部分面积相同。

还应理解,本申请实施例中的异常声音例如可以为枪声、爆炸声、玻璃破碎声或尖
叫声等公共场所中影响公共安全的声音,这些声音在整个频带上的能量统计不均匀,沿用
经典的MFCC的滤波器会导致特征信息量?#26723;停?#20174;而异常声音的鉴别能力也比?#31995;汀?br />

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

根据信息论原理可知,利用滤波器组对信号进行处理时,当该M个子滤波器中每个
子滤波器输出的能量统计均等时,信号的特征能够表达的信息量最大。

本申请实施例提供的建立滤波器模型的方法,能够提高对异常声音特征的描述能
力,从而提高异常声音分类的准确度。

例如,图2示出了对采样频率为16kHz的100个枪声、100个爆炸声、221个玻璃破碎
声和148个尖叫声进行梅尔频率域归一化统计的结果(如图1中的实线示出了多个异常声音
样本的梅尔频率域归一化统计幅度谱),根据该梅尔频率域归一化统计幅度谱显示,这四种
异常声音的主要信息集中在2000mel以下,幅度谱的峰值出现在1900mel左右。为了最大限
度地保留2000mel以下的信息,并使M个子滤波器中每个子滤波器的梅尔频率域输出达到统
计均衡,因此可以通过线性分段函数对归一化统计幅度谱A(fmel)进行线?#38405;?#21512;(如图1中的
虚线示出了线?#38405;?#21512;曲线)。

可选地,在120中,该线?#38405;?#21512;函数A(fmel)由公式(1)确定:


其中,fmel表示梅尔频率值,A(fmel)表示梅尔频率值对应的幅度响应值。可选地,可
以将上述拟合曲线作为该M个子滤波器的幅度响应的包络线,根据统计能量均等的原则,可
以得到该M个子滤波器中每个子滤波器的频率区间连续?#19968;?#19981;重叠的起始和截止频?#23454;恪?br />

可选地,在130中,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;M+1个梅尔频?#23454;?#20013;每
个梅尔频?#23454;?#23545;应的梅尔频率由公式(2)或(3)确定:

当且时:


当?#19968;?#32773;且
时:


其中,该M+1个梅尔频?#23454;?#20013;的第p个梅尔频?#23454;?#23545;应的梅尔频率为
p为大于或等于0,且小于或等于M+1
的整数。

可选地,在130中,该M个子滤波器中第i个子滤波器的幅度响应值Ai由公式(4)确
定:


其中,i为大于或等于1且小于或等于M的整数。

例如,图3示出了当M=12时,根据上述公式(2)、公式(3)和公式(4)得到的该M个子
滤波器中每个子滤波器的起始频率、截止频率和幅度响应,建立的滤波器模型,其中该M个
子滤波器中每个子滤波器均为矩形滤波器。

可选地,该M个子滤波器中的每个滤波器均为矩形滤波器。

可选地,不同类型的异常声音信号样本包括:爆炸声、尖叫声、玻璃破碎声或枪声。

应理解,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺
序应以其功能和内在逻辑确定,而不应对申请实施例的实施过程构成任何限定。

图4示出了本申请实施例提供的异常声音的分类方法400的示意性流程图,该分类
方法400例如可以由异常声音的分类装置执行。

S410,对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数。

S420,根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异常声音
信号的能量特征信息,该滤波器模型包括M个子滤波器,该M个子滤波器中每个子滤波器的
起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样
本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈
值,该异常声音信号的能量特征信息包括该N帧信号中的每帧信号在该M个子滤波器中第i
个子滤波器上输出的能量的和,M为大于1的整数,i为大于或等于1且小于或等于M的整数。

S430,根据该异常声音信号的能量特征信息,确定该异常声音信号的分类结果。

具体而言,对于待确定分类的异常声音信号,先对该异常声音进行分帧处理,然后
将每一帧利用滤波器模型进行滤波,得到该帧信号不同频率成分的能量信息,形成该帧信
号的能量特征信息,逐帧计算该异常声音信号所有帧的能量特征信息,并根据该异常声音
信号的能量特征信息确定该异常声音信号的分类。

应理解,该滤波器模型可以为M个子滤波器组成的滤波器组。

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

根据信息论原理可知,利用滤波器组对信号进行处理时,当该M个子滤波器中每个
子滤波器输出的能量统计均等时,信号的特征能够表达的信息量最大。

还应理解,本申请实施例中的异常声音例如可以为枪声、爆炸声、玻璃破碎声或尖
叫声等公共场所中影响公共安全的声音,这些声音在整个频带上的能量统计不均匀,沿用
经典的MFCC的滤波器会导致特征信息量?#26723;停?#20174;而异常声音的鉴别能力也比?#31995;汀?br />

还应理解,该异常声音信号的能量特征信息包括该N帧信号中的每帧信号在该M个
子滤波器中第i个子滤波器上输出的能量的和,可以理解为该异常声音信号的能量特征信
息为由该N帧信号中每帧信号在该M个子滤波器中第i个子滤波器上输出的能量的和组成的
能量特征向量。

可选地,在S430中,根据该异常声音信号的能量特征信息确定该异常声音信号的
分类,可以为根据该异常声音信号的能量特征信息,和预先训练的异常声音识别的支持向
量机(Support Vector Machine,SVM)模型,得到分类结果。

可选地,该SVM模型可通过建立异常声音样本库,该异常声音样本库中可以包括大
量不同类型的异常声音,选择一定数量的每种类型的异常声音训练成训练集,确定该训练
集中每个异常声音信号的能量特征信息,然后基于支持向量机理论,训练得到该类型异常
声音识别的SVM模型。

可选地,根据该异常声音信号的能量特征信息,和预先训练的异常声音识别的SVM
模型,得到分类结果,可以为将该异常声音信号的能量特征信息与SVM模型进行比较,获得
该异常声音信号的分类结果。

本申请实施例提供的异常声音信号的分类方法,通过滤波器模型对异常声音信号
包括的N帧信号进行滤波处理,得到该异常声音的能量特征信息,并根据该异常声音信号的
能量特征信息,确定该异常声音信号的分类结果,其中,该滤波器模型包括M个子滤波器,该
M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间在频率上连续?#19968;?#19981;
重叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子
滤波器上的输出能量均等,能够提高异常声音的分类准确度。

可选地,在S430中,该根据该异常声音信号的能量特征信息,确定该异常声音信号
的分类结果,可以为根据该异常声音信号的能量特征信息,确定该异常声音信号的能量差
分特征信息,该异常声音信号的能量差分特征信息包括该N帧信号中的每帧信号在该第i个
子滤波器上输出的差分能量的和,该N帧信号中第k帧信号在该第i个子滤波器上输出的差
分能量为第k+1帧信号与第k-1帧信号在该第i个子滤波器上输出的能量的差值,k为大于1
且小于N的整数;根据该异常声音信号的能量特征信息和该异常声音信号的能量差分特征
信息,确定该异常声音信号的分类结果。

应理解,为了提升声音特征对异常声音信号的分类的鉴别能力,本申请实施例根
据异常声音信号在不同频带能量分布差异明显,且不同时刻信号能量变化大的特点,进一
步计算前后帧能量特征之间的差分,得到每帧信号的能量差分特征信息。

还应理解,该异常声音信号的能量差分特征信息包括该N帧信号中的每帧信号在
该M个子滤波器中第i个子滤波器上输出的差分能量的和,可以理解为该异常声音信号的差
分能量特征信息为由该N帧信号中每帧信号在该M个子滤波器中第i个子滤波器上输出的差
分能量的和组成的能量差分特征向量。

可选地,可以根据现有模式识别技术通过每帧信号的能量特征信息确定该帧信号
的能量差分特征信息,本申请实施例对此不作限定。

本申请实施例提供的确定异常声音的分类方法,通过异常声音信号的能量特征信
息和该异常声音信号的能量特征信息能量差分特征信息,确定该异常声音信号的分类结
果,能够提高特征对异常声音信号的分类鉴别能力。

可选地,在S430中,该根据该异常声音信号的能量特征信息和该异常声音信号的
能量差分特征信息,确定该异常声音信号的分类结果,可以为对该异常声音信号的能量特
征信息和该异常声音信号的能量差分特征信息进行规范化处理,得到规范化能量特征信息
和规范化能量差分特征信息;根据该规范化能量特征信息和该规范化能量差分特征信息,
确定该异常声音信号的分类特征信息;根据该异常声音信号的分类特征信息,确定该异常
声音信号的分类结果。

应理解,本申请实施例中的规范化特征融合可以采用现有的规范化方法。

采用规范化多特征加权融合的方法对异常声音信号的能量特征信息和能量差分
特征信息进行融合,得到异常声音信号的分类特征信息,并根据该分类特征信息,确定该异
常声音的分类,能够进一步提高异常声音的分类的准确度,并且能够避免某种特征在分类
过程中占主导,影响分类结果的准确度。

可选地,该异常声音信号在该第i个子滤波器上输出的能量mi由公式(5)确定:


其中,为该N帧信号中第j帧信号在该第i个子滤波器上输出的能量;

该异常声音信号的能量特征信息由公式(6)确定:


其中,j为大于或等于1,且小于或等于N的整数。

可选地,该N帧信号中第k帧信号在该M个子滤波器中的第i个子滤波器上输出的差
分能量由公式(7)确定:


该异常声音信号在该第i个子滤波器上输出的差分能量Δi由公式(8)确定:


该异常声音信号的能量差分特征信息由公式(9)确定:


可选地,该规范化能量特征信息由公式(10)确定:


其中,包括该M个子滤波器中每个子滤波器在对该多个不同类型的异常声音
信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小能量,包括该M个
子滤波器中每个子滤波器在对该多个不同类型的异常声音信号样本进行滤波后,该M个子
滤波器中每个子滤波器上输出的最大能量。

应理解,该为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小能量组成的最小
能量特征向量。

还应理解,为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最大能量组成的最大
能量特征向量。

可选地,该规范化能量差分特征信息由公式(11)确定:


其中,包括该M个子滤波器中每个子滤波器在对该多个不同类型的异常声音
信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小差分能量,包括
该M个子滤波器中每个子滤波器在对该多个不同类型的异常声音信号样本进行滤波后,该M
个子滤波器中每个子滤波器上输出的最大差分能量。

应理解,该为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最小差分能量组成的
最小能量差分特征向量。

还应理解,为由该M个子滤波器中每个子滤波器在对该多个不同类型的异常
声音信号样本进行滤波后,该M个子滤波器中每个子滤波器上输出的最大差分能量组成的
最大能量差分特征向量。

可选地,该异常声音信号的分类特征信息由公式(12)确定:


其中,α1和α2是根据该异常声音信号的能量特征信息和能量差分特征信息的分类
能力确定的,α1和α2均大于0,且α1+α2=1。

可选地,在该根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异
常声音信号的能量特征信息之前,该分类方法还包括:建立该滤波器模型,该滤波器模型包
括该M个子滤波器。

可选地,该建立该滤波器模块包括:对统计的多个不同类型的异常声音信号样本
的梅尔频率谱进行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅尔
频谱;根据该不同类型的异常声音信号样本的统计梅尔频谱,确定该统计梅尔频谱的线性
拟合函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅尔频率对应的幅度
响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性函数;根据该线性
拟合函数和该M个子滤波器的数量,确定该M个子滤波器中每个子滤波器的起始频率和截止
频率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波器中每个子滤波器的起始频
率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样本的统
计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于该能量阈值;根
据该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子滤波器的幅度响
应值,建立该滤波器模型。

具体而言,在统计多个不同类型的梅尔频率域归一化幅度谱的基础上,通过线性
拟?#20808;?#23450;了梅尔频率域的M个子滤波器包络曲线,然后基于该包络曲线下统计能量均等的
原则,将梅尔频率域划分为若干区间,并以区间的起止频?#23454;?#20316;为该M个子滤波器中每个子
滤波器的起始频率和截止频率,建立梅尔频率域内的该M个子滤波器,使得多个不同类型的
异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量均
等。

应理解,统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量均等,表
示在统计梅尔频谱的频率域内,每个滤波器的起始频率、截止频率与包络曲线所围成的部
分面积相同。

可选地,该多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器
中的每个子滤波器上的输出能量的差值小于能量阈值,可以为该多个不同类型的异常声音
信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的均等。

可选地,该线?#38405;?#21512;函数根据上述公式(1)确定。

可选地,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;M+1个梅尔频?#23454;?#20013;每个梅尔频
?#23454;?#23545;应的梅尔频率由上述公式(2)或公式(3)确定。

可选地,该M个子滤波器中第i个子滤波器的幅度响应值Ai由上述公式(4)确定。

可选地,该M个子滤波器中的每个滤波器均为矩形滤波器。

可选地,其特征在于,该异常声音的类型包括:爆炸声、尖叫声、玻璃破碎声或枪
声。

应理解,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺
序应以其功能和内在逻辑确定,而不应对申请实施例的实施过程构成任何限定。

上文中结合图1至图4,详?#35813;?#36848;了根据本申请实施例的建立滤波器模型的方法和
异常声音的分类方法,下面将结合图5至图8,详?#35813;?#36848;根据本申请实施例的建立滤波器模
型的装置和异常声音的分类装置。

图5示出了本申请实施例提供的建立滤波器模型的装置500的示意性框图。该建立
滤波器模型的装置500包括M个子滤波器。

处理单元510,用于对多个不同类型的异常声音信号样本中每个异常声音信号样
本的梅尔频率谱进行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅
尔频谱;

确定单元520,用于根据该处理单元510处理得到的多个不同类型的异常声音信号
样本的统计梅尔频谱,确定该统计梅尔频谱的线?#38405;?#21512;函数,该线?#38405;?#21512;函数用于表示该
统计梅尔频谱中梅尔频率与该梅尔频率对应的幅度响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函
数包括第一线性函数和第二线性函数;

该确定单元520还用于根据该线?#38405;?#21512;函数和该M个子滤波器的数量,确定该M个
子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子滤波器的幅度响应值,其
中,该M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重
叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤
波器上的输出能量的差值小于能量阈值,M为大于1的整数;

建模单元530,用于根据该确定单元520确定的该M个子滤波器中每个子滤波器的
起始频率和截止频率,以及该每个子滤波器的幅度响应值,建立该滤波器模型。

可选地,该确定单元具体用于:由上述公式(1)确定该线?#38405;?#21512;函数A(fmel)。

可选地,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;确定单元具体用于:由上述公式
(2)或(3)确定该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;M+1个梅尔频?#23454;?#20013;每个梅尔频率
点对应的梅尔频率。

可选地,该确定单元具体用于:由上述公式(4)确定该M个子滤波器中第i个子滤波
器的幅度响应值Ai。

可选地,该M个子滤波器中的每个子滤波器均为矩形滤波器。

可选地,不同类型的异常声音信号样本包括:爆炸声、尖叫声、玻璃破碎声或枪声。

在一个可选例子中,本领域技术人员可以理解,建立滤波器模型的装置500可以具
体为上述实施例100中的建立滤波器模型的装置,建立滤波器模型的装置500可以用于执行
上述方法实施例100中与建立滤波器模型的装置对应的各个流程和/或步骤,为避免重复,
在此不再赘述。

图6示出了本申请实施例提供的异常声音的分类装置600的示意性框图。

处理单元610,用于对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整
数;

滤波单元620,用于根据滤波器模型对该处理单元得到的该N帧信号中的每帧信号
进行滤波处理,得到该异常声音信号的能量特征信息,该滤波器模型包括M个子滤波器,该M
个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多
个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的
输出能量的差值小于能量阈值,该异常声音信号的能量特征信息包括该N帧信号中的每帧
信号在该M个子滤波器中第i个子滤波器上输出的能量的和,M为大于1的整数,i为大于或等
于1且小于或等于M的整数;

确定单元630,用于根据该滤波单元得到的该异常声音信号的能量特征信息,确定
该异常声音信号的分类结果。

可选地,该确定单元具体用于:根据该异常声音信号的能量特征信息,确定该异常
声音信号的能量差分特征信息,该异常声音信号的能量差分特征信息包括该N帧信号中的
每帧信号在该第i个子滤波器上输出的差分能量的和,该N帧信号中第k帧信号在该第i个子
滤波器上输出的差分能量为第k+1帧信号与第k-1帧信号在该第i个子滤波器上输出的能量
的差值,k为大于1且小于N的整数;根据该异常声音信号的能量特征信息和该异常声音信号
的能量差分特征信息,确定该异常声音信号的分类结果。

可选地,该确定单元具体用于:对该异常声音信号的能量特征信息和该异常声音
信号的能量差分特征信息进行规范化处理,得到规范化能量特征信息和规范化能量差分特
征信息;根据该规范化能量特征信息和该规范化能量差分特征信息,确定该异常声音信号
的分类特征信息;根据该异常声音信号的分类特征信息,确定该异常声音信号的分类结果。

可选地,该确定单元具体用于由上述公式(5)确定该异常声音信号在该第i个子滤
波器上输出的能量mi;并由上述公式(6)确定该异常声音信号的能量特征信息

可选地,该确定单元具体用于由上述公式(7)确定该N帧信号中第k帧信号在该M个
子滤波器中的第i个子滤波器上输出的差分能量并由上述公式(8)确定该异常声音信
号在该第i个子滤波器上输出的差分能量Δi;由上述公式(9)确定该异常声音信号的能量
差分特征信息

可选地,该确定单元具体用于由上述公式(10)确定该规范化能量特征信息

可选地,该确定单元具体用于由上述公式(11)确定该规范化能量差分特征信息

可选地,该确定单元具体用于由上述公式(12)确定该异常声音信号的分类特征信

可选地,该分类装置还包括:建模单元,该建模单元用于在该根据滤波器模型对该
N帧信号中的每帧信号进行滤波处理,得到该异常声音信号的能量特征信息之前,建立该滤
波器模型,该滤波器模型包括该M个子滤波器。

可选地,该建模单元具体用于:对统计的多个不同类型的异常声音信号样本的梅
尔频率谱进行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅尔频
谱;根据该不同类型的异常声音信号样本的统计梅尔频谱,确定该统计梅尔频谱的线?#38405;?br />合函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅尔频率对应的幅度响
应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性函数;根据该线?#38405;?br />合函数和该M个子滤波器的数量,确定该M个子滤波器中每个子滤波器的起始频率和截止频
率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波器中每个子滤波器的起始频率
和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样本的统计
梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于该能量阈值;根据
该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子滤波器的幅度响应
值,建立该滤波器模型。

可选地,该建模单元具体用于由上述公式(1)确定该线?#38405;?#21512;函数A(fmel)。

可选地,该M个子滤波器包括M+1个梅尔频?#23454;悖?#35813;建模单元具体用于由上述公式
(2)或(3)确定该M+1个梅尔频?#23454;?#20013;每个梅尔频?#23454;?#23545;应的梅尔频率。

可选地,该M个子滤波器中的每个滤波器均为矩形滤波器。

可选地,该异常声音信号的分类结果为:该异常声音信号为爆炸声、尖叫声、玻璃
破碎声或枪声。

在一个可选例子中,本领域技术人员可以理解,异常声音的分类装置600可以具体
为上述实施例400中的异常声音的分类装置,异常声音的分类装置600可以用于执行上述方
法实施例400中与异常声音的分类装置对应的各个流程和/或步骤,为避免重复,在此不再
赘述。

应理解,这里的建立滤波器模型的装置500和异常声音的分类装置600可以以功能
单元的形式体?#24103;?#36825;里的术语“单元”可以指应用特有集成电路(Application Specific
Integrated Circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例
如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述
的功能的合适组件。

图7示出了本申请实施例提供的建立滤波器模型的装置700的示意性框图。如图7
所示,该建立滤波器模型的装置700包括处理器710和存储器720。

该处理器710具体用于:

对多个不同类型的异常声音信号样本中每个异常声音信号样本的梅尔频率谱进
行频谱归一化处理,得到该多个不同类型的异常声音信号样本的统计梅尔频谱;

根据该多个不同类型的异常声音信号样本的统计梅尔频谱,确定该统计梅尔频谱
的线?#38405;?#21512;函数,该线?#38405;?#21512;函数用于表示该统计梅尔频谱中梅尔频率与该梅尔频率对应
的幅度响应值之间的?#25104;?#20851;系,该线?#38405;?#21512;函数包括第一线性函数和第二线性函数;

根据该线?#38405;?#21512;函数和该M个子滤波器的数量,确定该M个子滤波器中每个子滤波
器的起始频率和截止频率,以及该每个子滤波器的幅度响应值,其中,该M个子滤波器中每
个子滤波器的起始频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异
常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值
小于能量阈值,M为大于1的整数;

根据该M个子滤波器中每个子滤波器的起始频率和截止频率,以及该每个子滤波
器的幅度响应值,建立该滤波器模型。

可选地,该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令
和数据。存储器的一部分还可以包括?#19988;资运?#26426;存取存储器。例如,存储器还可?#28304;?#20648;设
备类型的信息。该处理器710可以用于执行存储器中存储的指令,并且该处理器执行该指令
时,该处理器可以执行上述方法实施例中与建立滤波器模型的装置对应的各个步骤。

在一个可选例子中,本领域技术人员可以理解,建立滤波器模型的装置700可以具
体为上述实施例100中的建立滤波器模型的装置,建立滤波器模型的装置700可以用于执行
上述方法实施例100中与建立滤波器模型的装置对应的各个流程和/或步骤,为避免重复,
在此不再赘述。

图8示出了本申请实施例提供的异常声音的分类装置800的示意性框图。如图8所
示,该异常声音的分类装置800包括处理器810和存储器820。

该处理器810具体用于:

对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;

根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异常声音信号
的能量特征信息,该滤波器模型包括M个子滤波器,该M个子滤波器中每个子滤波器的起始
频率和截止频率组成的频率区间连续?#19968;?#19981;重叠,且多个不同类型的异常声音信号样本的
统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈值,该
异常声音信号的能量特征信息包括该N帧信号中的每帧信号在该M个子滤波器中第i个子滤
波器上输出的能量的和,M为大于1的整数,i为大于或等于1且小于或等于M的整数;

根据该异常声音信号的能量特征信息,确定该异常声音信号的分类结果。可选地,
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的
一部分还可以包括?#19988;资运?#26426;存取存储器。例如,存储器还可?#28304;?#20648;设备类型的信息。该
处理器810可以用于执行存储器中存储的指令,并且该处理器执行该指令时,该处理器可以
执行上述方法实施例中与异常声音的分类装置对应的各个步骤。

在一个可选例子中,本领域技术人员可以理解,异常声音的分类装置800可以具体
为上述实施例400中的异常声音的分类装置,异常声音的分类装置800可以用于执行上述方
法实施例400中与异常声音的分类装置对应的各个流程和/或步骤,为避免重复,在此不再
赘述。

应理解,在本申请实施例中,处理器可以是中央处理单元(Central Processing
Unit,CPU),处理器还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路
(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器
等。

在实?#27490;?#31243;中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者
软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器
执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储
器,闪存、只读存储器,可编程只读存储器或者电可?#21015;?#21487;编程存储器、寄存器等本领域成
熟的存储介质中。该存储介质位于存储器,处理器执行存储器中的指令,结合其硬件完成上
述方法的步骤。为避免重复,这里不再详?#35813;?#36848;。

应理解,本文中术语“和/或?#20445;?#20165;仅是一?#32622;?#36848;关联对象的关联关系,表示可?#28304;?br />在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,本文中字符“/?#20445;?#19968;般表示前后关联对象是一种“或”的关系。

应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺
序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施
过程构成任何限定。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单
元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实?#24103;?#36825;些功能究竟
以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员
可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出
本申请的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、
装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以
通过其它的方式实?#24103;?#20363;如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的
划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件
可以结合或者可以集成到另一个系?#24120;?#25110;一些特征可以忽略,或不执行。另一点,所显示或
讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦
合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件?#24471;?#30340;单元可以是或者也可以不是物理上分开的,作为单元显
示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请各实施例方
案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以
是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以
存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存
储器(RAM,Random Access Memory)、磁碟或者光盘等各种可?#28304;?#20648;程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何
熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,?#21152;?#28085;
盖在本申请的保护范围之内。因此,本申请的保护范围应?#36816;?#36848;权利要求的保护范围为准。

关于本文
本文标题:异常声音的分类方法和装置.pdf
链接地址:http://www.pqiex.tw/p-6079897.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 天顺娱乐怎么样 e球彩红号 波克千炮捕鱼达人2.9 百人牛牛压注技巧 泰国泰拳比赛 德州扑克现金比赛 四川老时时 股票网站赚钱 福建怏三定位走势图 重庆时时升降图