平码五不中公式规律
  • / 22
  • 下载费用:30 金币  

用于使用谐波后置滤波器来处理音频信号的装置及方法.pdf

关 键 ?#21097;?/dt>
用于 使用 谐波 后置 滤波器 处理 音频 信号 装置 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201580040785.8

申请日:

2015.07.24

公开号:

CN106663444A

公开日:

2017.05.10

当前法律状态:

实审

有效性:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G10L 19/26申请日:20150724|||公开
IPC分类号: G10L19/26(2013.01)I; G10L21/02(2013.01)I 主分类号: G10L19/26
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 以马利·拉韦利; 克里斯汀·赫姆瑞希; 戈兰·马尔科维奇; 马蒂亚斯·诺?#21015;?#26684;; 萨沙·迪施; 曼努埃尔·扬德尔; 马丁·迪茨
地址: 德国慕尼黑
优?#28909;ǎ?/td> 2014.07.28 EP 14178820.8
专利代理机构: 中科专利商标代理有限责任公司 11021 代理人: 黄亮
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201580040785.8

授权公告号:

|||

法律状态公告日:

2017.06.06|||2017.05.10

法律状态类型:

实质审查的生效|||公开

摘要

一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置,包括:域转换器(100),用于将音频信号的第一域表示转换为音频信号的第二域表示;以及谐波后置滤波器(104),用于对音频信号的所述第二域表示进行滤波,其中所述后置滤波器基于包括分子和分母在内的传递函数,其中所述分子包括由所述增益信息指示的增益值,并且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后的小数部分的多抽头滤波器。

权利要求书

1.一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置,包括:
域转换器(100),用于将音频信号的第一域表示转换为音频信号的第二域表示;以及
谐波后置滤波器(104),用于对音频信号的所述第二域表示进行滤波,其中所述后置滤
波器基于包括分子和分母在内的传递函数,所述分子包括由所述增益信息指示的增益值,
并且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞
后的小数部分的多抽头滤波器。
2.根据权利要求1所述的装置,其中,所述后置滤波器的传递函数在分子中包括用于所
述音调滞后的零小数部分的另一多抽头FIR滤波器。
3.根据权利要求1或2所述的装置,其中,所述分母包括所述多抽头滤波器和所述增益
值之间的乘积。
4.根据前述权利要求之一所述的装置,其中,所述分子还包括第一标量值和第二标量
值的乘积,所述分母包括所述第二标量值而不是所述第一标量值,所述第一标量值和所述
第二标量值是预定的并且具有大于0且小于的值,并且所述第二标量值低于所述第一标量
值。
5.根据权利要求4所述的装置,还包括:
滤波器控制器(114),被配置用于根据比特率来设置所述第二标量值,其中频率-时间
转换器(100)按所述比特率操作,当所述比特率具有第一值时,所述第二标量值被设置为第
一值,当所述比特率具有第二值时,所述第二标量值被设置为第二值,所述比特率的所述第
二值低于所述比特率的所述第一值,并且所述第二标量值的所述第二值大于所述第二标量
值的所述第一值。
6.根据权利要求4或5所述的装置,其中,所述第一标量值被设置在0.6和1.0之间,并且
所述第二标量值被设置在0.1和0.5之间。
7.根据前述权利要求之一所述的装置,
其中,所述后置滤波器具有基于以下等式的极-零表示中的传递函数H(z):
<mrow> <mi>H</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&alpha;</mi> <mi>&beta;</mi> <mi>g</mi> <mi>B</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>,</mo> <mn>0</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mi>&beta;</mi> <mi>g</mi> <mi>B</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>,</mo> <msub> <mi>T</mi> <mrow> <mi>f</mi> <mi>r</mi> </mrow> </msub> <mo>)</mo> </mrow> <msup> <mi>z</mi> <mrow> <mo>-</mo> <msub> <mi>T</mi> <mi>int</mi> </msub> </mrow> </msup> </mrow> </mfrac> </mrow>
其中,α是第一标量值,β是第二标量值,B(z,0)是用于零小数部分音调滞后的多抽头滤
波器,B(z,Tfr)是取决于音调滞后的小数部分的多抽头滤波器,Tint是音调滞后的整数部分,
Tfr是音调滞后的小数部分,并且g是由增益信息指示的增益值,z是z平面中的变量。
8.根据前述权利要求之一所述的装置,其中,所述多抽头滤波器是有限冲激响应(FIR)
滤波器并且具有至少三个抽头。
9.根据前述权利要求之一所述的装置,
其中,所述分母中的多抽头滤波器包括?#27597;?#25277;头,对于零小数部分,第一抽头在0.0和
0.1之间,第二抽头在0.2和0.3之间,第三抽头在0.5和0.6之间,并且第四抽头在0.2和0.3
之间,
其中,对于第一小数部分,所述多抽头滤波器包括?#27597;?#28388;波器抽头,第一抽头在0.0和
0.1之间,第二抽头在0.3和0.4之间,第三抽头在0.45和0.55之间,并且第四抽头在0.1和
0.2之间,
其中,对于第二小数部分,所述多抽头滤波器包括?#27597;?#28388;波器抽头,第一抽头在0.0和
0.1之间,第二抽头在0.35和0.45之间,第三抽头在0.35和0.45之间,并且第四抽头在0.0和
0.1之间,
其中,对于第三小数部分,所述多抽头滤波器包括?#27597;?#28388;波器抽头,第一抽头在0.1和
0.2之间,第二抽头在0.45和0.55之间,第三抽头在0.3和0.4之间,并且第四抽头在0.0和
0.1之间,
其中,所述第三小数部分大于所述第二小数部分,并且所述第二小数部分大于所述第
一小数部分。
10.根据前述权利要求之一所述的装置,
其中,所述后置滤波器被配置为具有负频谱倾斜,以补偿所述谐波后置滤波器的能量
损失,或者
其中,所述后置滤波器被配置为?#31181;?#24103;中谐波之间的能量的量,所?#31181;频?#33021;量的量小
于帧中的时域表示的总能量的20%。
11.根据前述权利要求之一所述的装置,
其中,所述域转换器是频率-时间转换器,所述第一域是频域并且所述第二域是时域,
或者
其中,所述域转换器是LPC?#36763;?#26102;间转换器,所述第一域是LPC?#36763;?#22495;并且所述第二域
是时域。
12.一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的方法,包括:
将音频信号的频率表示转换(100)为音频信号的时域表示;以及
通过谐波后置滤波器(104)对音频信号的所述时域表示进行滤波,其中所述后置滤波
器基于包括分子和分母在内的传递函数,所述分子包括由所述增益信息指示的增益值,并
且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后
的小数部分的多抽头滤波器。
13.一种用于处理音频信号的?#20302;常?#35813;?#20302;?#21253;括用于对音频信号进行编码的编码器和
包含处理器在内的解码器,所述处理器包括:
域转换器(100),用于将音频信号的频率表示转换为音频信号的时域表示;以及
谐波后置滤波器(104),用于对音频信号的所述时域表示进行滤波,
其中,所述后置滤波器基于包括分子和分母在内的传递函数,所述分子包括由增益信
息指示的增益值,并且所述分母包括由音调滞后信息指示的音调滞后的整数部分和取决于
所述音调滞后的小数部分的多抽头滤波器。
14.根据权利要求13所述的?#20302;常?#20854;中,所述编码器包括:音调滞后计算器(402,404,
406),用于计算音调滞后的整数部分和小数部分;以及增益计算器(410,412),用于计算增
益值;以及编码信号形成器(414),用于生成包括音调滞后信息和增益信息在内的编码信号
(102)。
15.一种处理音频信号的方法,该方法包括对音频信号进行编码的方法和解码的方法,
包括:
将音频信号的频率表示转换(100)为音频信号的时域表示;以及
使用谐波后置滤波器(104)对音频信号的所述时域表示进行滤波,其中所述后置滤波
器基于包括分子和分母在内的传递函数,所述分子包括由增益信息指示的增益值,并且所
述分母包括由音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后的小数部
分的多抽头滤波器。
16.一种计算机程序,当所述计算机程序在计算机或处理器上运行时,用于执行根据权
利要求12或权利要求15所述的方法。

说明书

用于使用谐波后置滤波器来处理音频信号的装置及方法

技术领域

本发明涉及音频处理,且具体地涉及使用谐波后置滤波器的音频处理。

背景技术

基于变换的音频编解码器在处理谐波音频信号时,特别是在低比特率时,一般引
入间谐波噪声(inter-harmonic noise)。

由于由较短的变换大小和/或较差的窗口频率响应引入的较差的频率分辨率和/
或选择性,当基于变换的音频编解码器以低延迟操作时,这种影响进一步恶化。

这种间谐波噪声一般被感知为非常恼人的失真(artifact),当在高度音音频材料
上主观评估时,其显著?#26723;?#22522;于变换的音频编解码器的性能。

存在若干种解决方案来改善基于变换的音频编解码器对于谐波音频信号的主观
质量。所有这些都以基于预测的技术为基础,无论是在变换域中还是在时域中。

变换域方法的示例如下:

●[1]H.Fuchs,“Improving MPEG Audio Coding by Backward Adaptive Linear
Stereo Prediction”,99th AES Convention,New York 1995,Preprint 4086.

●[2]L.Yin,M.Suonio,M.“A New Backward Predictor for MPEG
Audio Coding”,103rd AES Convention,New York 1997,Preprint 4521

●[3]Juha MauriLin Yin,“Long Term Predictor for
Transform Domain Perceptual Audio Coding”,107th AES Convention,New York 1999,
Preprint 5036.

时域方法的示例如下:

●[4]Philip J.Wilson,Harprit Chhatwal,“Adaptive transform coder
having long term predictor”,U.S.Patent 5,012,517,April 30,1991.

●[5]Jeongook Song,Chang-Heon Lee,Hyen-O Oh,Hong-Goo Kang,“Harmonic
Enhancement in Low Bitrate Audio Coding Using and Efficient Long-Term
Predictor”.EURASIP Journal on Advances in Signal Processing 2010.

●[6]Juin-Hwey Chen,“Pitch-based pre-filtering and post-filtering for
compression of audio signals”,U.S.Patent 8,738,385,May 27,2014.

发明内容

本发明的目的是提供用于处理音频信号的改善型构思。

通过权利要求1的用于处理音频信号的装置、权利要求12的用于处理音频信号的
方法、权利要求13的?#20302;场?#26435;利要求17的用于操作?#20302;?#30340;方法或权利要求18的计算机程序
来实?#25351;?#30446;的。

本发明基于如下发现?#21644;?#36807;使用具有包括分子和分母在内的传递函数的谐波后置
滤波器,可以充分地改善音频信号的主观质量。传递函数的分子包括由发送增益信息指示
的增益值,并且分母包括由音调滞后信息指示的音调滞后的整数部分和取决于音调滞后的
小数部分的多抽头滤波器。

因此,可以去除由典型的域变化音频解码器引入的作为失真的间谐波噪声。这种
谐波后置滤波器的特别有用之处在于其?#35272;?#20110;发送的信息,即在解码器中始终可用的音调
增益和音调滞后,因为该信息是经由解码器输入信号从相应的编码器接收的。此外,后置滤
波因为以下事实而具有特定的精度:不仅考虑音调滞后的整数部分,而?#19968;?#32771;虑音调滞后
的小数部分。音调滞后的小数部分可以经由多抽头滤波器特别地引入到后置滤波器中,其
中该多抽头滤波器具有实际上取决于音调滞后的小数部分的滤波器系数。该滤波器可以实
现为FIR滤波器,或者?#37096;?#20197;实现为诸如IIR滤波器之类的任何其他滤波器或不同的滤波器
实?#24103;?#21487;以通过本发明的后置滤波器概念来有利地改进任何域变化,诸如时间到频?#26102;?#21270;
或LPC到时间变化或时间到LPC变化或频率到时间变化。然而,优选地,域变化是频率到时间
域变化。

因此,本发明的实施例?#26723;?#20102;由基于在时域中工作的长期预测器的变换音频编解
码器所引入的间谐波噪声。与使用变换编码之前的前置滤波器和变换解码之后的后置滤波
器二者的[04]-[6]相比,本发明优选地仅应用后置滤波器。

此外,已经注意到,在[04]-[6]中采用的前置滤波器具有在给予变换编码器的输
入信号中引入不稳定性的趋势。这些不稳定性是由于帧之间的增益和/或音调滞后的变化
所引起的。变换编码器难以对这种不稳定性进行编码,特别是在低比特率下,并且与没有任
何前置或后置滤波器的情况相比,有时在解码信号中将引入更多的噪声。

优选地,本发明根本不采用任何前置滤波器,因此完全避免了涉及前置滤波器的
问题。

此外,本发明?#35272;?#20110;在变换编码之后应用于解码信号的后置滤波器。该后置滤波
器基于考虑音调滞后的整数部分和小数部分的长期预测滤波器,这减少了由变换音频编解
码器引入的间谐波噪声。

为了更好的鲁棒性,后置滤波器参数音调滞后和音调增益在编码器侧?#36824;兰疲?#24182;
在比特流中被发?#27712;?#28982;而,在其他实?#31181;校?#36824;可以基于由音频解码器获得的解码音频信号在
解码器侧?#20848;?#38899;调滞后和音调增益,其中所述音频解码器包括用于将音频信号的频率表示
转换为音频信号的时域表示的频率-时间转换器。

在优选实施例中,分子还包括用于音调滞后的零小数部分的多抽头滤波器,以便
补偿由分母中的多抽头滤波器引入的取决于音调滞后的小数部分的频谱倾斜。

优选地,后置滤波器被配置为?#31181;?#24103;中谐波之间的能量的量,其中?#31181;频?#33021;量的
量小于帧中的时域表示的总能量的20%。

在另一实施例中,分母包括多抽头滤波器和增益值之间的乘积。

在另一实施例中,滤波器分子还包括第一标量值和第二标量值的乘积,其中分母
仅包括第二标量值而非第一标量值。这些标量值被设置为预定值,并且具有大于0且小于1
的值;并且另外,第二标量值低于第一标量值。因此,可以以非常有效的方式来设置通常不
期望的能量移除特性,并且附加地设置滤波器强度,即滤波器对变换域解码器输出信号中
的间谐波失真加以衰减的强?#21462;?br />

在优选实施例中,该装置还包括滤波器控制器,用于根据比特率来设置至少第二
标量值,使得对较低比特率设置较高的值,反之亦然。

此外,滤波器控制器被配置为根据音调滞后的小数部分以信号相关的方式来选择
相应的多抽头滤波器,以便信号自适应地(即?#35272;?#20110;实际提供的音调滞后的小数部?#31181;?设
置谐波后置滤波器。

附图说明

以下在附图的上下文中讨论本发明的优选实施例,附图中:

图1示出了用于对音频信号进行处理的本发明装置的实施例;

图2示出了表示为z域中的传递函数的谐波后置滤波器的优选实现;

图3示出了由z域中的传递函数表示的谐波后置滤波器的另一优选实施例;

图4示出了用于生成要由图1所示的变换域音频解码器来解码的编码信号的编码
器的优选实现;

图5示出了作为由滤波器控制器控?#39057;腇IR滤波器的多抽头滤波器的优选实现;

图6示出了滤波器控制器和具有根据小数部分预先存储的抽头权重的存储器之间
的协作;

图7a示出了具有零α值的滤波器的频率响应;

图7b示出了α值等于1的优选谐波后置滤波器的频率响应;

图7c示出了α值为0.8的优选谐波后置滤波器的频率响应;

图8a示出了β值等于0.4的谐波后置滤波器的优选实施例;以及

图8b示出了β值为0.2的谐波后置滤波器的频率响应。

具体实施方式

图1示出了用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置。
该增益信息可以经由接收编码信号的解码器输入102被发送到解码器100,或者备选地,当
该信息不可用时,可以在解码器本身中计算该信息。然而,对于更鲁棒的操作,优选地在编
码器侧计算音调滞后信息和音调增益信息。

解码器100包括例如用于将音频信号的频率-时间表示转换为音频信号的时域表
示的频率-时间转换器。因此,解码器不是纯时域语音编解码器,而包括纯变换域解码器或
混合变换域解码器或在与时域不同的域中操作的任何其他编码器。此外,优选地,第二域是
时域。

该装置还包括用于对音频信号的时域表示进行滤波的谐波后置滤波器104,并且
该谐波后置滤波器基于包括分子和分母在内的传递函数。具体地,分子包括由增益信息指
示的增益值,并且分母包括由音调滞后信息指示的音调滞后的整数部分,以及重要地,还包
括取决于音调滞后的小数部分的多抽头滤波器。

图2中示出了具有传递函数H(z)的该谐波后置滤波器的优选实?#24103;?#35813;滤波器接收
解码器输出信号106,并让该解码输出信号经过后置滤波操作以获得后置滤波输出信号
108。该后置滤波输出信号可以作为处理信号输出,或者可以通过用于去除由后置滤波操作
引入的任何不连续性的任何过程来进一步处理,当然,该后置滤波操作是信号相关的,即,
可以逐帧地变化。该不连续性去除操作可以是任何公知的不连续性去除操作,例如交叉衰
落(cross-fading),这意味着较早的帧被淡出并且同时新的帧被淡入,并且优选地,衰落特
性使得在整个交叉衰落操作中各衰落因子加起来为一。然而,?#37096;?#20197;应用诸如低通滤波或
LPC滤波之类的其他不连续性去除。

图1所示的用于处理音频信号的装置还包括多抽头滤波器信息存储器112和滤波
器控制器114。具体地,滤波器控制器114从解码器100接收边信息(side information)116,
并且该边信息例如可以是音调增益信息g和音调滞后信息,即,关于音调滞后的整数部分
Tint和音调滞后的小数部分Tfr的信息。该信息对于逐帧地设置谐波后置滤波器以及附加地
对于选择多抽头滤波器信息B(z,Tfr)是有用的。此外,诸如由解码器应用的比特率或解码信
号下的采样率之类的附加信息?#37096;?#20197;由滤波器控制器114使用,以便尤其是相对于比特率
和采样率来设置用于特定编码器和/或解码器设置的标量值α、β。

图2示出了本领域中已知的z域中的滤波器传递函数H(z)的极(pole)/零表示。自
然地,存在全部是滤波器表示的谐波后置滤波器的许多其他表示,其可以被转换为z域中的
这种极/零表示。因此,本发明可应用于可通过如说明书中所示的这种传递函数以任何方式
描述的每个滤波器。

图3示出了谐波后置滤波器的优选实施例,其再次被描述为z域中的极/零表示法
中的传递函数。

该滤波器可以被如下描述:


其中,g是解码增益,Tint和Tfr是解码音调滞后的整数和小数部分,α和β是对增益进
行加权的两个标量,并且B(z,Tfr)是其系数取决于解码音调滞后的小数部分的低通FIR滤波
器。

注意到,H(z)的分子中的B(z,0)用于补偿由B(z,Tfr)引入的倾斜。

β用于控制后置滤波器的强?#21462;&?#31561;于1产生全效,从而?#31181;?#35856;波之间的最大可能量
的能量。β等于0禁用后置滤波器。一般,相当低的值被用于不?#31181;?#35856;波之间太多的能量。该
值还可以取决于比特?#21097;?#22312;较低比特率时具有较高值,例如,低比特率时为0.4,高比特率时
为0.2。

α用于向H(z)的频率响应添加轻微的倾斜,以便补偿能量在低频中的轻微损失。α
的值一般选为接近1,例如0.8。

图6中给出了B(z,Tfr)的示例。B(z,Tfr)的阶数和系数还可以取决于比特率和输出
采样率。可以针对比特率和输出采样率的每个组合来设计和调谐不同的频率响应。

具体地,已经发现甚至0.6和小于1.0之间的α的值也是有用的,并且附加地,0.1和
0.5之间的β值也已被证明是有用的。

此外,多抽头滤波器可以具有可变数量的抽头。已经发现,对于某些实现,?#27597;?#25277;
头是足够的,其中一个抽头是z+1。然而,仅具有两个抽头的较小滤波器或者甚至具有多于四
个抽头的更大滤波器对于某些实现是有用的。

图6示出了针对音调滞后的不同小数值的滤波器B(z)的优选实现,特别是针对1/4
的音调滞后分辨率。对于该实现,示出了对于谐波后置滤波器的传递函数的分母中的多抽
头滤波器的?#27597;?#19981;同的滤波器描述。然而,已经发现,滤波器系数不必精确地指示图6中所
示的值,而是+/-0.05的某些变化?#37096;?#22312;其他实?#31181;?#26159;有用的。

具体地,如图1中所示,将图6中所示的抽头权重存储在用于多抽头滤波器信息的
存储器112内。滤波器控制器114从图1的线116接收小数部分Tfr,并且响应于该值,寻址存储
器112,以便经由检索线200来检索用于音调滞后的特定小数部分的特定滤波器信息。然后,
该信息经由输出线202被转发到谐波后置滤波器104,使得谐波后置滤波器被正确地设置。
图5中示出了多抽头FIR滤波器的特定实?#24103;?#26435;重指示w1至w4对应于图6中的符号,并且滤波
器控制器114响应于音调滞后的实际小数部分而应用特定音频帧的对应权重。诸如延迟部
分501、502、503和组合器505之类的其他部分可以如图所示地实?#24103;?#22312;此上下文中,强调的
是,延迟值501在z符号中是负延迟值,因为已经发现除了诸如503和504之类的正延迟值之
外还具有负延迟值的FIR滤波器表示是特别有用的。

随后,图4中示出了具有某些功能块并?#20197;?#27809;有任何前置滤波器的情况下操作的
优选编码器实?#24103;?#22270;4中示出的滤波器部分包括音调?#20848;?#22120;402、音调求精器404、小数部分
?#20848;?#22120;406、瞬态检测器408、增益?#20848;?#22120;410和增益量化器412。由增益量化器412、小数部分
?#20848;?#22120;406、音调求精器404提供的信息和由瞬态检测器408生成的判定比特(decision
bit)被输入到编码信号形成器414中。编码信号形成器提供编码信号102,其随后被输入到
图1所示的解码器100中。编码信号102将包括图4中未示出的附加信号信息。

随后,描述音调?#20848;?#22120;402的功能。

?#20848;?#27599;帧的一个音调滞后(整数部分+小数部分)(帧大小,例如20ms)。这通过3个
步骤来实现,以?#26723;透叢有?#24182;提高?#20848;?#31934;?#21462;?br />

使用产生?#20132;?#38899;调演进轮廓的音调分析算法(例如在Rec.ITU-T G.718的第6.6节
中描述的Open-loop pitch analysis(开环音调分析))。该分析一般逐子帧(子帧大小,例
如10ms)进行,且产生每子帧一个的音调滞后?#20848;啤?#27880;意,这些音调滞后?#20848;?#19981;具有任何小
数部分,并且一般针对下采样信号(采样?#21097;?#20363;如6400Hz)进行?#20848;啤?#25152;使用的信号可以是任
何音频信号,例如在Rec.ITU-T G.718的第6.5节中描述的LPC加权音频信号。

音调求精器如下操作:

针对以核心编码器采样率运行的音频信号x[n]来?#20848;?#38899;调滞后的最终整数部分,
该核心编码器采样率一般高于在a中使用的下采样信号的采样率(例如12.8kHz、16kHz、
32kHz...)。信号x[n]可以是任何音频信号,例如LPC加权音频信号。

音调滞后的整数部分则是使得自相关函数最大化的滞后dm


其中,d在步骤1.a中?#20848;频?#38899;调滞后T附近。

T-δ1≤d≤T+δ2

小数部分?#20848;?#22120;406如下操作:

通过对在步骤2.b中计算的自相关函数C(d)进行插值并选择使得插值后的自相关
函数最大化的小数音调滞后,来?#19994;?#23567;数部分。可以使用例如在Rec.ITU-T G.718的第
6.6.7节中描述的低通FIR滤波器来执行插值。

图4中所示的瞬态检测器408被配置为生成判定比特。

如果输入音频信号不包含任何谐波含量,则在比特流中没有参数被编码。只发送1
比特,使得解码器知晓其是否必须对后置滤波器参数进行解码。基于以下若干参数进?#20449;?br />定:

a.在步骤1.b中?#20848;频?#25972;数音调滞后处的归一化相关。


如果输入信号可由整数音调滞后所完美预测,则归一化相关为1,如果根本不?#31245;?br />测,则归一化相关为0。然后,高值(接近1)将指示谐波信号。对于更鲁棒的判定,还可以在判
定中使用过去帧的归一化相关,例如:

如果(norm.corr(curr.)*norm.corr.(prev.))>0.25,则当前帧包含某些谐波含
量(比特=1)

b.由瞬态检测器计算的特征(例如,时间平坦度(Temporal flatness)测量、最大
能量变化),以避免对包含瞬态的信号激活后置滤波器,例如:

如果(tempFlatness>3.5或maxEnergychange>3.5),则设置比特=0,并且不发
送任何参数。

此外,增益?#20848;?#22120;410计算要输入到增益量化器412中的增益。

一般以核心编码器采样?#25910;?#23545;输入音频信号来?#20848;?#22686;益,但是它?#37096;?#20197;是像LPC
加权音频信号的任何音频信号。该信号记为y[n],并且可以与x[n]相同或不同。

首先通过使用以下滤波器对y[n]进行滤波来?#19994;統[n]的预测yP[n]


其中,Tint是(在1.b中?#20848;频?音调滞后的整数部分,并且B(z,Tfr)是其系数取决于
(在1.c中?#20848;频?音调滞后Tfr的小数部分的低通FIR滤波器。

当音调滞后分辨率为1/4时B(z)的一个示例如下:





然后,如下计算增益g:


并且限制在0和1之间。

最后,使用例如均匀量化,在例如2比特上对增益进行量化。

如果增益被量化为0,则在比特流中没有参数被编码,只有一个判定比特(比特=
0)。

如前所述,后置滤波器在变换解码器之后应用于输出音频信号。它逐帧处理信号,
且与在编码器侧使用的相同的帧大小,例如20ms。如图所示,它基于长期预测滤波器H(z),
长期预测滤波器H(z)的参数是根据在编码器侧?#20848;频?#24182;且从比特流中解码的参数来确定
的。该信息包括判定比特、音调滞后和增益。如果判定比特为0,则音调滞后和增益不被解
码,并且被假设为0,根本未被写入比特流中。

如所讨论的,如果滤波器参数从一个帧到下一个帧不同,则可在两个帧之间的边
界处引入不连续性。为了避免不连续性,应用不连续性去除器,例如交叉衰落器或用于该目
的的任何其他实?#24103;?br />

此外,图7a至图8b中示出了用于设置谐波后置滤波器的若干种不同方式。曲线图
示出了频域传递函数。横轴与归一化频率1相关,且纵轴是以dB为单位的滤波器响应的幅
?#21462;?#35201;强调的是:在除图7b以外的所有图示中,滤波器对低频引入放大,即特定正dB幅度值。

具体地,图7a示出了实?#28382;?中的滤波器的传递函数,具有如上所示的特定参数
值。此外,α值(即第一标量值)被设置为0。图7b示出了类似情况,但是现在α值等于1。其他参
数与图7a相同。

图7c示出了α等于0.8的另一实现,其具有轻微的倾斜以及较低频率的提升。再次,
图7具有与图7a所示相同的其他参数。变得清楚的是,α等于1去除了倾斜,并且所有谐波频
率的增益为1。这种设置的缺点是在谐波之间的频率处的能?#20811;?#22833;。因此,优选地,如图7c所
示,α的值等于0.8。与图7b的α等于1的情况相比,该值添加了轻微的倾斜。为了补偿谐波之
间的频率处的能?#20811;?#22833;,优选地使用这种轻微的倾斜。

此外,图8a和图8b示出了针对α的值等于0.8和不同β值(即,图8a中的β值为0.4,图
8b中的β值为0.2)的滤波器设置。变得清楚的是,与0.2的β值相比,0.4的β值具有更强的后
置滤波效果,且因此在较低比特率处使用0.4的β值,以去除由这样的低比特率引入的间谐
波噪声。

另一方面,β等于0.2对于?#31181;?#35856;波之间的能量具有没那么强的效果,因此,由于在
这种较高比特率处并不存在如此多的间谐波噪声的事实,该β值对于高比特率是优选的。

虽然已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示
对相应方法的描述,其中,框或设备对应于方法步骤或方法步骤的特征。类?#39057;兀?#22312;方法步
骤的上下文中描述的方面也表示对相应装置的相应块或项或者特征的描述。可以由(或使
用)硬件装置(诸如,微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在
一些实施例中,可以由这种装置来执行最重要方法步骤中的某一个或多个方法步骤。

本发明的经发送或经编码的信号可以存储在数?#25191;?#20648;介质上或可以在诸如无线
发送介质或有线发送介质之类的发送介质(例如,互联网)上发?#27712;?br />

取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以通过
使用其上存储有电子可读控制信号的数?#25191;?#20648;介质(例如,软盘、DVD、Blu-Ray、CD、ROM、
PROM和EPROM、EEPROM或闪存)来执行所述实现方案,所述控制信号与可编程计算机?#20302;?#21512;
作(或能够与之合作),使得执行各个方法。因此,数?#25191;?#20648;介质可以是计算机可读的。

根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控
制信号能够与可编程计算机?#20302;?#21327;作从而执行本文所述的方法之一。

一般地,本发明的实施例可以实现为具?#35856;?#24207;代码的计算机程序产品,程序代码
可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机
器可读载体上。

其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本
文所述的方法之一。

换言之,本发明方法的实施例因此是具?#35856;?#24207;代码的计算机程序,该程序代码用
于在计算机程序在计算机上运行时执行本文所述的方法之一。

因此,本发明方法的另一实施例是数据载体(或诸如数?#25191;?#20648;介质或计算机可读
介质之类的非暂时?#28304;?#20648;介质),包含记录于其上的用于执行本文所述方法之一的计算机
程序。数据载体、数?#25191;?#20648;介质或记录介质通常是有形的和/或非暂时性的。

因此,本发明方法的另一实施例是表示用于执行本文所述的方法之一的计算机程
序的数据流或信号序?#23567;?#25968;据流或信号序列可以例如被配置为经由数据通信连接(例如,经
由互联网)传?#27712;?br />

另一实施例包括处理装置,例如,被配置为或适用于执行本文所述的方法之一的
计算机或可编程逻辑器件。

另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所
述的方法之一。

根据本发明的另一实施例包括被配置为向接收机(例如,以电子方式或以光学方
式)传输计算机程序的装置或?#20302;常?#35813;计算机程序用于执行本文所述的方法之一。接收机可
以是例如计算机、移动设备、存储设备?#21462;?#35813;装置或?#20302;?#21487;以例如包括用于向接收机传输计
算机程序的文件服务器。

在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文
所述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可以与微处理器协作
以执行本文所述的方法之一。通常,方法优选地由?#25105;?#30828;件装置来执行。

上述实施例对于本发明的原理仅是说明性的。应当理解的是:本文所述的布置和
?#38468;?#30340;修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权
利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体?#38468;?#26469;限
制。

关于本文
本文标题:用于使用谐波后置滤波器来处理音频信号的装置及方法.pdf
链接地址:http://www.pqiex.tw/p-6091687.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网?#31350;头?/a> - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 pk10直播开奖赛车 竞彩足球比分即时比分 快3计划软件全天平台 狠赚钱 重庆老时时开奖结果 凤凰网官网 娱乐 ag技巧攻略 捕鱼来了养鱼池攻略 体育赛事票务 北京pk拾赛车免费计划