平码五不中公式规律
  • / 10
  • 下载费用:30 金币  

音频信号处理系统和音频信号处理方法.pdf

关 键 ?#21097;?/dt>
音频 信号 处理 系统 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201611101545.7

申请日:

2016.12.05

公开号:

CN106683684A

公开日:

2017.05.17

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G10L 21/0216申请日:20161205|||公开
IPC分类号: G10L21/0216(2013.01)I; G10L25/21(2013.01)I; G10L15/00(2013.01)N 主分类号: G10L21/0216
申请人: 上海木爷机器人技术有限公司
发明人: 蒋化冰; 齐鹏举; 方园; 米万珠; 舒剑; 吴琨; 管伟; 罗璇; 罗?#34892;? 张海建
地址: 200336 上海市长宁区广顺路33号2幢402室
优?#28909;ǎ?/td>
专利代理机构: ?#26412;?#22826;合九思知识产权代理有限公司 11610 代理人: 刘戈
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201611101545.7

授权公告号:

|||

法律状态公告日:

2017.06.09|||2017.05.17

法律状态类型:

实质审查的生效|||公开

摘要

本发明实施例提供一种音频信号处理系统和音频信号处理方法,该系统包括:由N个麦克风组成的麦克风阵列,控制器,连接组件和降噪组件;其中,N个麦克风呈圆环状分布,降噪组件的输入端包括N??1个主麦克接口和1个辅麦克接口;N个麦克风分别与控制器连接,用于将采集的N路音频信号输入控制器;控制器通过连接组件与降噪组件的输入端连接,用于对N路音频信号进行信号强度比较,根据比较结果控制连接组件的输出端与降噪组件的输入端之间的连接关系,从而实现了根据音频信号强度自适应地切换主、辅麦克接口的输入信号,以自适应当前的智能语音交互场景,保证良好的降噪效果,有助于提高语音识别结果的准确性。

权利要求书

1.一种音频信号处理系统,其特征在于,包括:
由N个麦克风组成的麦克风阵列,控制器,连接组件,以及降噪组件,N为大于2的整数;
其中,
所述N个麦克风呈圆环状分布;所述降噪组件的输入端包括N-1个主麦克接口和1个辅
麦克接口;
所述N个麦克风分别与所述控制器连接,用于将采集的N路音频信号输入所述控制器;
所述控制器通过所述连接组件与所述降噪组件的输入端连接,用于对所述N路音频信
号进行信号强度比较,根据比较结果控制所述连接组件的输出端与所述降噪组件的输入端
之间的连接关系。
2.根据权利要求1所述的系统,其特征在于,所述控制器具体用于:控制所述连接组件
将信号强度最低的一路音频信号输入至所述1个辅麦克接口,将其他的N-1路音频信号分别
输入至所述N-1个主麦克接口。
3.根据权利要求1所述的系统,其特征在于,所述连接组件包括N个开关,所述N个开关
的输入端与所述控制器的N个音频信号输出端分别对应固定连接。
4.根据权利要求1所述的系统,其特征在于,所述麦克风阵列为全向麦克风阵列。
5.根据权利要求1所述的系统,其特征在于,所述麦克风阵列被水平设置在机器人机身
上。
6.根据权利要求1所述的系统,其特征在于,还包括:
分别与所述N个麦克风和所述控制器连接的桥接器;
所述桥接器,用于将所述N路音频信号转换为一路音频信号传输给所述控制器;
所述控制器还用于:将所述一路音频信号还原为所述N路音频信号。
7.根据权利要求1至6中任一项所述的系统,其特征在于,还包括:
防尘防风装置;
所述麦克风阵列安装在所述防尘防风装置内。
8.根据权利要求1至6中任一项所述的系统,其特征在于,还包括:
语音识别组件和交互组件;
所述语音识别组件分别与所述降噪组件的输出端和所述控制器连接,用于对降噪后的
音频信号进行语音识别,将语音识别结果输入给所述控制器;
所述控制器还用于根据所述语音识别结果控制所述交互组件进行相应的交互反馈。
9.一种音频信号处理方法,其特征在于,包括:
获取N路音频信号,所述N路音频信号是由N个呈圆环状分布的麦克风分别采集的,N为
大于2的整数;
对所述N路音频信号进行信号强度比较;
根据信号强度比较结果,确定所述N路音频信号中的N-1?#20998;?#38899;频信号和1路辅音频信
号;
?#36816;?#36848;1路辅音频信号对所述N-1?#20998;?#38899;频信号进行降噪处理。

说明书

音频信号处理系统和音频信号处理方法

技术领域

本发明涉及信号处理技术领域,尤其涉及一种音频信号处理系统和音频信号处理
方法。

背景技术

语音交互,已经遍及我们生活的各个领域,如?#21482;?#30005;视、车载、空调等等领域。能
够进行正常语音交互的前提是准确识别语音信号。以?#21482;?#32456;端为例,由于环境噪声的存在,
?#21482;?#32456;端的麦克风在采集用户的?#34892;?#22768;源信号的同时,也会采集到环境噪声信号,这些环
境噪声信号会对?#34892;?#22768;源信号的准确识别造成干扰。

为了提高语音识别的准确性,一种方式是采用麦克风阵列以?#31181;?#22122;声的干扰,从
而提升语音识别效果,其中一种简单而常用的是双麦克风阵列结构。以?#21482;?#32456;端为例,双麦
克风阵列由主麦克风和辅麦克风组成,分别设置在?#21482;?#32456;端的不同位置,一般地,靠近用户
说话的位置处设置主麦克风,远离用户说话的位置设置辅麦克风。其中,主麦克风用于采集
语音信号和环境噪声,辅麦克风采集环境噪声,两者信号进行相减运算可以?#31181;?#29615;境噪声
对语音信号的干扰。

目前,在诸如?#21482;?#32456;端等场景中,用户在使用?#21482;?#32456;端时,声音源方位相对固定,
从而双麦克风位置固定,即哪个作为主麦克风哪个作为辅麦克风已经固定设置。但是,随着
各种智能交互产品的不断?#36866;潰?#35821;音交互的场景发生了很大改变,声音源相对智能交互产
品的方位不再固定不变,此时,固定设置某个麦克风作为主麦克风、另一麦克风作为辅麦克
风已经不能灵活适应智能语音交互场景的需求,很可能导致声源信号的识别准确?#28304;?#22823;降
低。

发明内容

有鉴于此,本发明实施例提供一种音频信号处理系统和音频信号处理方法,能够
自适应语音交互场景,有助于提高语音识别结果的准确性。

本发明实施例提供一种音频信号处理系统,包括:

由N个麦克风组成的麦克风阵列,控制器,连接组件,以及降噪组件,N为大于2的整
数;其中,

所述N个麦克风呈圆环状分布;所述降噪组件的输入端包括N-1个主麦克接口和1
个辅麦克接口;

所述N个麦克风分别与所述控制器连接,用于将采集的N路音频信号输入所述控制
器;

所述控制器通过所述连接组件与所述降噪组件的输入端连接,用于对所述N路音
频信号进行信号强度比较,根据比较结果控制所述连接组件的输出端与所述降噪组件的输
入端之间的连接关系。

本发明实施例提供一种音频信号处理方法,包括:

获取N路音频信号,所述N路音频信号是由N个呈圆环状分布的麦克风分别采集的,
N为大于2的整数;

对所述N路音频信号进行信号强度比较;

根据信号强度比较结果,确定所述N路音频信号中的N-1?#20998;?#38899;频信号和1路辅音
频信号;

?#36816;?#36848;1路辅音频信号对所述N-1?#20998;?#38899;频信号进行降噪处理。

本发明实施例提供的音频信号处理系统和音频信号处理方法,该系统中包括由N
个麦克风组成的圆环形麦克风阵列,控制器,连接组件,以及降噪组件,其中,控制器通过连
接组件与降噪组件的N个输入端连接。当N个麦克风分别采集到音频信号时,将采集到的N路
音频信号输入控制器,控制器对N路音频信号进行信号强度比较,根据比较结果自适应地进
行N路音频信号的主、辅角色定位。具体地,控制器根据N路音频信号的信号强度比较结果控
制连接组件的输出端与降噪组件的主、辅麦克接口之间的连接关系,从而实现了根据音频
信号强度自适应地切换主、辅麦克接口的输入信号,以自适应当前的智能语音交互场景,也
保证了降噪组件实现更佳的降噪效果,有助于提高语音识别结果的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作一简单地介绍,显而?#20934;?#22320;,下面描述中的附图是本发
明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根
据这些附图获得其他的附图。

图1为本发明实施例提供的音频信号处理系统实施例一的结构示意图;

图2为本发明实施例提供的音频信号处理系统实施例二的结构示意图;

图3为本发明实施例提供的音频信号处理方法实施例一的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例
中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员
在没有作出创造性劳动前提?#28388;?#33719;得的所有其他实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制
本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”
也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不
排除包含至少一种的情况。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示
可?#28304;?#22312;三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种
情况。另外,本文中?#22336;??#20445;?#19968;般表示前后关联对象是一种“或”的关系。

应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但
这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施
例范围的情况下,第一XXX也可以被称为第二XXX,类?#39057;兀?#31532;二XXX也可以被称为第一XXX。

取决于语?#24120;?#22914;在此所使用的词语“如果”、“若”可以被解?#32479;?#20026;“在……时”或
“当……时”或“响应于确定”或“响应于检测”。类?#39057;兀?#21462;决于语?#24120;?#30701;语“如果确定”或“如
果检测(陈述的条件或事件)”可以被解?#32479;?#20026;“?#27604;?#23450;时”或“响应于确定”或“当检测(陈述
的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖?#26725;?#20182;性的
包含,从而使得包括一系列要素的商品或者系统不仅包括?#20999;?#35201;素,而?#19968;?#21253;括没有明确
列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限?#39057;?#24773;
况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还
存在另外的相同要素。

图1为本发明实施例提供的音频信号处理系统实施例一的结构示意图,如图1所
示,该系统包括:

由N个麦克风组成的麦克风阵列1,控制器2,连接组件3,以及降噪组件4,N为大于2
的整数。

其中,如图1所示,该N个麦克风呈圆环状分布,图中示意出了该麦克风阵列包括
11、12、13、14四个麦克风。

在本实施例中,该圆环形状的麦克风阵列为全向麦克风阵列,即通过该圆环形状
的麦克风阵列可以接收全方位的音频信号。

在实际应用中,这N个麦克风可以是均匀分布的,也可以根据实际应用情况非均匀
分布,比如结合实际应用场景,如果用户在?#25215;?#26041;位说话的可能性更大,则在该方位上,可
?#22278;?#35774;比较多的麦克风,在不易说话的方位,布设少量麦克风。

本实施例中提供的上述音频信号处理系统可以适用于多种智能交互产品中,本实
施例中,以应用在智能移动机器人中为例,此时,麦克风阵列1可以被水平设置在机器人机
身?#31995;氖实?#20301;置,比如麦克风阵列1设置在机器人头部。

当该机器人被启动语音交互功能后,麦克风阵列1用于采集用户交互语音。

如图1所示,N个麦克风分别与控制器2连接,用于将采集的N路音频信号输入控制
器2。在一种可选连接方式中,N个麦克风可以直接与控制器2连接,此时,如图1所示,在包含
11、12、13、14四个麦克风的举例中,这四个麦克风分别连接到控制器2的a1、a2、a3、a4四个
输入端。

本实施例中,控制器2进一步通过连接组件3与降噪组件4的输入端连接,其中,降
噪组件4的输入端包括N-1个主麦克接口和1个辅麦克接口。具体地,如图1中示意的,控制器
2的四个输出端b1、b2、b3、b4分别与连接组件3的四个输入端c1、c2、c3、c4对应固定连接,连
接组件3的四个输出端d1、d2、d3、d4则可以切换与降噪组件4的N-1个主麦克接口和1个辅麦
克接口之间的连接关系,图1中,以z1、z2、z3示意主麦克接口,以f示意辅麦克接口。

可选地,该连接组件3可以实现为N个开关。

在实际应用中,当某个用户开始说话时,触发N个麦克风采集音频信号,将采集的N
路音频信号通过控制器2的输入端输入给控制器2,进而,控制器2对N路音频信号进行信号
强度比较,根据比较结果控制连接组件3的输出端与降噪组件4的输入端之间的连接关系,
以将根据信号强度比较结果确定的主音频信号输入至降噪组件4的主麦克接口,辅音频信
号输入至降噪组件4的辅麦克接口。

具体地,控制器2确定信号强度最低的一路音频信号为辅音频信号,其他N-1路音
频信号为主音频信号,从而,控制连接组件3将信号强度最低的一路音频信号输入至1个辅
麦克接口,将其他的N-1路音频信号分别输入至N-1个主麦克接口。

其中,主麦克接口和辅麦克接口可以被视为是对音频信号的信号属性的表征。具
体来说,可以将从主麦克接口输入的音频信号视为声音源信号,即含有?#34892;?#35821;音成分更多
的信号,将从辅麦克接口输入的音频信号视为噪声信号,从而触发降噪组件4根据辅麦克接
口输入的音频信号对从主麦克接口输入的音频信号的降噪处理。

具体地,控制器2在接收到N路音频信号后,可以通过对这N路音频信号分别进行一
定的信号处理,比如放大、滤波等处理,求取这N路音频信号的信号强度,进行比较。

本实施例中,可选地,控制器2可以使用各种应用专用集成电路(ASIC)、数字信号
处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列
(FPGA)、微中控元件、微处理器或其他电子元件实现。

本实施例提供的音频信号处理系统中包括由N个麦克风组成的圆环形麦克风阵
列,控制器,连接组件,以及降噪组件,其中,控制器通过连接组件与降噪组件的N个输入端
连接。当N个麦克风分别采集到音频信号时,将采集到的N路音频信号输入控制器,控制器对
N路音频信号进行信号强度比较,根据比较结果自适应地进行N路音频信号的主、辅角色定
位。具体地,控制器根据N路音频信号的信号强度比较结果控制连接组件的输出端与降噪组
件的主、辅麦克接口之间的连接关系,从而实现了根据音频信号强度自适应地切换主、辅麦
克接口的输入信号,以自适应当前的智能语音交互场景,也保证了降噪组件实现更佳的降
噪效果,有助于提高语音识别结果的准确性。

图2为本发明实施例提供的音频信号处理系统实施例二的结构示意图,如图2所
示,在图1所示实施例基础上,可选地,该系统还包括:

分别与N个麦克风和控制器2连接的桥接器5,其中:

桥接器5,用于将N路音频信号转换为一路音频信号传输给控制器2;

控制器2还用于:将一路音频信号还原为N路音频信号。

由于支持多路音频信号输入的控制器成本较贵,且接口数量很有限,为了降?#32479;?br />本以及避免控制器接口数量的限制,本实施例中提供了上述桥接器5。

如图2所示,由于桥接器5具有N个音频信号输入端口和一个音频信号输出端口,其
分别接收N路音频信号,将N路音频信号转换为一路后,输入给控制器2,控制器2为了接收N
路音频信号只需要设置一个输入接口a1即可,实现方便、成本低廉。而桥接器可以选择一个
CPLD或者FPGA就可以方便实现。

可选地,该系统还包括:防尘防风装置6。其中,麦克风阵列1安装在防尘防风装置6
内。

本实施例中,为?#23435;?#29702;上尽量保证环境因素对语音识别结果的不利影响,在麦克
风阵列的组装工艺上提供了防尘防风装置6,以尽量降低环境因素对语音识别结果的不利
影响。

其中,防尘防风装置6中比如包括防风棉、防尘网等结构,以降低风声、粉尘对麦克
风阵列的影响。

可选地,该系统还包括:语音识别组件7和交互组件8。

其中,语音识别组件7分别与降噪组件4的输出端和控制器2连接,用于对降噪后的
音频信号进行语音识别,将语音识别结果输入给控制器2。

控制器2还用于根据语音识别结果控制交互组件8进行相应的交互反馈。

本发明实施例提供的音频信号处理系统一般适用于智能语音交互的产品中,为了
实?#31181;?#33021;语音交互功能,在通过降噪组件4对输入的N路音频信号进行了降噪处理后,降噪
后的音频信号输入给语音识别组件7,以完成用户输入语音的语音识别处理。同时,为了实
?#21482;?#20110;语音的智能交互,以机器?#23435;?#20363;,需要基于语音识别结果向用户进行相应的反馈。本
实施例中,以机器?#23435;?#20363;,该交互组件8比如可以是语音播放器,控制器2可以基于语音识别
结果通过语音播放器向用户反馈应答语音;再比如可以是显示屏,控制器2可以基于语音识
别结果通过显示?#26009;?#29992;户反馈某种业务操作界面;再比如还可以是运动部件,控制器2可以
基于语音识别结果通过控制运动部件使机器人执行相应的反馈动作,等?#21462;?br />

图3为本发明实施例提供的音频信号处理方法实施例一的流程图,本实施例提供
的该音频信号处理方法可以由一音频信号处理系统来执行,该音频信号处理系统可以实现
为硬件,或者实现为软件和硬件的组合,该音频信号处理系统可以集成设置比如移动机器
人等语音交互设备中,比如可以是图1、图2所示的系统结构。如图3所示,该方法包括如下步
骤:

步骤101、获取N路音频信号,N路音频信号是由N个呈圆环状分布的麦克风分别采
集的。

其中,N为大于2的整数。

步骤102、对N路音频信号进行信号强度比较。

步骤103、根据信号强度比较结果,确定N路音频信号中的N-1?#20998;?#38899;频信号和1路
辅音频信号。

步骤104、以该1路辅音频信号对N-1?#20998;?#38899;频信号进行降噪处理。

具体地,根据信号强度比较结果,确定N路音频信号中的N-1?#20998;?#38899;频信号和1路辅
音频信号,包括:

根据信号强度的比较结果,确定信号强度最低的一路音频信号为辅音频信号,其
他N-1路音频信号为主音频信号。

本实施例提供的音频信号处理方法的具体适用场景和详细过程,可?#22278;?#35265;前述系
统实施例中的说明,在此不赘述。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元
(诸如各种组件、装置等)可以是或者也可?#22278;?#26159;物理上分开的,作为单元显示的部件可以
是或者也可?#22278;?#26159;物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可
以根据实?#23454;?#38656;要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通
技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以?#31995;?#23454;施方式的描述,本领域的技术人员可以清楚地?#31169;?#21040;各实施方式可
借助加必需的通用硬件平台的方式来实现,?#27604;?#20063;可以通过硬件。基于这样的理解,上述技
术方案本质上或者说对现有技术做出贡献的部分可以?#22278;?#21697;的形式体现出来,该计算机产
品可?#28304;?#20648;在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一
台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例
的?#25215;?#37096;分所述的方法。

最后应说明的是:以上实施例仅用?#36816;?#26126;本发明的技术方案,而非对其限制;尽管
参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;
而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和
范围。

关于本文
本文标题:音频信号处理系统和音频信号处理方法.pdf
链接地址:http://www.pqiex.tw/p-6079815.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 9捕鱼大师1.2.1版本 单机老虎机下载官网 北京pk10全天计划 用wifi赚钱的软件哪个好 彩票合买群 星豪娱乐网站 客麦隆那边赚钱吗 必赢客pk10软件下载 ag上的猛龙传奇怎么玩 天龙德州扑克客户端