平码五不中公式规律
  • / 16
  • 下载费用:30 金币  

一种声源定位方法及装置.pdf

关 键 ?#21097;?/dt>
一种 声源 定位 方法 装置
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201610848492.9

申请日:

2016.09.23

公开号:

CN106483502A

公开日:

2017.03.08

当前法律状态:

实审

有效性:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G01S 5/18申请日:20160923|||公开
IPC分类号: G01S5/18; G10L21/0272(2013.01)I 主分类号: G01S5/18
申请人: 科大讯飞股份有限公司
发明人: 雷琴辉; 管青松; 邢猛; 李深安
地址: 230088 ?#19981;?#30465;合肥市高新技术开发区望江西路666号讯飞大厦
优?#28909;ǎ?/td>
专利代理机构: ?#26412;?#24344;权知识产权代理事务所(普通合伙) 11363 代理人: 逯长明;许伟群
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201610848492.9

授权公告号:

|||

法律状态公告日:

2017.04.05|||2017.03.08

法律状态类型:

实质审查的生效|||公开

摘要

本发明实施例提供了一种声源定位方法及装置,其中方法包括:监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含有第一语音;通过对所述不同方向的语音信号进行语音分离得到两路语音信号;对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自的声源方向;将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方向?#31181;?#38750;声源方向的干扰;通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源。本发明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决了存在干扰情况时目标声源无法定位的技术问题,进而提升了用户的满意度。

权利要求书

1.一种声源定位方法,其特征在于,所述方法包括:
监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含有第一语音;
通过对所述不同方向的语音信号进行语音分离得到两路语音信号;
对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自的声源方向;
将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方向?#31181;?#38750;声源
方向的干扰;
通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源。
2.根据权利要求1所述的方法,其特征在于,通过对所述不同方向的语音信号进行语音
分离得到两路语音信号,包括:
获取两个指定方向的中心角度;
根据二元时频掩蔽算法将所述不同方向的语音信号按照所述两个指定方向进行语音
分离,以得到所述两路语音信号。
3.根据权利要求1所述的方法,其特征在于,对所述两路语音信号分别进行声源追踪,
以确定所述两路语音信号各自的声源方向,包括:
根据广义互相关算法对每路语音信号进行跟踪;
根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被划分为多
个扇形子区间,每个扇形子区间代表一个方位。
4.根据权利要求1所述的方法,其特征在于,将所述两路语音信号形成两个波束,并根
据所述两路语音信号的声源方向?#31181;?#38750;声源方向的干扰,包括:
根据广义旁瓣抵消算法将所述两路语音信号形成两个波束,其中在广义旁瓣抵消法中
使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰;
根据归一化最小均方算法更新广义旁瓣抵消法中所使用的自适应噪声消除器中的滤
波器,对残留干扰和平稳噪声进行?#31181;啤?br />
5.根据权利要求1所述的方法,其特征在于,通过在两个波束中对所述第一语音的识别
区分出目标声源和干扰声源,包括:
判断在所述两个波束中是否均识别出所述第一语音;
如果在所述两个波束中均未识别出所述第一语音,则继续监听不同方向的语音信号;
如果只在所述两个波束中的第一波束中识别出所述第一语音,则将所述第一波束的方
向确定为目标声源的方向,将第二波束的方向确定为干扰声源的方向;
如果在所述两个波束中均识别出所述第一语音,则根据预设策略分别计算两个波束的
预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方向。
6.根据权利要求5所述的方法,其特征在于,所述识别出所述第一语音,包括:
在当前波束中对所述第一语音进行匹配;
如果匹配得分大于第一门限值,则确定在当前波束中识别出所述第一语音。
7.根据权利要求5所述的方法,其特征在于,根据预设策略分别计算两个波束的预设参
数值,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方向,包括:
分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束的波束
能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束的波束
能量P2;
如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向;
如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向;
如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所述第一
波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方向;
如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所述第二
波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方向。
8.一种声源定位装置,其特征在于,所述装置包括:
语音监听单元,用于监听不同方向的语音信号,其中来自目标声源方向的语音信号中
包含有第一语音;
语音分离单元,用于通过对所述不同方向的语音信号进行语音分离得到两路语音信
号;
声源追踪单元,用于对所述两路语音信号分别进行声源追踪,以确定所述两路语音信
号各自的声源方向;
干扰?#31181;频?#20803;,用于将所述两路语音信号形成两个波束,并根据所述两路语音信号的
声源方向?#31181;?#38750;声源方向的干扰;
声源区分单元,用于通过在两个波束中对所述第一语音的识别区分出目标声源和干扰
声源。
9.根据权利要求8所述的装置,其特征在于,所述语音分离单元用于:
获取两个指定方向的中心角度;
根据二元时频掩蔽算法将所述不同方向的语音信号按照所述两个指定方向进行语音
分离,以得到所述两路语音信号。
10.根据权利要求8所述的装置,其特征在于,所述声源追踪单元用于:
根据广义互相关算法对每路语音信号进行跟踪;
根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被划分为多
个扇形子区间,每个扇形子区间代表一个方位。
11.根据权利要求8所述的装置,其特征在于,所述干扰?#31181;频?#20803;用于:
根据广义旁瓣抵消算法将所述两路语音信号形成两个波束,其中在广义旁瓣抵消法中
使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰;
根据归一化最小均方算法更新广义旁瓣抵消法中所使用的自适应噪声消除器中的滤
波器,对残留干扰和平稳噪声进行?#31181;啤?br />
12.根据权利要求8所述的装置,其特征在于,所述声源区分单元包括:
语音识别子单元,用于确定在每个波束中是否识别出所述第一语音;
逻辑判断子单元,用于根据所述语音识别子单元的识别结果,进行如下判断:如果在所
述两个波束中均未识别出所述第一语音,则继续监听不同方向的语音信号;如果只在所述
两个波束中的第一波束中识别出所述第一语音,则将所述第一波束的方向确定为目标声源
的方向,将第二波束的方向确定为干扰声源的方向;如果在所述两个波束中均识别出所述
第一语音,则根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定
目标声源的方向及干扰声源的方向。
13.根据权利要求12所述的装置,其特征在于,所述语音识别子单元用于:
在当前波束中对所述第一语音进行匹配;
如果匹配得分大于第一门限值,则确定在当前波束中识别出所述第一语音。
14.根据权利要求12所述的装置,其特征在于,根据预设策略分别计算两个波束的预设
?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方向,包括:
分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束的波束
能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束的波束
能量P2;
如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向;
如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向;
如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所述第一
波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方向;
如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所述第二
波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方向。

说明书

一种声源定位方法及装置

技术领域

本发明涉及语音定位技术领域,尤其涉及一种声源定位方法及装置。

背景技术

声源定位是指根据接收到的语音确定出声源的方位。不过在实际中,声源往往不
止一个,例如在会场上,发言人的声音是目标声源,但是除了发言人之外还可能存在其他声
源,这些其他声源很可能成为噪声,对目标声源造成干扰,因此在声源定位?#26412;?#38656;要区分出
那个是目标声源、哪个是干扰声源。

然而发明人在实现本发明的过程中发现,在现有技术中,声源定位技术往往只适
应于单个声源的定位追踪,而无法区分目标声源和干扰声源,故无法满足用户的需求。

发明内容

本发明提供一种声源定位方法及装置,以解决在存在干扰情况下目标声源无法定
位的技术问题。

根据本发明实施例的第一方面,提供一种声源定位方法,所述方法包括:

监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含有第一语
音;

通过对所述不同方向的语音信号进行语音分离得到两路语音信号;

对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自的声源方
向;

将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方向?#31181;?#38750;
声源方向的干扰;

通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源。

可选的,通过对所述不同方向的语音信号进行语音分离得到两路语音信号,包括:

获取两个指定方向的中心角度;

根据二元时频掩蔽算法将所述不同方向的语音信号按照所述两个指定方向进行
语音分离,以得到所述两路语音信号。

可选的,对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自
的声源方向,包括:

根据广义互相关算法对每路语音信号进行跟踪;

根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被划分
为多个扇形子区间,每个扇形子区间代表一个方位。

可选的,将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方
向?#31181;?#38750;声源方向的干扰,包括:

根据广义旁瓣抵消算法将所述两路语音信号形成两个波束,其中在广义旁瓣抵消
法中使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰;

根据归一化最小均方算法更新广义旁瓣抵消法中所使用的自适应噪声消除器中
的滤波器,对残留干扰和平稳噪声进行?#31181;啤?br />

可选的,通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源,
包括:

判断在所述两个波束中是否均识别出所述第一语音;

如果在所述两个波束中均未识别出所述第一语音,则继续监听不同方向的语音信
号;

如果只在所述两个波束中的第一波束中识别出所述第一语音,则将所述第一波束
的方向确定为目标声源的方向,将第二波束的方向确定为干扰声源的方向;

如果在所述两个波束中均识别出所述第一语音,则根据预设策略分别计算两个波
束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方向。

可选的,所述识别出所述第一语音,包括:

在当前波束中对所述第一语音进行匹配;

如果匹配得分大于第一门限值,则确定在当前波束中识别出所述第一语音。

可选的,根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;
确定目标声源的方向及干扰声源的方向,包括:

分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束的
波束能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束的
波束能量P2;

如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向;

如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向;

如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所述
第一波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方向;

如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所述
第二波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方向。

根据本发明实施例的第二方面,提供一种声源定位装置,所述装置包括:

语音监听单元,用于监听不同方向的语音信号,其中来自目标声源方向的语音信
号中包含有第一语音;

语音分离单元,用于通过对所述不同方向的语音信号进行语音分离得到两路语音
信号;

声源追踪单元,用于对所述两路语音信号分别进行声源追踪,以确定所述两路语
音信号各自的声源方向;

干扰?#31181;频?#20803;,用于将所述两路语音信号形成两个波束,并根据所述两路语音信
号的声源方向?#31181;?#38750;声源方向的干扰;

声源区分单元,用于通过在两个波束中对所述第一语音的识别区分出目标声源和
干扰声源。

可选的,所述语音分离单元用于:

获取两个指定方向的中心角度;

根据二元时频掩蔽算法将所述不同方向的语音信号按照所述两个指定方向进行
语音分离,以得到所述两路语音信号。

可选的,所述声源追踪单元用于:

根据广义互相关算法对每路语音信号进行跟踪;

根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被划分
为多个扇形子区间,每个扇形子区间代表一个方位。

可选的,所述干扰?#31181;频?#20803;用于:

根据广义旁瓣抵消算法将所述两路语音信号形成两个波束,其中在广义旁瓣抵消
法中使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰;

根据归一化最小均方算法更新广义旁瓣抵消法中所使用的自适应噪声消除器中
的滤波器,对残留干扰和平稳噪声进行?#31181;啤?br />

可选的,所述声源区分单元包括:

语音识别子单元,用于确定在每个波束中是否识别出所述第一语音;

逻辑判断子单元,用于根据所述语音识别子单元的识别结果,进行如下判断:如果
在所述两个波束中均未识别出所述第一语音,则继续监听不同方向的语音信号;如果只在
所述两个波束中的第一波束中识别出所述第一语音,则将所述第一波束的方向确定为目标
声源的方向,将第二波束的方向确定为干扰声源的方向;如果在所述两个波束中均识别出
所述第一语音,则根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;
确定目标声源的方向及干扰声源的方向。

可选的,所述语音识别子单元用于:

在当前波束中对所述第一语音进行匹配;

如果匹配得分大于第一门限值,则确定在当前波束中识别出所述第一语音。

可选的,根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;
确定目标声源的方向及干扰声源的方向,包括:

分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束的
波束能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束的
波束能量P2;

如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向;

如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向;

如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所述
第一波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方向;

如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所述
第二波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方向。

本发明的实施例提供的技术方案可以包括以下有益效果:

在本发明中,令目标声源发出第一语音,然后对不同方向上的语音信号进行监听,
分离出两个声源(即目标声源和干扰声源)并确定这两个声源的方位,同?#24065;种?#38750;声源方向
的干扰,再利用对第一语音的识别最终区分出哪个是目标声源哪个是干扰声源。本发明将
语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决了存
在干扰情况时目标声源无法定位的技术问题,进而提升了用户的满意度。

应当理解的是,以上的一般描述和后文的?#38468;?#25551;述仅是示例性和解释性的,并不
能限制本发明。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。此外,这些介
绍并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除
非有特别申明,附图中的图不构成比例限制。

图1是根据本发明一示例性实施例示出的一种声源定位方法的流程图;

图2是根据本发明一示例性实施例示出的语音分离示意图;

图3是根据本发明一示例性实施例示出的GSC算法框图;

图4是根据本发明一示例性实施例示出的一种声源定位方法的流程图;

图5是根据本发明一示例性实施例示出的一种声源定位装置的示意图;

图6是根据本发明一示例性实施例示出的一种声源定位装置的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及
附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例
中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附
权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据本发明一示例性实施例示出的一种声源定位方法的流程图。该方法例
如可用于?#21482;?#24179;板电脑、录音?#23454;?#31227;动终端或个人电脑、服务器等设备。

参见图1所示,该方法可以包括:

步骤S101,监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含
有第一语音。

例如,可以使用双麦克风对不同方向(或者说是各个方向)的语音信号进行采集、
监听。以会议这种场景为例,会议发言人即目标声源,为了将目标声源与其他干扰声源区别
开来,目标声源需要发出第一语音,例如发言人在发言之前可以念出某些关键词(如“你好
语音助手”等),作为第一语音。对于第一语音的用途可进一步参见下文步骤S105等中的描
述。

步骤S102,通过对所述不同方向的语音信号进行语音分离得到两路语音信号。

本实施例的基本思?#20998;?#35201;是先使用语音定位技术定位两个声源,然后再使用语音
识别技术从这两个声源中区分出目标声源和干扰声源,从而完成目标声源的定位。

本步骤的目的是先对各方向的语音信号进行粗分,即先初步将各方向的语音信号
大致归结到两个声源。对于具体如何进行语音分离得到两路语音信号,本实施例并不进行
限制,本领域技术人员可以根据不同需求\不同场景而自行设计、选择,可以在此处使用的
这些设计和选择都没有背离本发明的精神和保护范围。

步骤S103,对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各
自的声源方向。

初步归结到两个声源后,本步骤的目的即进一步对两个声源的方位进行更精确的
定位,以便在接下来的步骤中可以对非声源方向的声音信号进行?#31181;疲?#36827;而可以更准确地
从目标声源识别出第一语音。

对于具体如何进行声源追踪本实施例也并不进行限制,本领域技术人员可以根据
不同需求\不同场景而自行设计、选择,可以在此处使用的这些设计和选择都没有背离本发
明的精神和保护范围。

步骤S104,将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源
方向?#31181;?#38750;声源方向的干扰。

在确定两个声源的方向后,就可以对非声源方向的声音信号进行?#31181;啤?#23545;于具体
的实现方式本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行
设计、选择,可以在此处使用的这些设计和选择都没有背离本发明的精神和保护范围。

步骤S105,通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声
源。

通过之前的各步骤已经将各方向的声音处理为两个较为清晰、方位较为明确的声
源,接下来要做的便是从中进一步区分出哪个是想要的目标声源。因为只有目标声源才发
出了第一语音,所以在本步骤中通过对第一语音的识别,便可?#28304;?#20013;区分出哪个是目标声
源,则另一个即为干扰声源。

对于具体的识别方式本实施例也并不进行限制,本领域技术人员可以根据不同需
求\不同场景而自行设计、选择,可以在此处使用的这些设计和选择都没有背离本发明的精
神和保护范围。

在本实施例中,令目标声源发出第一语音,然后对不同方向上的语音信号进行监
听,分离出两个声源(即目标声源和干扰声源)并确定这两个声源的方位,同?#24065;种?#38750;声源
方向的干扰,再利用对第一语音的识别最终区分出哪个是目标声源哪个是干扰声源。本发
明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决
了在存在干扰情况下目标声源无法定位的技术问题,进而提升了用户的满意度。

下面进一步对各步骤的具体实现方式进行举例说明。

在本实施例或本发明其他某些实施例中,通过对所述不同方向的语音信号进行语
音分离得到两路语音信号,即步骤S102,可以包括如下子步骤:

1)获取两个指定方向的中心角度。

作为示例可参见图2所示,在图2中Mic 1和Mic 2分别代表两个用于监听不同方向
语音信号的麦克风,θ1和θ2分别代表两个所述指定方向的中心角度,例如θ1可以为135°,θ2
可以为45°。对于这两个中心角度,可以由外界输入,也可以是预设的,对于这两个中心角度
具体的角度值及获取方式本实施例并不进行限制。

有了这两个中心角度,就可以将空间划分为两个大的方向,而图2中的Source 1和
Source 2则各代表一个假想的声源。

2)根据二元时频掩蔽算法(BTFM)将所述不同方向的语音信号按照所述两个指定
方向进行语音分离,以得到所述两路语音信号。

分离后每个时?#26723;?#30340;信号为:


m=1,2;where d(x,y)=||x-y||2

其中,τi=dcosθi/c为信号源到非参考麦克风的距离,d为麦克风间距,c为声速。分
离准则:认为每个时?#26723;?#30001;观测信号相位差距离最小的声源产生,即计算每个时?#26723;?#19982;初
始化方向距离,距离最近的方向即为声源方向。其中时?#26723;?#26159;指用时间和频?#23454;?#32852;合函数
来表示信号;时?#26723;?#19982;初始化方向距离是指时?#26723;?#19982;观测信号相位差距离,初始化的两个
方向可以分别计算到两个麦克风的相位差,某个时?#26723;?#20063;可以计算到两个麦克风的相位
差,再与初始化的两个相位差比较,认为当前时?#26723;閿上?#20301;差距离近的方向产生。对于上述
二元时频掩蔽算法及具体的公式等,因其属于现有技术,故本实施例不再展开详述。

在本实施例或本发明其他某些实施例中,对所述两路语音信号分别进行声源追
踪,以确定所述两路语音信号各自的声源方向,即步骤S103,可以包括如下子步骤:

i)根据广义互相关算法(GCC)对每路语音信号进行跟踪。

GCC利用信号源到达两个麦克风的信号X1(ω)和X2(ω)的加权互相关的最大值,确
定到达波时间差来确定信号的方位:


使得gcc(t)取最大值的时间t即为信号到达两个麦克风的时间差,从而可以进一
步确定信号方向。

ii)根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被
划分为多个扇形子区间,每个扇形子区间代表一个方位。

可以对所述不同方向进行精细划分,即划分多个扇形子区间,每个扇形子区间对
应一个更具体的方向,这样追踪定位的角度也?#36879;?#31934;确。

对于上述广义互相关算法及具体的公式等,因其属于现有技术,故本实施例不再
展开详述。

在本实施例或本发明其他某些实施例中,将所述两路语音信号形成两个波束,并
根据所述两路语音信号的声源方向?#31181;?#38750;声源方向的干扰,即步骤S104,可以包括如下子
步骤:

a)根据广义旁瓣抵消算法(GSC)将所述两路语音信号形成两个波束,其中在广义
旁瓣抵消法中使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰。

作为示例GSC框图可参见图3所示,在图3中x1(n)和x2(n)分别为两个麦克信号(即
输入),u(n)为噪声参考信号,yb(n)为估计的噪声信号,yF(n)为固定波束输出信号,z(n)为
最终的输出信号。

其中阻塞矩阵用来形成陷零角度,?#31181;?#38750;声源方向的干扰。陷零是指空间响应为
0,陷零角度是指空间响应为0的方向。

b)根据归一化最小均方算法(NMLS)更新广义旁瓣抵消法中所使用的自适应噪声
消除器中的滤波器,对残留干扰和平稳噪声进行?#31181;啤?br />

对于上述广义旁瓣抵消算法和归一化最小均方算法以及GSC框图等,因其均属于
现有技术,故本实施例不再赘述。

参见图4所示,在本实施例或本发明其他某些实施例中,通过在两个波束中对所述
第一语音的识别区分出目标声源和干扰声源,即步骤S105,可以包括如下子步骤:

步骤S401,判断在所述两个波束中是否均识别出所述第一语音。

作为示例,可以在当前波束中对所述第一语音进行匹配,如果匹配得分大于第一
门限值,则确定在当前波束中识别出所述第一语音。

对于具体的语音匹配技术及匹配得分的计算方式可以使用现有技术,本实施例并
不进行限制。

步骤S402,如果在所述两个波束中均未识别出所述第一语音,则继续监听不同方
向的语音信号。

步骤S403,如果只在所述两个波束中的第一波束中识别出所述第一语音,则将所
述第一波束的方向确定为目标声源的方向,将第二波束的方向确定为干扰声源的方向。容
易理解的是,本步骤中的第一波束是指识别出所述第一语音的那个波束。

步骤S404,如果在所述两个波束中均识别出所述第一语音,则根据预设策略分别
计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方
向。

对于预设策略、预设?#38382;?#20540;的具体内容,以及根据所述预设?#38382;?#20540;具体如何确定
目标声源的方向及干扰声源的方向,本实施例并不进行限制,本领域技术人员可以根据不
同需求\不同场景而自行设计、选择,可以在此处使用的这些设计和选择都没有背离本发明
的精神和保护范围。

作为示例,根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设?#38382;?br />值确定目标声源的方向及干扰声源的方向,可以包括如下步骤:

①分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束
的波束能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束
的波束能量P2。

对于置信度及波束能量的具体测算方式可以使用现有技术,本实施例不再赘述。

②如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向。

③如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向。

④如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所
述第一波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方
向。

例如第二门限值可以设置为1.25,第三门限值可以设置为1.15。

⑤如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所
述第二波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方
向。

在本实施例中,令目标声源发出第一语音,然后对不同方向上的语音信号进行监
听,分离出两个声源(即目标声源和干扰声源)并确定这两个声源的方位,同?#24065;种?#38750;声源
方向的干扰,再利用对第一语音的识别最终区分出哪个是目标声源哪个是干扰声源。本发
明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决
了在存在干扰情况下目标声源无法定位的技术问题,进而提升了用户的满意度。

下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实
施例中未披露的?#38468;冢?#35831;参照本发明方法实施例。

图5是根据本发明一示例性实施例示出的一种声源定位装置的示意图。该装置例
如可用于?#21482;?#24179;板电脑、录音?#23454;?#31227;动终端或个人电脑、服务器等设备。

参见图5所示,该装置可以包括:

语音监听单元501,用于监听不同方向的语音信号,其中来自目标声源方向的语音
信号中包含有第一语音;

语音分离单元502,用于通过对所述不同方向的语音信号进行语音分离得到两路
语音信号;

声源追踪单元503,用于对所述两路语音信号分别进行声源追踪,以确定所述两路
语音信号各自的声源方向;

干扰?#31181;频?#20803;504,用于将所述两路语音信号形成两个波束,并根据所述两路语音
信号的声源方向?#31181;?#38750;声源方向的干扰;

声源区分单元505,用于通过在两个波束中对所述第一语音的识别区分出目标声
源和干扰声源。

在本实施例或本发明其他某些实施例中,所述语音分离单元502具体可以用于:

获取两个指定方向的中心角度;

根据二元时频掩蔽算法将所述不同方向的语音信号按照所述两个指定方向进行
语音分离,以得到所述两路语音信号。

在本实施例或本发明其他某些实施例中,所述声源追踪单元503具体可以用于:

根据广义互相关算法对每路语音信号进行跟踪;

根据追踪结果确定每路语音信号所对应的扇形子区间,其中所述不同方向被划分
为多个扇形子区间,每个扇形子区间代表一个方位。

在本实施例或本发明其他某些实施例中,所述干扰?#31181;频?#20803;504具体可以用于:

根据广义旁瓣抵消算法将所述两路语音信号形成两个波束,其中在广义旁瓣抵消
法中使用阻塞矩阵形成陷零角度,?#31181;?#38750;声源方向的干扰;

根据归一化最小均方算法更新广义旁瓣抵消法中所使用的自适应噪声消除器中
的滤波器,对残留干扰和平稳噪声进行?#31181;啤?br />

参见图6所示,在本实施例或本发明其他某些实施例中,所述声源区分单元505具
体可以包括:

语音识别子单元5051,用于确定在每个波束中是否识别出所述第一语音;

逻辑判断子单元5052,用于根据所述语音识别子单元的识别结果,进行如下判断:
如果在所述两个波束中均未识别出所述第一语音,则继续监听不同方向的语音信号;如果
只在所述两个波束中的第一波束中识别出所述第一语音,则将所述第一波束的方向确定为
目标声源的方向,将第二波束的方向确定为干扰声源的方向;如果在所述两个波束中均识
别出所述第一语音,则根据预设策略分别计算两个波束的预设?#38382;?#20540;,并根据所述预设参
数值确定目标声源的方向及干扰声源的方向。

在本实施例或本发明其他某些实施例中,所述语音识别子单元5051具体可以用
于:

在当前波束中对所述第一语音进行匹配;

如果匹配得分大于第一门限值,则确定在当前波束中识别出所述第一语音。

在本实施例或本发明其他某些实施例中,根据预设策略分别计算两个波束的预设
?#38382;?#20540;,并根据所述预设?#38382;?#20540;确定目标声源的方向及干扰声源的方向,可以包括:

分别获取在所述第一波束中识别所述第一语音时的置信度S1和所述第一波束的
波束能量P1,以及,在所述第二波束中识别所述第一语音时的置信度S2和所述第二波束的
波束能量P2;

如果S1>S2且P1>P2,则将所述第一波束的方向作为目标声源的方向;

如果S2>S1且P2>P1,则将所述第二波束的方向作为目标声源的方向;

如果S1>S2且P2>P1,则当S1/S2大于第二门限值且P2/P1小于第三门限值时将所述
第一波束的方向作为目标声源的方向,否则将所述第二波束的方向作为目标声源的方向;

如果S2>S1且P1>P2,则当S2/S1大于第二门限值且P1/P2小于第三门限值时将所述
第二波束的方向作为目标声源的方向,否则将所述第一波束的方向作为目标声源的方向。

在本实施例中,令目标声源发出第一语音,然后对不同方向上的语音信号进行监
听,分离出两个声源(即目标声源和干扰声源)并确定这两个声源的方位,同?#24065;种?#38750;声源
方向的干扰,再利用对第一语音的识别最终区分出哪个是目标声源哪个是干扰声源。本发
明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决
了在存在干扰情况下目标声源无法定位的技术问题,进而提升了用户的满意度。

关于上述实施例中的装置,其中各个单元\模块执行操作的具体方式已经在有关
该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其
它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或
者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的
权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精?#26041;?#26500;,并
且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

关于本文
本文标题:一种声源定位方法及装置.pdf
链接地址:http://www.pqiex.tw/p-5994748.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 全天计划北京pk10下载 mgm娱乐可靠吗 波克捕鱼千炮版破解版 世界杯优胜冠军 三公怎么玩纸牌 街机千炮捕鱼单机版下载安装 九亿平台下载 jdb电子龙王技巧爆分 广西赚钱加盟网 广东时时开奖视频直播