平码五不中公式规律
  • / 27
  • 下载费用:30 金币  

用于对内容仓库的基于语音的搜索的系统和方法.pdf

关 键 ?#21097;?/dt>
用于 内容 仓库 基于 语音 搜索 系统 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201480080713.1

申请日:

2014.07.22

公开号:

CN106663096A

公开日:

2017.05.10

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G06F 17/30申请日:20140722|||公开
IPC分类号: G06F17/30; G10L15/22 主分类号: G06F17/30
申请人: 纽昂斯通讯公司
发明人: J·克雷蒂?#22266;? L·昆克; M·拉博斯凯; T·玛赛克
地址: 美国马萨诸塞州
优先权:
专利代理机构: 中国国际贸?#29366;?#36827;委?#34987;?#19987;利商标事务所 11038 代理人: 边海梅
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201480080713.1

授权公告号:

|||

法律状态公告日:

2017.06.06|||2017.05.10

法律状态类型:

实质审查的生效|||公开

摘要

根据一些方面,提供一种响应于用户话音查询而搜索内容的方法。该方法可以包括接收用户话音查询,执行语音辨识以生成包括第一语音辨识结果的N个最佳语音辨识结果,执行对至少一个内容仓库的有监督搜索以使用一个或多个分类器识别一个或多个有监督搜索结果,该一个或多个分类器将第一语音辨识结果分类成识别至少一个内容仓库中先前被分类的内容的至少一个分类,执行对至少一个内容仓库的无监督搜索以识别一个或多个无监督搜索结果,其中执行无监督搜索包括执行对至少一个内容仓库的单词搜索,以及从一个或多个有监督搜索结果和一个或多个无监督搜索结果中生成经组合的结果。

权利要求书

1.一种响应于用户话音查询而搜索至少一个内容仓库中的内容的方法,该方法包括动
作:
接收所述用户话音查询;
对所述用户话音查询执行语音辨识,以生成针对所述用户话音查询的N个最佳语音辨
识结果,其中N等于一个或多个,并且其中所述N个最佳语音辨识结果包括第一语音辨识结
果;
执行对所述至少一个内容仓库的有监督搜索,以识别一个或多个有监督搜索结果的集
合,其中所述一个或多个有监督搜索结果中的每一个有监督搜索结果与分数相关联,该分
数指示所述一个或多个有监督搜索结果中的这个有监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述有监督搜索包括使用一个或多个分类器处理第一语音辨识结
果,所述一个或多个分类器将第一语音辨识结果分类成识别所述至少一个内容仓库中先前
被分类的内容的至少一个分类;
执行对所述至少一个内容仓库的无监督搜索,以识别一个或多个无监督搜索结果的集
合,其中所述一个或多个无监督搜索结果中的每一个无监督搜索结果与分数相关联,该分
数指示所述一个或多个无监督搜索结果中的这个无监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述无监督搜索包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单
词执行对所述至少一个内容仓库的单词搜索;以及
从所述一个或多个有监督搜索结果的集合和所述一个或多个无监督搜索结果的集合
中生成经组合的结果的集合。
2.根据权利要求1所述的方法,其中所述生成包括评?#28010;?#36848;有监督搜索结果的分数和
所述无监督搜索结果的分数,以及在所述有监督搜索结果和所述无监督搜索结果中为所述
经组合的结果选择具有指示最高相关性的分数的那些搜索结果。
3.根据权利要求1所述的方法,其中所述生成包括在所述经组合的搜索结果中包括来
?#36816;?#36848;一个或多个无监督结果的集合的至少一个结果和来?#36816;?#36848;一个或多个有监督结果
的集合的至少一个结果。
4.根据权利要求1所述的方法,还包括识别本体中的一个或多个元素为与第一语音辨
识结果中的一个或多个单词有关,并且其中执行所述无监督搜索和/或执行所述有监督搜
索至少部分地基于所识别的一个或多个元素。
5.根据权利要求1所述的方法,还包括对所述有监督搜索结果的分数进行熵加权,以生
成熵加权的有监督搜索结果,并且其中生成所述经组合结果的集合包括从所述熵加权的有
监督搜索结果中选择。
6.根据权利要求1所述的方法,还包括使用语音合成将所述经组合的结果的集合的至
少一部分展示给用户。
7.根据权利要求1所述的方法,其中所述内容仓库包括描述机动车辆的操作的内容。
8.一种装置,包括:
至少一个处理器;以及
至少一个存储介?#21097;?#25152;述至少一个存储介质存储处理器可执行指令,所述处理器可执
行指令在由所述至少一个处理器执行时,执行响应于用户话音查询而搜索至少一个内容仓
库中的内容的方法,该方法包括动作:
接收所述用户话音查询;
对所述用户话音查询执行语音辨识,以生成针对所述用户话音查询的N个最佳语音辨
识结果,其中N等于一个或多个,并且其中所述N个最佳语音辨识结果包括第一语音辨识结
果;
执行对所述至少一个内容仓库的有监督搜索,以识别一个或多个有监督搜索结果的集
合,其中所述一个或多个有监督搜索结果中的每一个有监督搜索结果与分数相关联,该分
数指示所述一个或多个有监督搜索结果中的这个有监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述有监督搜索包括使用一个或多个分类器处理第一语音辨识结
果,所述一个或多个分类器将第一语音辨识结果分类成识别所述至少一个内容仓库中先前
被分类的内容的至少一个分类;
执行对所述至少一个内容仓库的无监督搜索,以识别一个或多个无监督搜索结果的集
合,其中所述一个或多个无监督搜索结果中的每一个无监督搜索结果与分数相关联,该分
数指示所述一个或多个无监督搜索结果中的这个无监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述无监督搜索包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单
词执行对所述至少一个内容仓库的单词搜索;以及
从所述一个或多个有监督搜索结果的集合和所述一个或多个无监督搜索结果的集合
中生成经组合的结果的集合。
9.根据权利要求8所述的装置,其中所述生成包括评?#28010;?#36848;有监督搜索结果的分数和
所述无监督搜索结果的分数,以及在所述有监督搜索结果和所述无监督搜索结果中为所述
经组合的结果选择具有指示最高相关性的分数的那些搜索结果。
10.根据权利要求8所述的装置,其中所述生成包括在所述经组合的搜索结果中包括来
?#36816;?#36848;一个或多个无监督结果的集合的至少一个结果和来?#36816;?#36848;一个或多个有监督结果
的集合的至少一个结果。
11.根据权利要求8所述的装置,其中所述方法还包括识别本体中的一个或多个元素为
与第一语音辨识结果中的一个或多个单词有关,并且其中执行所述无监督搜索和/或执行
所述有监督搜索至少部分地基于所识别的一个或多个元素。
12.根据权利要求8所述的装置,其中所述方法还包括对所述有监督搜索结果的分数进
行熵加权,以生成熵加权的有监督搜索结果,并且其中生成所述经组合的结果的集合包括
从所述熵加权的有监督搜索结果中选择。
13.根据权利要求8所述的装置,其中所述方法还包括使用语音合成将所述经组合的结
果的集合的至少一部分展示给用户。
14.根据权利要求8所述的装置,其中所述内容仓库包括描述机动车辆的操作的内容。
15.至少一种计算机可读存储介?#21097;?#25152;述至少一种计算机可读存储介质存储计算机可
执行指令,所述计算机可执行指令在被执行时,执行响应于用户话音查询而搜索至少一个
内容仓库中的内容的方法,该方法包括动作:
接收所述用户话音查询;
对所述用户话音查询执行语音辨识,以生成针对所述用户话音查询的N个最佳语音辨
识结果,其中N等于一个或多个,并且其中所述N个最佳语音辨识结果包括第一语音辨识结
果;
执行对所述至少一个内容仓库的有监督搜索,以识别一个或多个有监督搜索结果的集
合,其中所述一个或多个有监督搜索结果中的每一个有监督搜索结果与分数相关联,该分
数指示所述一个或多个有监督搜索结果中的这个有监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述有监督搜索包括使用一个或多个分类器处理第一语音辨识结
果,所述一个或多个分类器将第一语音辨识结果分类成识别所述至少一个内容仓库中先前
被分类的内容的至少一个分类;
执行对所述至少一个内容仓库的无监督搜索,以识别一个或多个无监督搜索结果的集
合,其中所述一个或多个无监督搜索结果中的每一个无监督搜索结果与分数相关联,该分
数指示所述一个或多个无监督搜索结果中的这个无监督搜索结果与所述用户话音查询的
预测相关性,其中执行所述无监督搜索包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单
词执行对所述至少一个内容仓库的单词搜索;以及
从所述一个或多个有监督搜索结果的集合和所述一个或多个无监督搜索结果的集合
中生成经组合的结果的集合。
16.根据权利要求15所述的至少一种计算机可读存储介?#21097;?#20854;中所述生成包括评?#28010;?br />述有监督搜索结果的分数和所述无监督搜索结果的分数,以及在所述有监督搜索结果和所
述无监督搜索结果中为所述经组合的结果选择具有指示最高相关性的分数的那些搜索结
果。
17.根据权利要求15所述的至少一种计算机可读存储介?#21097;?#20854;中所述生成包括在所述
经组合的搜索结果中包括来?#36816;?#36848;一个或多个无监督结果的集合的至少一个结果和来自
所述一个或多个有监督结果的集合的至少一个结果。
18.根据权利要求15所述的至少一种计算机可读存储介?#21097;?#20854;中所述方法还包括识别
本体中的一个或多个元素为与第一语音辨识结果中的一个或多个单词有关,以及至少部分
地基于所识别的一个或多个元素执行所述无监督搜索或者所述有监督搜索。
19.根据权利要求15所述的至少一种计算机可读存储介?#21097;?#20854;中所述方法还包括在生
成所述经组合的结果的集合之前,对所述有监督搜索结果的分数进行熵加权。
20.根据权利要求15所述的至少一种计算机可读存储介?#21097;?#20854;中所述方法还包括使用
语音合成展示所述经组合的结果的集合的至少一部分。

说明书

用于对内容仓库的基于语音的搜索的系统和方法

背景?#38469;?br />

用户可以通过提供诸如键入的或者口语的搜索查询之类的搜索查询,来搜索内容
仓库中的内容,并且作为响应,接收与搜索查询有关的内容项目(有时称作“条目”)的列表。
在一些系统中,条目的列表(有?#24065;?#31216;作“搜索结果”)可以由分类器识别,分类器已经被训
练为将查询和内容仓库中的相关条目相关联。在先前的训练的基础上,分类器可以通过识
别与查询有关的一个或多个条目,将新的查询分类为与特定的内容有关。

发明内容

一些实施例包括响应用户话音查询而搜索至少一个内容仓库中的内容的方法,该
方法包括下面的动作:接收用户话音查询;对用户话音查询执行语音辨识,以生成针对用户
话音查询的N个最佳语音辨识结果,其中N等于一个或多个,并且其中N个最佳语音辨识结果
包括第一语音辨识结果;执行对至少一个内容仓库的有监督搜索,以识别一个或多个有监
督搜索结果的集合,其中一个或多个有监督搜索结果中的每一个有监督搜索结果与分数相
关联,该分数指示一个或多个有监督搜索结果中的这个有监督搜索结果与用户话音查询的
预测相关性,其中执行有监督搜索包括使用一个或多个分类器处理第一语音辨识结果,该
一个或多个分类器将第一语音辨识结果分类成识别在至少一个内容仓库中的先前被分类
的内容的至少一个分类;执行对至少一个内容仓库的无监督搜索,以识别一个或多个无监
督搜索结果的集合,其中一个或多个无监督搜索结果中的每一个无监督搜索结果与分数相
关联,该分数指示一个或多个无监督搜索结果中的这个无监督搜索结果与用户话音查询的
预测相关性,其中执行无监督搜索包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单词执
行对至少一个内容仓库的单词搜索;以及从一个或多个有监督搜索结果的集合和一个或多
个无监督搜索结果的集合中生成经组合的结果的集合。

一些实施例提供一种装置,该装置包括至少一个处理器,以及存储处理器可执行
指令的至少一个存储介?#21097;?#22788;理器可执行指令在由至少一个处理器执行时,执行响应用户
话音查询而搜索至少一个内容仓库中的内容的方法,该方法包括下面的动作:接收用户话
音查询;对用户话音查询执行语音辨识,以生成针对用户话音查询的N个最佳语音辨识结
果,其中N等于一个或多个,并且其中N个最佳语音辨识结果包括第一语音辨识结果;执行对
至少一个内容仓库的有监督搜索,以识别一个或多个有监督搜索结果的集合,其中一个或
多个有监督搜索结果中的每一个有监督搜索结果与分数相关联,该分数指示一个或多个有
监督搜索结果中的这个有监督搜索结果与用户话音查询的预测相关性,其中执行有监督搜
索包括使用一个或多个分类器处理第一语音辨识结果,该一个或多个分类器将第一语音辨
识结果分类成识别在至少一个内容仓库中的先前被分类的内容的至少一个分类;执行对至
少一个内容仓库的无监督搜索,以识别一个或多个无监督搜索结果的集合,其中一个或多
个无监督搜索结果中的每一个无监督搜索结果与分数相关联,该分数指示一个或多个无监
督搜索结果中的这个无监督搜索结果与用户话音查询的预测相关性,其中执行无监督搜索
包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单词执行对至少一个内容仓库的单词搜
索;以及从一个或多个有监督搜索结果的集合和一个或多个无监督搜索结果的集合中生成
经组合的结果的集合。

一些实施例提供存储计算机可执行指令的至少一种计算机可读介?#21097;?#35745;算机可执
行指令在被执行时,执行响应于用户话音查询而搜索至少一个内容仓库中的内容的方法,
该方法包括下面的动作:接收用户话音查询;对用户话音查询执行语音辨识,以生成针对用
户话音查询的N个最佳语音辨识结果,其中N等于一个或多个,并且其中N个最佳语音辨识结
果包括第一语音辨识结果;执行对至少一个内容仓库的有监督搜索,以识别一个或多个有
监督搜索结果的集合,其中一个或多个有监督搜索结果中的每一个与分数相关联,该分数
指示一个或多个有监督搜索结果中的这个有监督搜索结果与用户话音查询的预测相关性,
其中执行有监督搜索包括使用一个或多个分类器处理第一语音辨识结果,该一个或多个分
类器将第一语音辨识结果分类成识别在至少一个内容仓库中的先前被分类的内容的至少
一个分类;执行对至少一个内容仓库的无监督搜索,以识别一个或多个无监督搜索结果的
集合,其中一个或多个无监督搜索结果中的每一个无监督搜索结果与分数相关联,该分数
指示一个或多个无监督搜索结果中的这个无监督搜索结果与用户话音查询的预测相关性,
其中执行无监督搜索包括使用从第一语音辨识结果?#36152;?#30340;一个或多个单词执行对至少一
个内容仓库的单词搜索;以及从一个或多个有监督搜索结果的集合和一个或多个无监督搜
索结果的集合中生成经组合的结果的集合。

前述概述是以例示方式提供的并?#20063;?#26088;在是限制性的。

附图说明

附图不旨在按照比例绘制。在附图中,在各种图中例示的每个相同或者几乎相同
的组件?#19978;?#20284;的数字表示。为了清楚,可能不是每个组件都在每个附图中标注。在附图中:

图1描绘根据一些实施例的存储与机动车辆的操作有关的内容的例示性内容仓
库;

图2是根据一些实施例的执行对内容仓库的有监督搜索和/或无监督搜索的例示
性过程的流程图;

图3是根据一些实施例的基于一个或多个语音辨识结果执行有监督搜索和无监督
搜索两者的例示性过程的流程图;

图4描绘根据一些实施例的搜索内容仓库中的内容的例示性过程;

图5是根据一些实施例的基于一个或多个搜索查询执行有监督搜索或者无监督搜
索的例示性过程的流程图;

图6描绘根据一些实施例的搜索内容仓库中的内容的例示性过程;

图7描绘根据一些实施例的可以用来为有监督搜索或者为无监督搜索补充搜索查
询的例示性本体(ontology);以及

图8例示在其上可以实现本发明的方面的计算系统环境的示例。

具体实施方式

如上面所讨论的,分类器可以被训练为将查询分类为与内容仓库中的一个或多个
已知条目有关。常规地,使用大集合的训练数据完成该训练,训练数据可以包括样本输入查
询,其中每个样本输入查询具有识别仓库中与该查询有关的内容的一个或多个经手工编码
(亦即,由人编码)的结果。一旦经过训练,分类器随后就可以将新的查询分类为与内容有关
(有时称作“有监督搜索”)。另外,分类器只有在将输入查询分类为与分类器已经为其被训
练的内容有关时是?#34892;?#30340;,使得如果新的内容被添加到仓库,那么它不能够由分类器识别
为与输入查询相关,除非使用包括该新内容的训练数据重新训练分类器。

发明者已经认识到并且领会,新查询的?#34892;?#20998;类受用来训练分类器的训练数据的
数量影响,?#34892;?#30340;分类典型地需要大量的训练数据。为了执行对内容仓库中所有内容的有
监督搜索并?#19968;?#24471;准确的搜索结果,例如,分类器必须已经预先在内容仓库中的所有内容
上被训练。分类器可以替代地仅在内容仓库中的内容的一部分上被训练,但是这可能将搜
索结果限制为仅来自内容仓库的那部分的内容,由此限制对用户可用的信息。

发明者已经认识到并且领会,通过使用有监督?#38469;?#21644;无监督?#38469;?亦即,不采用经
训练的分类器的?#38469;?来搜索内容仓库能够实现有益的结果。例如,无监督搜索可以包括关
键字搜索和/或统计?#38469;?#26469;识别内容中的样式,并且可以被用来将来自内容仓库的一个或
多个条目识别为与搜索查询有关。一些例示性无监督搜索?#38469;?#22312;下面描述。

在一些实施例中,使用有监督搜索?#38469;?#21644;无监督搜索?#38469;?#20004;者的“混合”方法允许
分类器的训练辨识比使用仅有监督方法将采用的条目更少的条目。分类器可以在内容仓库
中的条目的经选择的部分上训练,并且可以执行使用混合方法的搜索。混合搜索可以通过
有监督分类来识别经选择的条目中的一个或多个,并且可以使用无监督搜索附加地识别条
目(其可以包括经选择的条目、未经选择的条目和/或在分类器的训?#20998;?#21518;添加到仓库的条
目)。因此,在一些情况下,即使当训练有监督分类器时仅识别所有条目中的经选择的部分,
也可以搜索内容仓库中的所有条目。

在其他实施例中,与上面讨论的仅有监督方法相比较,混合方法可以允许使用较
少的训练数据(例如,较少的训练查询)训练分类器。一般来说,内容的有监督分类具有随着
用来训练分类器的训练实例(例如,示例性查询)的数量增加而增加的准确度(例如,将新的
查询正确地匹配到内容的?#34892;?#24615;)。为了使用仅有监督方法从分类器获得特定的准确度,可
能需要特定量的训练数据。使用混合方法可以允许使用减少的训练数据集合而获得相同
(或者更好)的期望准确度,因为对内容仓库的无监督搜索可以产生附加的搜索结果,这些
附加的搜索结果可以至少部分地补偿由于训练数据集合的大小的减小而导致的分类器的
准确度的任何?#26723;汀?br />

根据一些实施例,可以通过将来自使用搜索查询的对内容仓库的有监督搜索的搜
索结果和从使用搜索查询的对内容仓库的无监督搜索中产生的搜索结果组合,来执行使用
搜索查询的对内容仓库的搜索。可以合并或者以其他方式组合搜索结果以产生搜索结果的
单个集合,该搜索结果的单个集合可以被展示给用户或者以任何其他适当的方式处理。在
一个实施例中,展示搜索结果的次序可以至少部分地基于与每个搜索结果相关联的一个或
多个分数。例如,可以组合搜索结果的两个集合,以基于与每个搜索结果相关联的一个或多
个分数(例如,由分类器产生的置信度分数)的递减次序或递增次序来产生搜索结果的单个
集合。然而,因为可以使用用于组合搜索结果的任何适当的?#38469;酰?#25152;以本文描述的本发明的
方面在这一点上不受限制。

在一些实施例中,语音辨识结果基于用户语音输入而确定,并且被用来执行对内
容仓库的无监督搜索和有监督搜索两者。语音辨识结果可以是例如通过对用户语音输入执
行语音辨识而产生的N最佳列表中的一个语音辨识结果。由有监督搜索和无监督搜索中的
每一者基于语音辨识结果产生的一个或多个搜索结果可以组合成搜索结果的集合。在一些
实施例中,代表对用户语音输入的不同假设的多个语音辨识结果可以全都被用来执行对内
容仓库的有监督搜索和无监督搜索,并且然后可以组合搜索结果以产生搜索结果的集合。

在一些实施例中,基于用户语音输入而确定的语音辨识结果可以被分类为有监督
搜索的候选、无监督搜索的候选或者这二者。可以使用先前被训练为基于语音辨识结果识
别内容的类型的分类器将语音辨识结果分类成这些分类的一个。例如,如果由将输入分类
成内容的相对较少数量分类中之一的分类器执行有监督搜索,那么将查询识别为与这些分
类中之一无关的第一阶段分类器可以导致该输入不被用来执行有监督搜索,这是考虑?#25509;?br />监督搜索不太可能返回有关的结果。一旦被分类,语音辨识结果就可以按照由分类指定的
方式使用,以从有监督搜索、无监督搜索或者这二者中产生一个或多个搜索结果。以这种方
式,多个语音辨识结果可以被用来产生搜索结果,并且可以组合这些搜索结果以产生搜索
结果的集合,该集合可以包括来自有监督搜索和无监督搜索这二者的搜索结果。在一些实
施例中,使用分类器对语音辨识结果进行分类以与有监督搜索、无监督搜索或者这二者一
起使用,可以通过在执行搜索之前基于语音辨识结果选择一种类型或者另一种类型的搜
索,来减少基于语音辨识结果执行的无监督搜索和/或有监督搜索的数量。

如上面所讨论的,一些实施例涉及使用经训练的分类器对诸如语音辨识结果之类
的查询进行分类。本文描述的?#38469;?#19981;限于与任何特定的分类器?#38469;?#19968;起使用,并且可以例
如使用逻辑回归分类器、支持向量机(SVM)分类器、指数族模型分类器或者任何其他适当类
型的分类器。本文描述的本发明的方面不局限于分类器的任何特定实现方式,并且能够与
任何适当的分类器一起使用。

如上面所讨论的,一些实施例涉及对内容的无监督搜索。无监督搜索可以包括任
何适当的无监督?#38469;酰?#26080;监督?#38469;?#30340;非限制性示例包括词频-逆文档频率法(TF/IDF)、
Okapi BM25、向量空间模型、页面排名(PageRank)以及关键字搜索。本文描述的本发明的方
面不限于任何特定的无监督?#38469;酰?#24182;且能够与任何适当的无监督?#38469;?#19968;起使用。

如本文描述的内容仓库可以包括数字内容的任何?#23454;被?#38598;,包括但不局限于一个
或多个文档数据文件、一个或多个关系数据库和/或一个或多个非临时性数据流或流程,它
们中的任何一个或多个可以存储任何类型的内容,包括但不局限于文本/文档、音频和/或
视频内容。由内容仓库存储的条目可以包括任何数量的内容类型(包括上面描述的那些),
并且可以以任何适当的方式存储。

在一些实施例中,分类器被训练为将输入分类成代表常见请求的内容的分类。例
如,本文描述的混合方法中的有监督搜索的分类器可以被训练为对输入进行分类,以识别
描述常见问题的解决方案和/或常见询问的问题的答案的条目。由此,可以通过使用被训练
为基于对应查询识别所选择条目中之一的分类器来提供搜索结果。在一些实施例中,搜索
结果可以附加地基于对剩余内容的无监督搜索而产生。

在一些实施例中,搜索查询中(例如,语音辨识结果中)的一个或多个单词可以被
用来访问包括有关单词和/或短语的分层结构的本体。搜索查询可以基于由本体识别为与
查询中的单词有关的单词和/或短语来补充,例如,通过将来自本体的一个或多个相关联的
元素并入到搜索查询中(例如,通过将单词添加到查询)。由此,可以使用相关联的元素扩展
查询的搜索空间。例如,元素“电话”可以在本体中与元素“电话机”和“移动”相关联。搜索查
询“我如何关闭我的电话?”可以由本体补充而生成额外包括单词“电话机”和/或“移动”的
搜索查询。然后可以基于经补充的查询来执行搜索,这可以搜索比未经补充的查询更大部
分的内容仓库。

在一些实施例中,一个或多个搜索结果经由用户接口(例如,经?#19978;?#31034;器和/或经
由合成语音)展示给用户。可以使用用户接口以任何适当的方式展示被识别为搜索结果的
任何条目。在一个实施例中,可以提供多个搜索结果的标题或者摘要或者某个其他速记标
识符,并且用户可以选择用户期望完整展示的一个或多个结果。在一些实施例中,使用多个
模态(modality)。例如,识别为搜索结果的条目的标题可以通过语音提供而条目的主体可
以经?#19978;?#31034;器提供。替代地或者附加地,由搜索结果代表的整个条目(例如,最高得分结果)
可以经由语音合成提供给用户。然而,本文描述的本发明的方面不限于用于展示搜索结果
和/或由搜索结果识别的内容的任何特定?#38469;酰?#24182;且可以与任何适当的展示?#38469;?#19968;起使用。

如上面所讨论的,分类器可以被训练为将输入分类成与内容仓库中的内容的一部
分有关的分类。然后可以随后基于新的查询在有监督搜索中(亦即,使用经训练的分类器
和/或经由无监督搜索)搜索该部分内容,而内容仓库中的另一部分内容可以仅经由无监督
搜索进行搜索。图1例示包括两个部分的内容的例示性内容仓库,一个可用于有监督搜索
(并且可选地无监督搜索)而另一个仅可用于无监督搜索。

图1描绘例示性实施例,其中内容仓库存储与机动车辆的操作有关的内容。内容仓
库100存储包括例示性条目110的内容部分101,以及包括例示性条目121和122的内容部分
102。包括例示性条目110的内容部分101描绘典型地可以在机动车辆所有者的手册的主体
中?#19994;?#30340;内容,而包括例示性条目121和122的内容部分102以问/答格式的类型提供,其可
以作为所有者的手册的补充材料而创建。条目110、121和122可以以任何适当的格式存储在
内容仓库100中,诸如文本和/或音频。在图1的示例中,分类器可以已经被训练为将查询与
内容部分102的条目相关联,使得使用本文描述的混合方法的对内容仓库100的搜索可以执
行对内容部分101的无监督搜索和/或可以执行对内容部分102的有监督搜索(以及可选地
还有无监督搜索)。

在图1的示例中,内容部分102的问/答格式可以便于经训练的分类器基于查询可
接受地识别相关问/答对(诸如条目121和/或122)以识别简明地解决用户遇到的问题的内
容。

相比之下,条目110可能需要由用户进行仔细的解析以识别期望的信息(例如,如
?#26410;?#24320;雾灯)。不仅条目110包括与如?#26410;?#24320;雾灯的特定问题不直接有关的不相干信息,而
?#20197;?#25351;示如何激活大灯开关以打开雾灯的文本附近也没有提供重要的上下文信息,也就是
?#25353;?#28783;开关”位于哪里。因此,虽然对条目110的搜索可以最终提供有帮助的信息,但是与访
问条目121相比较,用户可能需要更费劲来确定该信息,因为用户必须访问内容的多个章节
并?#26131;?#21512;这些章节中的信息来确定期望的信息。

如上面所讨论的,发明者已经认识到并且领会,虽然内容102在可用时可以具有某
些优点,但是该内容的?#27573;?#21487;能是有限的。因此,虽然内容部分102的方面(诸如问/答格式
的简洁之类)在内容仓库中用于搜索时可以提供优于内容部分101的优点,但是这些优点仍
然限于在内容部分102中提供的特定内容。例如,可能在内容部分101中存在的信息(诸如如
?#26410;?#24320;停?#26723;?可能不存在于内容部分102中。如上面所讨论的,训练分类器执行对该材料
(例如,整个用户手册)的有监督搜索可能需要比仅仅针对内容部分102训练数据来训练分
类器多得多的训练数据。代替地,如果除了对内容部分102的有监督搜索之外,还执行对内
容部分101的无监督搜索,那么内容(例如,如?#26410;?#24320;停?#26723;?可以作为搜索结果而提供,而
没有必要获得训练分类器搜索内容部分101将必需的训练数据。

另外,在图1的示例中,因为条目110的长度,展示条目110可能不方便,而条目121
更加简明。例如,用户可能发现当使用条目110展示(例如,通过阅读或者收听内容)时难以
回忆有关信息,因为用户正在搜索的信息(例如,如?#26410;?#24320;雾灯)可能在比条目121中长的展
示上展开。对于用户不方便或者难以阅读来自内容仓库的内容(或者收听内容等)的情况
和/或应用而言,诸如条目121这样的简明展示由此可以提供特定的优点。例如,机动车辆的
驾驶员可能希望在驾驶同时学习车辆的操作。诸如条目121这样的内容可以为驾驶员在操
作期间学习如何操作车辆的特征(诸如如?#26410;?#24320;雾灯)提供快捷的方式。

在一些实施例中,接收用户话音查询并且使用从用户话音查询中生成的一个或多
个语音辨识结果来执行对内容仓库的有监督搜索和/或无监督搜索。图2是执行对内容仓库
的有监督搜索和/或无监督搜索并?#26131;?#21512;搜索结果的一个非限制性例示性过程200的流程
图。过程200可以由任何适当的设备执行,在下面关于图8讨论设备的示例。

在动作202中,接收用户话音查询。用户话音查询可以包括音频数据并且可以以任
何适当的方式接收。例如,麦克风或者其他音频捕获设备可以接收语音并且从语音中生成
音频数据。替代地或者附加地,可以提供包括音频数据的数据文件(例如,如果在其上执行
过程200的计算机与具有麦克风以接收话音输入的计算机不同的话)。然而,因为可以使用
用于接收用户话音查询的任何?#38469;酰?#25152;以这些是非限制性示例。

在动作204中,基于用户话音查询生成语音辨识结果。该生成可以由自动语音辨识
(ASR)引擎执行。例如,可以对用户话音查询执行ASR,并且可以生成语音辨识结果的N最佳
列表。在一些实施例中,语音辨识结果的一个或多个与指示语音辨识结果的预测相关性的
分数相关联。例如,经由ASR生成的语音辨识结果的N最佳列表中的每个结果可以与置信度
分数相关联,该置信度分数可以由ASR过程产生。

在动作206中,使用在动作204中生成的语音辨识结果中的一个或多个来执行对内
容仓库的一个或多个有监督搜索和/或无监督搜索。一个或多个有监督搜索和/或无监督搜
索可以产生包括识别内容仓库中的内容的信息的一个或多个搜索结果。例如,搜索结果可
以包括识别相关联的内容的标识符、到相关联的内容的链接、相关联的内容的标题、相关联
的内容的概述、相关联的内容的一部分、或者识别仓库中的内容的任何其他适当的信息。

在动作204中生成的语音辨识结果中的任何一个或多个可以被用作搜索查询以使
用该语音辨识结果执行有监督搜索和/或无监督搜索。如上面所讨论的,在一些实施例中,
语音辨识结果可以用来执行对内容仓库的有监督搜索和无监督搜索两者,而在其他实施例
中,语音辨识结果可以被用来执行对内容仓库的有监督搜索或者无监督搜索。在动作206中
执行的任何有监督搜索和/或无监督搜索可以搜索内容仓库的一部分或者全部。

在一些实施例中,可以通过将语音辨识结果中的一个或多个单词识别为与本体中
的一个或多个元素对应来补充搜索查询,并?#20197;?#21160;作206中所执行的无监督搜索和/或有监
督搜索可以基于一个或多个经补充的搜索查询。在下面关于图7讨论基于本体生成经补充
的搜索查询的示例。

根据一些实施例,在动作206中执行的有监督分类可以搜索内容仓库的一部分。如
上面所讨论的,分类器可以被训练为将输入分类为与内容仓库的一部?#31181;?#30340;内容相关,并
且使用该分类器对查询的随后分类可以从那部?#31181;?#25552;供搜索结果。例如,在图1中描绘的例
示性内容仓库中,可以已经在内容部分102上训练分类器,并且随后对查询的有监督分类可
以识别内容部分102内的内容,诸如内容121或者122。

根据一些实施例,在动作206中执行的无监督搜索可以搜索内容仓库的全部。在其
他实施例中,无监督搜索可以限于搜索内容仓库的仅一部分。例如,在图1中描绘的例示性
内容仓库中,无监督搜索可以仅在没有由分类器分类并且经历有监督搜索的内容(例如,内
容部分101)上执行。

无论如何搜索内容仓库,一个或多个搜索结果可以由有监督搜索和/或无监督搜
索产生。在一些实施例中,给一个或多个搜索结果分配指示对应搜索结果的预测相关性的
相关联的分数。例如,在判定第一搜索结果比第二搜索结果与搜索查询更相关的情况下,第
一搜索结果可以与比关联于第二搜索结果的分数高的分数相关联。在一些实施例中,与一
个或多个相应的搜索结果相关联的一个或多个分数被规格化。例如,可以通过一个或多个
数学运算对一个或多个分数进行缩放、转换和/或以其他方式变换,使得一个或多个分数的
总和等于特定的值(诸如1)。这可以具有允许在以不同方式(例如,通过无监督搜索对比通
过有监督搜索、使用不同ASR结果的查询、使用(或者不使用)来自本体的不同元素的查询,
等)产生的搜索结果的潜在相关性之间准确比较的益处。

在动作208中,可以组合由在动作206中执行的一个或多个有监督搜索和/或无监
督搜索产生的搜索结果。如上面所讨论的,动作206可以包括对内容仓库的一个或多个有监
督搜索和/或无监督搜索,并且每个搜索可以产生一个或多个搜索结果。可以在动作208中
使用任何适当的?#38469;?#32452;合由动作206产生的搜索结果。在一些实施例中,使用与一个或多个
搜索结果相关联的一个或多个分数产生搜索结果的经组合的集合,诸如通过至少部分地基
于一个或多个分数对搜索结果的集合进行排序。例如,如上面所讨论的,在动作204中生成
的语音辨识结果可以与每个结果的置信度分数相关联,和/或由有监督搜索或者无监督搜
索产生的搜索结果可以与另外的分数(例如,经规格化的分数)相关联。这些分数中的任何
一个或多个可以至少部分地用来确定搜索结果的经组合的集合的次序。

在一些用例中,一个或多个搜索结果可能识别内容仓库中的相同内容。例如,基于
两个不同搜索查询的有监督搜索可能识别相同的搜索结果,和/或基于相同搜索查询的无
监督搜索和有监督搜索可能识别相同的搜索结果。在这种情况下,诸如当在步骤208中执行
组合步骤时,可以从搜索结果的经组合的列表中排除或移除重复的搜索结果。在一个或多
个分数与重复的搜索结果相关联的情况下(例如,如上面所讨论的任何分数),分数中的任
一个或者基于组合分数的值,可以用于重复的搜索结果。例如,当组合搜索结果时,可以保
留多个重复的搜索结果的最高分数,或者可以使用多个分数的平均值。

在动作210中,可以展示在动作208中确定的搜索结果的经组合的集合中的一个或
多个搜索结果。可以以任何适当的方式展示搜索结果,包括经由一个或多个显示器和/或经
由话音,因为本文描述的本发明的方面不限于任何特定的展示?#38469;酢?#22312;动作210中,可以使
用与搜索结果相关联的内容的任何适当部分展示搜索结果。例如,可以使用与搜索结果相
关联的条目的方面(例如,标题和/或概述)来展示搜索结果。此外,可以提供使得系统调整
搜索结果的展示的一个或多个方面的用户输入给实现过程200的系统。作为搜索结果的展
示的一个非限制性示例,可以通过在显示器上显示与搜索结果相关联的条目的标题来展示
搜索结果。当(例如,经由话音命令、到显示器的触摸输入或者以任何其他适当的方式)选择
条目中的一个时,可以通过话音展示该条目(例如,通过对条目中文本执行文?#38236;?#35821;音转
换)。

在下面更详?#35813;?#36848;的图3-图6描绘用于执行图2中描述的动作中的一些或全部的
?#38469;?#30340;非限制性示例。下面的示例可以以任何适当的方式实现并?#20063;?#38480;于任何特定的实现
?#38469;?例如,用于对内容的分类或者执行对内容的无监督搜索)。

根据一些实施例,搜索查询可以被用来执行对内容仓库的有监督搜索和无监督搜
索这二者。图3是基于语音辨识结果执行有监督搜索和无监督搜索这两者的一个非限制性
例示性过程300的流程图。由每种类型的搜索生成的搜索结果随后可以被组合成搜索结果
的单个集合。虽然图3中的例示性过程被描绘为使用第一语音辨识结果执行一个无监督搜
索和一个有监督搜索,但是应当领会,任何数量的语音辨识结果可以类似地被用来以下面
描述的方式执行对内容的附加的有监督搜索和无监督搜索。

如上面分别关于图2中所示的动作202和204描述的,在动作302中,接收用户话音
查询,并?#20197;?#21160;作304中,基于用户话音查询生成语音辨识结果。

在动作306中,使用在动作304中生成的语音辨识结果中的第一语音辨识结果来执
行对内容仓库的无监督搜索。可以在动作306中执行的无监督搜索中搜索存储在内容仓库
中的内容的任何适当的方面。例如,可以搜索存储在内容仓库中的条目的标题,和/或可以
搜索存储在内容仓库中的条目的全文。

在一些实施例中,仅内容仓库的一部分是由无监督搜索来搜索的。在一些用例中,
由无监督搜索搜索的内容仓库的部分可以被选择为与由有监督搜索搜索的部分不同的内
容部分。例如,除了其他内容之外,内容仓库还可以包括问题/解决方案格式的内容(例如,
如图1中所例示的)。选择用于由动作306中的无监督搜索进行搜索的内容仓库的部分可以
被选择为排除问题/解决方案格式的内容的部分。然而,这仅是一个示例,因为本发明的方
面可以用来执行对内容仓库的全部或者任何部分的有监督搜索和无监督搜索。

除了基于其他查询(在动作306和/或动作308中)产生的任何其他搜索结果之外,
由动作306产生的搜索结果可以在下面描述的动作310中与在动作308中由使用相同查询的
有监督搜索产生的搜索结果组合。

在动作308中,使用在动作304中生成的语音辨识结果中的第一语音辨识结果执行
对内容仓库的有监督搜索。使用先前在训练数据上训练的分类器执行有监督搜索,其中训
练数据将示例性查询与来自内容仓库的对应条目相关联。如上面所讨论的,用于有监督分
类的分类器可以被训练为识别来自内容仓库的任何数量的内容。分类器可以在动作308中
使用,以将第一语音辨识结果分类为与内容仓库中的一个或多个条目有关。

在一些实施例中,分类器被训练为以识别内容仓库的仅一部分的方式对输入进行
分类。例如,除了其他内容之外,内容仓库可以包括问题/解决方案格式的内容(例如,如图1
中所例示的)。选择用于由动作308中的有监督搜索进行搜索的内容仓库的部分可以被选择
为包括问题/解决方案格式的内容。然而,这仅是一个示例,因为本发明的方面可以被用来
执行对内容仓库的全部或者任何部分的有监督搜索。

无论如何搜索内容仓库,一个或多个搜索结果可以由有监督搜索产生。在一些实
施例中,一个或多个搜索结果具有指示对应搜索结果的预测相关性的相关联的分数。例如,
当第一搜索结果与比关联于第二搜索结果的分数高的分数相关联时,可以判定第一搜索结
果比第二搜索结果与搜索查询更相关。在一些实施例中,与一个或多个相应的搜索结果相
关联的一个或多个分数被规格化。例如,可以通过一个或多个数学运算对一个或多个分数
集体地进行缩放、转换和/或以其他方式变换。这可以具有允许在由无监督搜索和/或有监
督搜索产生的其他搜索结果(该其他搜索结果可以由与用来产生经规格化的搜索结果的查
询不同的查询或者相同的查询造成)之间准确比较的益处。

在一些实施例中,与一个或多个搜索结果相关联的分数可以至少部分地基于对分
数的熵的测量而进行缩放。如下面描述的,与有监督搜索结果相关联的分数可以和与无监
督搜索结果相关联的分数比较,以便在动作310中组合搜索结果。然而,在一些用例中,由两
种类型的搜索产生的分数可能单独不体现经组合的搜索结果的最准确相关性排名,即使两
个分数的集合已经被规格化。例如,基于搜索查询的有监督搜索可以产生具有低的经规格
化的置信度值的搜索结果。在这种例示性情况下,有可能没有搜索结果与搜索查询相关,因
为它们是经由有监督分类产生的并且如果查询与正在搜索的内容相关,则预期它们将产生
更高的值。然而,相同的搜索查询可以从对内容的无监督搜索中产生可比较的经规格化的
置信度分数,其实际上可以比类似得分的有监督分类搜索结果更相关。基于对搜索结果的
熵的测量对与搜索结果相关联的分数进行缩放可以更加恰当地对搜索结果进行加权,使得
可以更加准确地比较它们的相关性。

在一些实施例中,针对一个或多个搜索结果计算熵缩放因子,使得当一个分数比
其他分数高得多时熵最小,并?#19994;?#25152;有分数具有相同的值时熵最大。熵缩放因子可以乘以
与搜索结果相关联的分数,以产生熵加权的分数。例如,熵缩放因子可以如下计算:


其中“分数(Score)”可以是与搜索结果相关联的任何分数(例如,置信度分数、经
规格化的置信度分数等),并且N是正在针对其计算熵缩放因子的搜索结果(Search
Results)的数量。在该示例中,N个分数中的每个分数可以乘以如上面的例示性公式所定义
的缩放因子以确定熵加权的分数。然而,通常,因为本文描述的本发明的方面在这一点上不
受限制,所以可以应用任何适当的熵缩放因子。

适当的熵缩放因子可以应用于搜索结果的任何集合。例如,基于搜索查询从有监
督搜索输出的一个或多个搜索结果可以基于针对该一个或多个搜索结果而计算的熵缩放
因子进行熵加权。替代地或者附加地,基于多个搜索查询从有监督搜索输出的一个或多个
搜索结果可以基于针对该一个或多个搜索结果而计算的熵缩放因子一起进行熵加权。

在一些实施例中,可以识别与内容仓库中的内容不相关的搜索查询。这种“超出领
域”搜索查询可能不产生准确地代表用户希望获得的信息的搜索结果,并且因此,识别超出
领域的搜索查询或者识别由超出领域的搜索查询导致的搜索结果可以是有益的。在一些实
施例中,通过在训练期间提供适当的示例,可以将在动作308中使用的分类器训练为辨别超
出领域的搜索查询。在一些实施例中,当与基于搜索查询产生的一个或多个搜索结果相关
联的所有置信度分数都低于阈值时,可以识别出超出领域的搜索查询。在一些用例中,由超
出领域的搜索查询产生的搜索结果可以从提供给用户的搜索结果中排除。

作为识别超出领域的搜索查询的一个非限制性示例,内容仓库可以包括与机动车
辆的操作有关的内容,并且用户话音查询可以是“How do I close the trunk?(我如何关
闭行李箱?)?#20445;?#20294;是针对该查询的一个语音辨别结果可以是“How do I nose the junk?(我
如何嗅到废物?)”。在该例示性情况下,排除由“How do I nose the junk?”的搜索导致的
搜索结果可以是有益的,因为内容仓库中最相关的内容匹配不太可能与用户试图识别的信
息相关。如上面所讨论的,在一些实施例中,查询“How do I nose the junk?”可能产生具
有全部低于阈值的置信度值的搜索结果,这可以将查询识别为超出领域,并且这可以使得
这些搜索结果被排除。在一些实施例中,分类器可以已经被训练为识别超出领域的搜索查
询,并且分类器可以将查询“How do I nose the junk?”分类为超出领域的搜索查询。在这
种情况下,分类器可以不将任何内容识别为对应于搜索查询,并且因此可以不必排除由超
出领域的搜索而产生的搜索结果。

在动作310中,可以组合由在动作308和动作306中执行的有监督搜索和无监督搜
索产生的搜索结果。可以使用任何适当的?#38469;?#32452;合搜索结果。在一些实施例中,与搜索结果
相关联的一个或多个分数(例如,置信度值、经规格化的置信度值、熵加权的置信度值和/或
经规格化的熵加权的置信度值)被用来产生搜索结果的经组合的集合,诸如通过至少部分
地基于一个或多个分数对搜索结果的集合进行排序。例如,如上面所讨论的,由动作308中
的有监督搜索产生的一个或多个搜索结果可以与可以经过规格化和熵加权的各自的置信
度分数相关联,并且由动作306中的无监督搜索产生的一个或多个搜索结果可以与可以经
过规格化的各自的置信度分数相关联。可以通过整理这些搜索结果的全部并且根据它们各
自的置信度分数对它们进行排序而产生搜索结果的经组合的集合。

图4描绘分别根据图2和图3中所示的过程200和300,搜索内容仓库中的内容的例
示性过程。在图4的示例中,用户执行对内容仓库的搜索,该内容仓库包括与机动车辆的操
作有关的内容。过程400接收用户话音查询,并且生成两个例示性语音辨识结果410,标注为
A和B。在图4的示例中,用户说“How do I start the car?(我如何发动轿车?)?#20445;?#36825;在语音
辨识结果B中被正确地辨识,但是在语音辨识结果A中被错误地辨识。例示性过程400使用上
面描述的任何?#38469;?#38024;对每个语音辨识结果执行无监督搜索和有监督搜索。

两个语音辨识结果A和B中的每一个都被用作无监督搜索和有监督搜索这两者的
搜索查询。语音辨识结果A被用作无监督搜索的查询并?#20063;?#29983;来自内容仓库的三个搜索结
果,并且语音辨识结果B被用作无监督搜索的查询并且也产生来自内容仓库的三个搜索结
果。搜索结果中的每一个与代表对应搜索结果的预测相关性的置信度分数相关联。搜索结
果的两个集合的分数独立地规格化,使得与每个语音辨识结果对应的搜索结果的分数的总
数合计为1。搜索结果和经规格化的分数作为经规格化的无监督搜索结果420在图4中示出。

语音辨识结果A被用作有监督搜索的查询并?#20063;?#29983;来自内容仓库的两个搜索结
果,并且语音辨识结果B被用作有监督搜索的查询并?#20063;?#29983;来自内容仓库的两个搜索结果。
搜索结果中的每一个与代表对应搜索结果的预测相关性的置信度分数相关联。搜索结果的
两个集合的分数独立地规格化,使得与每个语音辨识结果对应的搜索结果的分数的总数合
计为1。搜索结果和经规格化的分数作为经规格化的有监督搜索结果430在图4中示出。

在图4的示例中,针对其使用分类器在动作308中对搜索查询进行分类的内容包括
问题/解决方案格式的条目(诸如图1中所示的条目121)。在例示性过程400中,经规格化的
有监督搜索结果430识别具有该形式的内容的条目,而经规格化的无监督搜索结果420识别
包括更典型地在车辆的所有者手册中?#19994;?#30340;散文(prose)的条目。

如上所述,在一些实施例中,与搜索结果相关联的分数可以熵加权。在图4的示例
中,通过将经规格化的有监督搜索结果430中的每一个乘以相同的熵缩放因子,对经规格化
的有监督搜索结果430进行熵加权以产生熵加权的有监督搜索结果440。因为在经规格化的
有监督搜索结果430中与针对语音辨识结果B的搜索结果相关联的分数具有非常不同的值,
所以所确定的熵缩放因子接近1;在图4的示例中,应用于这些分数的熵缩放因子是0.9。相
比之下,因为在经规格化的有监督搜索结果430中与针对语音辨识结果A的搜索结果相关联
的分数有些相似,所以所确定的熵缩放因子较小;在图4的示例中,应用于这些分数的缩放
因子是0.5。

组合搜索结果420和440以产生搜索结果的经组合的集合450。在图4的示例中,搜
索结果以相关联的分数的递减次序排序,使得问题/解决方案条目“How do I start the
car?”被认为是最相关的内容匹配,紧接着是与“Ignition Controls(点火控制)”有关的条
目等。注意在图4的示例中,识别条目“How do I start the car?”的重复的搜索结果已经
从经组合的搜索结果中排除。在例示性过程400中,排除具有?#31995;?#20998;数值0.6的重复的搜索
结果。

根据一些实施例,语音辨识结果可以被用来执行对内容仓库的有监督搜索或者无
监督搜索。图5是基于搜索查询执行有监督搜索或者无监督搜索的一个非限制性例示性过
程500的流程图。由每种类型的搜索以及基于每个语音辨识结果生成的搜索结果可以随后
被组合成搜索结果的单个集合。虽然图5的例示性过程被描绘为使用第一语音辨识结果执
行无监督搜索或者有监督搜索,但是应当领会,任何数量的语音辨识结果可以类似地被用
来以下面描述的方式执行对内容的附加的有监督搜索和/或无监督搜索。

如上面分别关于图2中所示的动作202和204描述的,在动作502中,接收用户话音
查询,并?#20197;?#21160;作504中,基于用户话音查询生成语音辨识结果。

在动作506中,在动作504中生成的语音辨识结果中的第一语音辨识结果被分类为
对应于多个分类的一个,该多个分类包括与对内容仓库的无监督搜索相关联的第一分类以
及与对内容仓库的有监督搜索相关联的第二分类。如上面描述的,使用附加的分类器可以
通过在执行搜索之前基于语音辨识结果选择一种或者另一种类型的搜索,来减少基于语音
辨识结果执行的无监督搜索和/或有监督搜索的数量。

在动作506中被用来对第一语音辨识结果进行分类的分类器可以已经针对示例性
搜索查询以及每个查询所属的分类的对应指示被训练。示例性查询可以由系统的开发者编
写,和/或可以从内容仓库中的内容中生成和/或逐?#21482;?#21462;。示例性查询对应于哪个分类可
以取决于选择用于训练对内容仓库的有监督搜索的分类器的内容的部分。

在一些实施例中,在动作506中使用的分类器将一个或多个语音辨识结果识别为
对应于超出领域的搜索查询。如上面所讨论的,超出领域的搜索查询可能不产生准确地代
表用户希望获得的信息的搜索结果,并且因此识别超出领域的搜索查询或者识别由超出领
域的搜索查询导致的搜索结果可以是有益的。虽然图5中没有示出,但是过程500可以允许
拒绝由在动作506中使用的分类器识别出的超出领域的搜索查询,而不执行基于那些搜索
查询的搜索。

作为用于训练分类器的非限制性例示性用例,在内容仓库中的内容包括问题/解
决方案格式的条目的情况下,条目(例如,“How do I start the car?”)的“问题”部分的文
本可以作为与有监督搜索分类相关联的示例性查询而提供。没有以问题/解决方案格式提
供的条目的标题可以作为与无监督搜索分类相关联的示例性查询而提供。其他内容,包括
没有包括在内容仓库中的任何内容,可以作为被认为超出领域的示例性查询而提供。作为
到分类器的输入而提供的随后的查询可以被识别为对应于这三种分类(有监督、无监督或
者超出领域)中的一种。

当第一语音辨识结果在动作506中被分类为对应于无监督搜索时,在动作508中执
行使用第一语音辨识结果作为搜索查询的无监督搜索。在动作508中执行的无监督搜索可
以以任何适当的方式执行,包括使用上面关于图3中所示的动作306而描述的任何?#38469;酢?#24403;
第一语音辨识结果在动作506中被分类为对应于有监督搜索时,在动作510中执行使用第一
语音辨识结果作为搜索查询的有监督搜索。在动作510中执行的有监督搜索可以以任何适
当的方式执行,包括使用上面关于图3中所示的动作308而描述的任何?#38469;酢?br />

图6描绘分别根据图2和图5中所示的过程200和过程500,搜索内容仓库中的内容
的例示性过程。在图6的示例中,用户执行对内容仓库的搜索,该内容仓库包括与机动车辆
的操作有关的内容。过程600接收用户话音查询并且生成两个例示性语音辨识结果610,标
注为A和B。在图6的示例中,用户说“How do I start the car??#20445;?#36825;在语音辨识结果B中被
正确地辨识,但是在语音辨识结果A中被错误地辨识。例示性过程600基于分类器的输出针
对每个语音辨识结果执行无监督搜索或者有监督搜索,这可以使用上面描述的任何?#38469;?#23436;
成。在图6的示例中,语音辨识结果A和B被示为分别具有由语音辨识提供的置信度值0.6和
0.5。

基于分类器615的输出,语音辨识结果A和B各自被用作针对无监督搜索或者有监
督搜索的搜索查询。如上面所讨论的,经训练的分类器可以确定查询对应于多个分类中的
哪些,其中分类包括与有监督搜索相关联的分类和与无监督搜索相关联的分类。在图6的示
例中,语音辨识结果A被识别为对应于与无监督搜索相关联的分类,并且语音辨识结果B被
识别为对应于与有监督搜索相关联的分类。

语音辨识结果A用作针对无监督搜索的查询并?#20063;?#29983;来自内容仓库的三个搜索结
果。搜索结果中的每一个?#21152;?#20195;表对应搜索结果的预测相关性的置信度分数相关联。搜索
结果的每个集合(在图4的示例中,仅存在其中的一个)的分数被规格化(例如,使得与每个
语音辨识结果对应的搜索结果的分数的总数合计为1)。搜索结果和经规格化的分数作为经
规格化的无监督搜索结果620在图6中示出。

然后由用来产生搜索结果的语音辨识结果的置信度值对经规格化的无监督搜索
结果620进行加权,在图4的示例中该置信度值是值0.6。该步骤产生置信度加权的无监督搜
索结果640。

语音辨识结果B被用作针对有监督搜索的查询并?#20063;?#29983;来自内容仓库的三个搜索
结果。搜索结果中的每一个与代表对应搜索结果的预测相关性的置信度分数相关联。搜索
结果的每个集合(在图4的示例中,仅存在其中的一个)的分数被规格化(例如,使得与每个
语音辨识结果对应的搜索结果的分数的总数合计为1)。搜索结果和经规格化的分数作为经
规格化的有监督搜索结果630在图6中示出。

然后由用来产生搜索结果的语音辨识结果的置信度值对经规格化的有监督搜索
结果630进行加权,在图4的示例中该置信度值是值0.5。该步骤产生置信度加权的有监督搜
索结果650。

组合搜索结果640和650以产生搜索结果的经组合的集合660。在图6的示例中,搜
索结果以相关联的分数的递减次序排序,使得问题/解决方案条目“How do I start the
car?”被认为是最相关的内容匹配,按照该次序紧接着是与“Towing the car(拖车)”有关
的条目,紧接着是“Connecting your cellphone(连接你的蜂窝电话)”、“Accessing the
Radio(访问收音机)”以及“How do I clean the car?(我如何清洁轿车?)”。

根据一些实施例,并且如上面所讨论的,搜索查询(例如,语音辨识结果)中的一个
或多个单词可以在本体中被识别出来并且被用来补充搜索查询。图7例示与汽车有关的例
示性本体700的一部分。有关的元素之间的连接在图7中作为实线示出,而同义词之间的连
接作为虚线示出。本体中元素之间的连接代表元素之间的概念相似性。下面进一步描述的
与每个连接相关联的权重被示为邻近连接线,并且可以识别所连接元素之间的概念相似性
的强度。

采用本体的实施例可以使用任何类型的本体,以及以任何方式创建的本体,因为
本文描述的?#38469;?#22312;这一点上不受限制。在一些实施例中,诸如本体700这样的本体可以已经
整体或者部分地自动生成。内容仓库中的任何内容或者与内容仓库中的内容有关的任何内
容(诸如索引、条目标题或头条的汇集,和/或内容的表格)可以被用来生成诸如本体700这
样的本体。替代地或者附加地,本体可以整体或者部分地基于在公开可用的本体(诸如
“ConceptNet”)中?#19994;?#30340;分组和/或分层结构而生成。

如在图7的例示性本体中由连接元素的线所示的本体中元素之间的?#25104;洌?#21487;以与
代表元素之间相似性的级别的一个或多个权重相关联。在一些用例中,因为作为同义词的
元素指代相同的概念,所以同义词可以经由比典型地用于元素之间的非同义词连接高的权
重值来连接。在例示性本体700中与元素之间的连接相关联的权重值在图7中在连接元素的
线?#21592;?#31034;出。

当使用上面描述的任何?#38469;?#21644;/或过程执行对内容的无监督搜索时,通过识别本
体中与搜索查询中的一个或多个单词对应的一个或多个元素,可以使用附加的信息补充搜
索查询。例如,通过识别本体700中元素“引擎?#24688;?#24182;且基于本体识别“发动机室”和“发动机
?#24688;?#19982;“引擎?#24688;?#26377;关,可以使用“发动机室”和“发动机?#24688;?#34917;充搜索查询“我如?#26410;?#24320;引擎
?#24688;薄?br />

在一些实施例中,通过将被识别为与搜索查询中的一个或多个单词有关的元素添
加到该搜索查询,使用搜索查询执行无监督搜索。因此,使用上面的示例,无监督搜索可以
使用查询“我如?#26410;?#24320;引擎盖发动机室发动机?#24688;?#26469;搜索。在一些实施例中,如上述针对无
监督搜索的添加到搜索查询的单词基于本体中到所识别元素的连接而被加权。例如,使用
上面的无监督搜索,所有单词可以具有权重1,除?#21496;?#26377;权重0.8的“发动机室”和具有权重
0.95的“发动机?#24688;薄?#28982;而,通常无监督搜索可以使用任何合适的?#38469;?#22522;于将搜索中的一个
或多个单词识别为本体中的元素来增强,因为本文描述的本发明的方面在这一点上不受限
制。

在一些实施例中,使用由本体的一个或多个元素补充的搜索查询执行有监督搜
索。向用于有监督搜索的分类器提供的搜索查询可以以任何适当的方式补充。在一些用例
中,提供给分类器的特征向量可以包括对具体有关概念的存在进行编码的一个或多个附加
的特征。例如,特征向量可以包括针对“引擎?#24688;?#30340;特征以及针对有关的“发动机室?#22791;?#24565;的
附加特征。在特征向量中,该附加特征可以高于“发动机室”的特征被提供,由此允许“发动
机室”短语在它作为搜索查询的部分时和在“发动机室”被识别为与查询中的一个或多个单
词(诸如“引擎?#24688;?有关的概念时被有区别地对待。由此,可以通过将如由本体识别的有关
概念的特征添加到被用作分类器的输入的特征向量,来扩展搜索查询。

在一些实施例中,在分类器的训练期间执行特征向量扩展。训练数据可以还包括
包含单词或短语的一个或多个示例性搜索查询,除了识别与那个单词或短语有关的概念
(例如,经由本体)的一个或多个示例性搜索查询之外。这可以允许将分类器训练为对?#22791;?br />念在搜索查询中被提供时和当同一概念是通过使用在本体中识别的有关概念扩展搜索查
询而被识别出来时的概念进行区分(例如,以提供不同的分类结果)。

例如,单词“喷水(mist)”可以在训练期间的一个或多个示例性搜索查询中被提供
为与将水施加到挡风玻璃的汽车功能有关。另外,单词“雾(fog)”可以在训练期间的一个或
多个示例性搜索查询中被提供为与汽车的雾灯功能有关。单词“雾”和“喷水?#24065;?#21487;以在本体
中是有关的。在分类器的训练期间,如果包含单词“喷水”的搜索查询与用“喷水”补充的搜
索查询(例如,通过辨识本体中“雾”和“喷水”之间的关联性)被相同地对待,那么汽车的雾
灯功能和水施加功能可能被分类器混为一谈,导致对与汽车的这些功能有关的查询进行分
类时准确性?#26723;?例如,搜索查询“雾按钮在哪里?”和“喷水按钮在哪里”可能被分类为相似
或者相同的查询)。通过将分类器训练为对?#22791;?#24565;在搜索查询中被提供时和?#22791;?#24565;是基于
本体而识别出来时的概念进行区分,分类器在查询基于本体而扩展时可以被更准确地训
练。如上面所讨论的,在一些实施例中,这可以包括:当单词或短语是提供在搜索查询中时,
在特征向量中为其提供与当单词或短语是基于本体而识别出来时为其提供的特征不同的
特征。

图8是可以被用?#35789;?#29616;上面描述的任何?#38469;?#30340;例示性计算设备800的框图。计算设
备800可以包括一个或多个处理器801以及一个或多个?#34892;?#30340;、非临时性计算机可读存储介
质(例如,存储器803)。存储器803可以将实现上面描述的任何功能性的计算机程序指令存
储在?#34892;?#30340;非临时性计算机可读介质中。处理器801可以耦?#31995;?#23384;储器803并且可以执行这
种计算机程序指令以使得功能性被实现和执行。

计算设备800也可以包括网络输入/输出(I/O)接口805,计算设备可以经由网络输
入/输出(I/O)接口805与其他计算机(例如,经由网络)通信,并且计算设备800还可以包括
一个或多个用户I/O接口807,计算机可以经由用户I/O接口807提供输出给用户以及接收来
自用户的输入。用户I/O接口可以包括诸如键盘、鼠标、麦克风、显示设备(例如,监视器或者
触摸屏)、扬声器、照相机这样的设备和/或各种其他类型的I/O设备。

本公开的上述实施例可以以许多方式中的任何一种实现。例如,可以使用硬件、软
件或者它们的组合?#35789;?#29616;实施例。当以软件实现实施例时,软件代码可以在任何适当的处
理器或者处理器的汇集上执行,无论软件代码是提供在单个计算机中还是分布在多个计算
机之间。应当领会,执行上述功能的任何组件或者组件的汇集可以一般地认为是控制上面
讨论的功能的一个或多个控制器。该一个或多个控制器能够以许多方式实现,诸如使用专
用硬件、或者使用利用微码或者软件编程的通用硬件(例如,一个或多个处理器),以执行上
面陈述的功能。

在这一点上,应当领会,本公开的实施例的一种实现方式包括使用计算机程序(亦
即,多个指令)编码的至少一种计算机可读存储介质(即,?#34892;?#30340;非临时性计算机可读介?#21097;?br />诸如计算机存储器、软盘、压缩盘、磁带或者其他?#34892;?#30340;、非临时性计算机可读介质),计算
机程序当在一个或多个处理器上执行时,执行本公开的实施例的上面讨论的功能。计算机
可读存储介质可以是可传送的,使得存储在其上的程序可以加载到任何计算机资源上以实
现本文讨论的本公开的方面。另外,应当领会,对于当执行时执行上面讨论的任何功能的计
算机程序的引用不限于在主机计算机上运行的应用程序。更?#38750;械?#35828;,本文在一般的意义
上使用术语“计算机程序?#20445;?#20197;引用可以被采用以编程一个或多个处理器实现本公开的上面
讨论的方面的任何类型的计算机代码(例如,软件或者微码)。

本文使用的语法和术语是为了描述的目的而不应当看作限制。“包括”、“包含”、
“具有”、“内含”、“涉及”及其变形的使用意在涵盖在其后列出的项目以及附加的项目。在权
利要求书中诸如“第一”、“第二”、“第三”等这样的次序术语的使用以修饰权利要求元素,本
身不意味着一个权利要求元素优于另一个的任何优先级、优先序或者次序,或者执行过程
的动作的时间次序。次序术语仅用作标注,以区分具有某个名称的一个权利要求元素与(若
非使用次序术语)具有相同名称的另一个元素,以彼此区分权利要求元素。

本文已经详细地描述了本公开的几个实施例,各种修改和改进将容易由本领域技
术人员想到。这种修改和改进旨在在本发明的精神和?#27573;?#20869;。因此,前面的描述仅作为示
例,并?#20063;?#26088;在成为限制。本发明仅如由权利要求书及其等同物所定义的而限制。

关于本文
本文标题:用于对内容仓库的基于语音的搜索的系统和方法.pdf
链接地址:http://www.pqiex.tw/p-6091746.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 爱玩游戏官方下载 信誉高娱乐棋牌游戏 重庆百变王牌073047 正宗杰克棋牌官方版 上证指数走势 韩国快乐8官网 快乐扑克玩法 手机充值865棋牌 11月股票推荐 福彩开奖号和值走势图带连线