平码五不中公式规律
  • / 18
  • 下载费用:30 金币  

评估搜索查询的语义解释.pdf

关 键 ?#21097;?/dt>
评估 搜索 查询 语义 解释
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201580035377.3

申请日:

2015.09.01

公开号:

CN106663111A

公开日:

2017.05.10

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 著录事项变更IPC(主分类):G06F 17/30变更事项:申请人变更前:谷歌公司变更后:谷歌有限责任公司变更事项:地址变更前:美国加利福尼亚州变更后:美国加利福尼亚州|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150901|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 谷歌公司
发明人: 阿希什·韦努戈帕尔; 雅各布·D·乌斯克雷特; 约翰·布利策; 爱德华·埃弗里特·安?#24459;?
地址: 美国加利福尼亚州
优?#28909;ǎ?/td> 2014.09.15 US 62/050,627; 2015.03.11 US 14/644,803
专利代理机构: 中原信达知识产权代理有限责任公司 11219 代理人: 李宝泉;周亚荣
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201580035377.3

授权公告号:

||||||

法律状态公告日:

2018.01.19|||2017.06.06|||2017.05.10

法律状态类型:

著录事项变更|||实质审查的生效|||公开

摘要

本公开涉及对搜索查询的不同语义解释进行评估。一种示例方法包括针对提交至搜索引擎的特定搜索查询获得搜索结果集合;针对特定搜索查询获得语义解释的集合;针对所述集合中的每个语义解释获得规范化搜索查询;至少部分地基于所述特定搜索查询和针对所述语义解释的规范化搜索查询生成经修改的搜索查询;获得所述语义解释的经修改的搜索查询的搜索结果集合;并且针对所述集合中的每个语义解释确定以下集合之间的相似度的程度:(i)所述语义解释的经修改的搜索查询的搜索结果集合,以及(ii)所述特定搜索查询的搜索结果集合。

权利要求书

1.一种由一个或多个处理器执行的计算机实现的方法,所述方法包括:
针对提交至搜索引擎的特定搜索查询,获得搜索结果集合;
针对所述特定搜索查询,获得语义解释的集合,每个语义解释表示与所述特定搜索查
询相关联的候选意图;
针对所述集合中的每个语义解释,获得规范化搜索查询;
针对所述集合中的每个语义解释,至少部分地基于所述特定搜索查询和针对所述语义
解释的所述规范化搜索查询,生成经修改的搜索查询;
针对所述集合中的每个语义解释,获得所述语义解释的所述经修改的搜索查询的搜索
结果集合;以及
针对所述集合中的每个语义解释,确定(i)所述语义解释的所述经修改的搜索查询的
所述搜索结果集合与(ii)所述特定搜索查询的所述搜索结果集合之间的相似度的程度。
2.根据权利要求1所述的方法,其中,针对每个语义解释生成所述经修改的搜索查询包
括:对所述特定搜索查询进行重新格?#20132;?#20197;与针对所述语义解释的所述规范化搜索查询相
匹配。
3.根据权利要求1所述的方法,其中,针对每个语义解释生成所述经修改的搜索查询包
括:将所述特定搜索查询中包括的识别特定实体的子串替换为识别针对所述语义解释的所
述规范化搜索查询中包括的所述特定实体的替选子串。
4.根据权利要求1所述的方法,其中,确定所述相似度的程度至少部分地基于所述经修
改的搜索查询的所述搜索结果集合和所述特定搜索查询的所述搜索结果集合之间的交集
大小。
5.根据权利要求1所述的方法,其中,确定所述相似度的程度至少部分地基于所述经修
改的搜索查询的所述搜索结果集合和所述特定搜索查询的所述搜索结果集合之间的差别
大小。
6.根据权利要求1所述的方法,其中,确定所述相似度的程度至少部分地基于与所述特
定搜索查询相关联的特定关键词在所述经修改的搜索查询的所述搜索结果集合以及在所
述特定搜索查询的所述搜索结果集合中的出?#21046;德省?br />
7.根据权利要求1所述的方法,其中,确定所述相似度的程度至少部分地基于将所述经
修改的搜索查询的所述搜索结果集合的顺序与所述特定搜索查询的所述搜索结果集合的
顺序进行比较。
8.根据权利要求1所述的方法,进一步包括基于所述相似度的程度来选择特定语义解
释。
9.根据权利要求1所述的方法,其中,确定所述相似度的程度至少部分地基于将所述经
修改的搜索查询的所述搜索结果集合的属性与所述特定搜索查询的所述搜索结果集合的
属性进行比?#24076;?#20854;中所述属性包括统一资源定位符(URL)、结果中所包括的词项、关键词、元
数据或点击数据中的至少一个。
10.一种存储指令的非暂时性计算机可读介?#21097;?#25152;述指令在被执行时能够操作为使得
至少一个处理器执行操作,所述操作包括:
针对提交至搜索引擎的特定搜索查询,获得搜索结果集合;
针对所述特定搜索查询,获得语义解释的集合,每个语义解释表示与所述特定搜索查
询相关联的候选意图;
针对所述集合中的每个语义解释,获得规范化搜索查询;
针对所述集合中的每个语义解释,至少部分地基于所述特定搜索查询和针对所述语义
解释的所述规范化搜索查询,生成经修改的搜索查询;
针对所述集合中的每个语义解释,获得所述语义解释的所述经修改的搜索查询的搜索
结果集合;以及
针对所述集合中的每个语义解释,确定(i)所述语义解释的所述经修改的搜索查询的
所述搜索结果集合与(ii)所述特定搜索查询的所述搜索结果集合之间的相似度的程度。
11.根据权利要求10所述的计算机可读介?#21097;?#20854;中,针对每个语义解释生成所述经修改
的搜索查询包括:对所述特定搜索查询进行重新格?#20132;?#20197;与针对所述语义解释的所述规范
化搜索查询相匹配。
12.根据权利要求10所述的计算机可读介?#21097;?#20854;中,针对每个语义解释生成所述经修改
的搜索查询包括:将所述特定搜索查询中包括的识别特定实体的子串替换为识别针对所述
语义解释的所述规范化搜索查询中包括的所述特定实体的替选子串。
13.根据权利要求10所述的计算机可读介?#21097;?#20854;中,确定所述相似度的程度至少部分地
基于所述经修改的搜索查询的所述搜索结果集合和所述特定搜索查询的所述搜索结果集
合之间的交集大小。
14.根据权利要求10所述的计算机可读介?#21097;?#20854;中,确定所述相似度的程度至少部分地
基于所述经修改的搜索查询的所述搜索结果集合和所述特定搜索查询的所述搜索结果集
合之间的差别大小。
15.根据权利要求10所述的计算机可读介?#21097;?#20854;中,确定所述相似度的程度至少部分地
基于与所述特定搜索查询相关联的特定关键词在所述经修改的搜索查询的所述搜索结果
集合以及在所述特定搜索查询的所述搜索结果集合中的出?#21046;德省?br />
16.根据权利要求10所述的计算机可读介?#21097;?#20854;中,确定所述相似度的程度至少部分地
基于将所述经修改的搜索查询的所述搜索结果集合的顺序与所述特定搜索查询的所述搜
索结果集合的顺序进行比较。
17.根据权利要求10所述的计算机可读介?#21097;?#25152;述操作进一步包括基于所述相似度的
程度来选择特定语义解释。
18.一种系统,包括:
用于存储数据的存储器;和
能够操作为执行操作的一个或多个处理器,所述操作包括:
针对提交至搜索引擎的特定搜索查询,获得搜索结果集合;
针对所述特定搜索查询,获得语义解释的集合,每个语义解释表示与所述特定搜索查
询相关联的候选意图;
针对所述集合中的每个语义解释,获得规范化搜索查询;
针对所述集合中的每个语义解释,至少部分地基于所述特定搜索查询和针对所述语义
解释的所述规范化搜索查询,生成经修改的搜索查询;
针对所述集合中的每个语义解释,获得所述语义解释的所述经修改的搜索查询的搜索
结果集合;以及
针对所述集合中的每个语义解释,确定(i)所述语义解释的所述经修改的搜索查询的
所述搜索结果集合与(ii)所述特定搜索查询的所述搜索结果集合之间的相似度的程度。
19.根据权利要求18所述的系统,其中,针对每个语义解释生成所述经修改的搜索查询
包括:对所述特定搜索查询进行重新格?#20132;?#20197;与针对所述语义解释的所述规范化搜索查询
相匹配。
20.根据权利要求18所述的系统,其中,针对每个语义解释生成所述经修改的搜索查询
包括:将所述特定搜索查询中包括的识别特定实体的子串替换为识别针对所述语义解释的
所述规范化搜索查询中包括的所述特定实体的替选子串。

?#24471;?#20070;

评估搜索查询的语义解释

技术领域

本文总体上涉及搜索引擎,尤其涉及评估搜索查询的不同语义解释。

背景技术

互联网是响应于查询而提供信息的全球型计算机网络。所述信息为电子资源的形
式,例如,诸如网页、电子文件或其它资源。搜索引擎根据这些资源所包含的信息对所述资
源进行组织,允许用户提交搜索查询以?#19994;?#21253;含与特定查询有关的信息的资源。在一些实
例中,搜索查询可以是被提交至搜索引擎的定义用户所搜寻信息的单词的集合。搜索查询
还可以包括布尔运算符(例如,OR和AND)、搜索导引(例如,将搜索限制于具体领域),或者其
它组件。

发明内容

本公开涉及对搜索查询的不同语义解释进行评估。一种示例技术包括确定特定搜
索查询的一个或多个语义解释。每个语义解释与至少一个规范化查询相关联。针对每个语
义解释,基于原始搜索查询和相关联的规范化查询生成经修改的搜索查询。随后针对所述
特定搜索查询和经修改的搜索查询获得搜索结果。将每个经修改的搜索查询的搜索结果与
原始搜索查询的搜索结果进行比较以对与每个经修改的搜索查询相关联的语义解释进行
评估。例如,每个语义解释能够被排名或验证。以这种方式,能够将原始搜索查询的不同语
义解释相互比较。在一些情况下,能够基于所述比较来选择原始搜索查询的语义解释。

一种示例方法包括针对提交至搜索引擎的特定搜索查询获得搜索结果集合;针对
特定搜索查询获得语义解释的集合,每个语义解释表示与特定搜索查询相关联的候选意
图;针对所述集合中的每个语义解释获得规范化搜索查询;针对所述集合中的每个语义解
释至少部分地基于所述特定搜索查询和针对所述语义解释的规范化搜索查询生成经修改
的搜索查询;针对所述集合中的每个语义解释获得所述语义解释的经修改的搜索查询的搜
索结果集合;并且针对所述集合中的每个语义解释确定(i)所述语义解释的经修改的搜索
查询的搜索结果集合与(ii)所述特定搜索查询的搜索结果集合之间的相似度的程度。

所述?#24471;?#20070;中所描述主题的一个或多个实施方式的?#38468;?#22312;附图和以下描述中给
出。所述主题的其它特征、方面和优势将通过描述、附图和权利要求而变的显而易见。

附图?#24471;?br />

图1描绘了用于对搜索查询的语义解释进行评估的示例系统。

图2描绘了示例的经修改的搜索查询的示意图。

图3描绘了用于对搜索查询的语义解释进行评估的示例过程的流程图。

图4描绘了用于对搜索查询的语义解释进行评估的示例过程。

图5是可以被用?#35789;?#29616;本文中所描述的系统和方法的计算设备的框图。

各图中相同的附图标记指示相同的要素。

具体实施方式

搜索引擎可以通过咨询索引?#35789;?#21035;包含与用户所提供的搜索查询相关的信息的
资源,并且通过应用算法以基于与所述查询的相关性对所识别的资源进行排序,从而基于
所述查询提供搜索结果。为了提高搜索结果的质量,搜索引擎可以对所接收的搜索查询进
行解释从而辨别与每个查询相关联的可能意图,例如所述查询可能在搜寻什么信息。例如,
引用了“What is Barack Obama’s middle name?(巴拉克·奥巴马的中间名是什么?)”的
搜索查询可能与?#39029;?#24052;拉克·奥巴马(Barack Obama)的中间名的意图相关联。然而,一些
搜索查询可能是模糊或存在歧义的,并且可能不容易与特定的意图相关联。例如,引用了
“Washington’s age(华盛顿的年龄)”的查询例如可能是指总统乔治·华盛顿(George
Washington)、演员丹泽尔·华盛顿(Denzel Washington)、华盛顿州或者华盛顿D.C.。确定
与这样的存在歧义的查询相关联的用户意图可能存在着挑战。

因此,本公开描述了用于对特定搜索查询的不同解释进行评估的技术。一种示例
技术包括确定特定搜索查询的一个或多个语义解释。每个语义解释与至少一个规范化查询
相关联。针对每个语义解释,基于原始搜索查询和相关联的规范化查询生成经修改的搜索
查询。随后针对所述特定搜索查询和经修改的搜索查询获得搜索结果。将每个经修改的搜
索查询的搜索结果与原始搜索查询的搜索结果进行比较以对与每个经修改的搜索查询相
关联的语义解释进行评估。例如,每个语义解释能够被排名或验证。以这种方式,原始搜索
查询的不同语义解释能够被相互比较。在一些情况下,能够基于所述比较来选择原始搜索
查询的语义解释。

根据本公开的技术至少可以提供以下优势。使用搜索结果来评估不同的语义解
释,在产生搜索结果时所利用的诸如点击率数据、特定于用户的数据等的其它数据源得以
在不需要执行附加的分析的情况下被纳入考虑。此外,通过对查询的不同语义解释进行评
估,可以针对所述查询预测用户意图,由此缓解查询中的任何歧义对于所识别搜索结果的
质量的影响。

图1描绘了用于对搜索查询的语义解释进行评估的示例系统100。系统100包括基
于查询来获得搜索结果的搜索引擎106。在一些实施方式中,系统100还可以包括后端系统
108,其能够对网络资源120进行爬取、索引和/或注释。后端系统108可以包括爬取模块118
和索引116。后端系统108还可以包括解释评估器110,其能够接收语义解释112及其相关联
的规范化查询114。

在操作中,搜索引擎106可以通过网络104从用户102接收原始搜索查询。搜索引擎
106可以将所述原始搜索查询提供至后端系统108从而获得所述原始搜索查询的搜索结果
集合。解释评估器110可以接收所述原始搜索查询并且确定与所述搜索查询相关联的语义
解释112的集合。每个语义解释112与表示要被用于获得与所述语义解释相关联的信息的查
询的规范化查询114。解释评估器110随后可以针对每个语义解释112产生经修改的查询,每
个经修改的查询基于所述搜索查询以及针对所述特定语义解释的规范化查询114。解释评
估器110随后可以针对所述搜索查询和每个经修改的查询获得搜索结果,并且可以基于与
相对应的经修改查询相关联的搜索结果和与原始搜索查询相关联的搜索结果的相似度的
程度而对每个语义解释112进行评估。在这样的情况下,每个语义解释112可以与多个规范
化查询相关联,每个规范化查询表示可以被用于获得与所述语义解释相关联的信息的不同
查询。在这样的情况下,每个规范化查询可以被单独评估,例如,如以下所描述的,诸如通过
针对每个规范化查询产生单独的经修改查询。

如所示出的,用户102通过网络104与搜索引擎106进行通信。在一些情况下,用户
102可以是与计算设备进行交互以提交搜索查询的人,例如,其诸如通过将搜索查询键入到
web浏览器。用户102?#37096;?#20197;是通过应用编程接口(API)访问搜索引擎106的软件或?#24067;?#36807;
程。用户102可以通过网络104与搜索引擎106通信,上述网络104例如可以包括互联网、局域
网(LAN)、广域网(WAN)、虚拟私人网络(VPN)、WiFi网络、蜂窝电话网络,或者其它网络或网
络的组合。

搜索引擎106可以是能够操作以通过网络104接收搜索查询的服务器或服务器集
合。在一些情况下,搜索引擎106可以是使用一种或多种网络协议与用户102进行通信的web
服务器,上述网络协议包括但并不限于超文本传输协议(HTTP)、文件传输协议(FTP)、远程
过程调用(RPC)或其它协议。搜索引擎106还可以包括用于将请求分布至不同服务器的组
件,诸如负载平衡器(未示出)。

在一些情况下,搜索引擎106可以从用户102接收搜索查询并且确定如何对所述查
询进行处理。在一些实例中,搜索引擎106可以对查询进行预处理,所述预处理包括移除空
白、纠正拼写错误、语言间的转换、将语音查询转译为文本,和/或将查询结构化为特定格
式。搜索引擎106将所述搜索查询提交至后端系统108以获得与所述搜索查询相关联的搜索
结果。

系统100还包括后端系统108。后端系统108可以跨一个或多个系统或网络爬取、索
引和/或注释资源120(例如,网页)。后端系统108可以包括爬取引擎118,后者对互联网进行
爬取并且例如对在爬取中所遇到的资源做索引。在一些实施方式中,爬取模块118访问链接
至一个或多个其它资源的第一资源。爬取模块118可以加载所述第一资源并且将其文本存
储在索引116中,后者是包括与所爬取资源120及其内容(诸如文本)有关的信息的数据库,
所述信息与资源120相关联。一旦爬取模块118将与第一资源有关的信息存储在索引116中,
其随后就能够加载从第一资源所链接的其它资源120并且重复所述索引过程。通过反复访
问并索引从其它资源所链接的资源120,爬取模块118能够捕获并索引能够由爬取模块118
所访问的资源120的实质性部分。爬取模块118甚至能够在系统100接收查询之前或者在搜
索引擎106提交所述查询以获得搜索结果之前爬取并索引资源120。搜索引擎106随后能够
通过搜索索引116而不是直接搜索资源120而获得搜索结果。

由搜索引擎106提交至后端系统108的查询可以被解释评估器110所接收并处理。
解释评估器110可以对所接收的搜索查询进行评估从而确定与所述搜索查询相关联的一个
或多个语义解释112。每个语义解释112可以表示与所述搜索查询相关联的一个可能意图。
由于搜索查询可能存在歧义,所以可以识别出多个语义解释112。例如,在搜索查询“how
long is harry potter(哈利波特有多长?)”中,词项“harry potter(哈利波特)”存在歧
义,因为它们可能是指一个或多个特定主题,诸如哈利波特(Harry Potter)特许权中的七
本书中的任何一本,这些书的?#25105;?#30005;影改编,或者与哈利波特特许权相关联的旅行路线、主
题公园、音频书、卡通片等。所述查询?#37096;?#33021;是指哈利波特这个角色自身。根据用户想要在
查询中指代哪个主题,能够应用不同的解释或者应用若干个不同的解释。因此,如果所述查
询是指一本书,则用户可能想要知道这本书的字数或页数。另一方面,如果所述查询是指电
影中的一部,则?#34892;?#36259;的可能是电影的时长。或者,如果“harry potter”是指所述虚构角
色,则长度可能是指其身高。这些中的每一个都是所述查询的可能语义解释。以这种方式,
解释评估器110可以针对特定查询而确定语义解释112。

在一些实施方式中,可以针对语义解释112中的每一个确定置信度分数,其表示相
关联的解释与特定查询的用户意图相匹配的似然率。还可以定义置信度阈值来指示要在向
用户102返回搜索结果时考虑语义解释112所必需的最小置信度分数。例如,所述置信度阈
值可以指定针对特定搜索查询具有超过90的置信度分数的语义解释112就应当在返回搜索
结果时被加以考虑。解释评估器110还可以使用置信度分数来确定哪一个语义解释112被指
派给特定查询,例如,诸如通过指派具有最高置信度分数的语义解释。在一些情况下,置信
度分数可以是数值范围中的数?#31181;怠?#26469;自数值集合中的离散值、或者是另一种类型的指示
符。

每个语义解释112与规范化查询114相关联。规范化查询114可以是传达与特定语
义解释相关联的用户意图的查询。在一些情况下,规范化查询114可以是被用来从原始的特
定查询生成经修改的搜索查询的结构或模板。规范化查询114可以与特定查询中的信息相
结合而生成经修改的搜索查询。在一些实施方式中,规范化查询114是具有未完成部分的
串,上述未完成部分能够使用特定查询的子串来完成。例如,规范化查询114可以是诸如
“how many pages is the book<NAME OF BOOK ENTITY>(书《书实体的名称》有多少页)”的
未完成查询。经修改的搜索查询可以使用特定查询的部分而从规范化查询114所生成。例
如,给定先前的规范化查询以及特定查询“how long is harry potter?#20445;?#21487;以生成经修改
的搜索查询“how many pages is the book harry potter(书哈利波特有多少页)?#34180;?#22312;一
些情况下,针对特定语义解释生成经修改的搜索查询包括对所述特定搜索查询进行重新格
?#20132;?#20197;与所述语义解释的规范化查询相匹配。例如,给定查询“how long is the book
harry potter”能够被重新格?#20132;?#20026;“how long is the harry potter book(哈利波特这
本书有多长)”从而与规范化查询“how many pages is the book<NAME OF BOOK ENTITY>”
相匹配。

在一些实施方式中,针对语义解释生成经修改的搜索查询包括将所述特定搜索查
询中所包括的识别特定实体的子串替换为识别针对所述语义解释的规范化搜索查询中所
包括的特定实体的替选子串。例如,特定查询“how long is harry potter”可能具有询问
一本书中的页数的语义解释。与所述语义解释相关联的规范化查询可以是“how long is
the<NAME OF BOOK ENTITY>book(《书实体的名称》这本书有多长)?#34180;?#22240;此,在“harry
potter”被识别为特定实体的情况下,能够通过将所述特定搜索查询中的子串“harry
potter”替换为从所述规范化搜索查询所得出的子串“harry potter book(哈利波特这本
书)”而生成经修改的搜索查询。例如,示例经修改的搜索查询可以是“how long is the
harry potter book(哈利波特这本书有多长)?#34180;?#22312;一些实施方式中,单个语义解释112可以
具有多个相关联的规范化查询114。

在一些实施方式中,解释评估器110针对与语义解释112相关联的一个或多个经修
改的搜索查询而从索引116获得搜索结果。经修改的搜索查询结果可以被用来对与相应的
经修改的搜索查询相关联的语义解释112进行评估。例如,可以基于特定搜索查询的搜索结
果与针对所述语义解释112的相关联经修改的搜索查询的搜索结果之间的相似度的程度,
对每个语义解释112进行评估。在一些实施方式中,所述相似度的程度基于经修改的搜索查
询结果和特定搜索查询的结果之间的交集大小或差别大小。例如,较大的交集可以指示一
个语义解释准确描述用户意图的较大的似然率。相反,例如,较大的差别则可能指示一个语
义解释112不太可能是用户意图的准确表示。在一些实施方式中,所述相似度的程度基于与
特定搜索查询相关联的特定关键词在经修改的搜索查询结果中出现的?#24503;?#20197;及在特定搜
索查询的搜索结果内的?#24503;省?#20363;如,较大的关键?#39135;魷制德?#21487;以指示经修改的搜索查询更
可能返回相关结果。在一些实施方式中,所述相似度的程度基于将经修改的搜索查询的结
果的顺序与特定搜索查询的搜索结果的顺序进行比较。在一些情况下,诸如用户点击率、站
点业务数据等的其它数据可以被用来对语义解释112进行评估。这些技术或其它技术能够
被用来对语义解释112、规范化查询114或经修改的搜索查询进行评估。在一些情况下,特定
的语义解释112、规范化查询114或经修改的搜索查询是基于所述相似度的程度被选择的。
以这种方式,语义解释112、规范化查询114或经修改的搜索查询能够被排名、验证、分析并
且以其它方式进行评估。在一些实施方式中,语义解释112的评估能够被用来针对特定搜索
查询生成被返回给用户的结果。例如,来自经修改的搜索查询的结果能够被用来对特定搜
索查询结果进行排序。本公开范围内的其它实施方式也是可能的。

图2描绘了示例经修改的搜索查询204a-d的示意图。每个示例经修改的搜索查询
204a-d是从特定搜索查询202以及针对一个语义解释的规范化搜索查询所生成的。在图2
中,示例特定查询202是串“how long is harry potter?#34180;?#31532;一示例经修改的搜索查询204a
是“how many pages is the harry potter book(哈利波特这本书有多少页)?#20445;?#24182;且能够
与特定查询202是指一本书的长度的语义解释相关联。第二示例经修改的搜索查询204b是
“how tall is harry potter(哈利波特有多高)?#20445;?#24182;且能够与特定查询202是?#38468;?#33394;
“Harry Potter”的身高的语义解释相关联。第三示例经修改的搜索查询204c是“how long
is the harry potter movie(哈利波特电影有多长)?#20445;?#24182;且能够与特定查询202是指电影
时长的语义解释相关联。第四示例经修改的搜索查询204d是“how old is harry potter
(哈利波特多大年纪)?#20445;?#24182;且能够与特定查询202是?#38468;?#33394;“Harry Potter”的年龄的语义解
释相关联。这些是示例特定搜索查询202的示例经修改的搜索查询;其它经修改的搜索查询
也是可能的。

图3描绘了用于对搜索查询的语义解释进行评估的示例过程300的流程图。过程
300包括搜索引擎106、解释评估器110和索引116之间为了评估搜索查询的语义解释所进行
的交互。在305处,将原始搜索查询从搜索引擎106发送至解释评估器110。在310处,解释评
估器110发送原始搜索查询,从索引116检索所述原始搜索查询的搜索结果。

在315处,解释评估器110从索引116得到针对原始搜索查询的语义解释。在一些情
况下,所述语义解释可以独立于索引116被存储,在这种情况下,解释评估器110将从单独的
组件或系统检索所述语义解释。在320处,解释评估器110从索引116得到针对每个语义解释
的规范化查询。

在325处,解释评估器110基于原始搜索查询并?#19968;?#20110;针对所述语义解释的规范化
搜索查询而针对每个语义解释产生经修改的搜索查询。在330处,解释评估器110从索引110
得到针对每个经修改的搜索查询的搜索结果。

在335处,解释评估器110基于原始搜索查询的搜索结果和相对应的经修改的搜索
查询的搜索结果之间的相似度对每个语义解释进行评估。解释评估器110可以使用先前关
于图1所描述的技术中的一个或多个来评估语义解释。

图4描绘了用于对搜索查询的语义解释进行评估的示例过程400。在405处,针对被
提交至搜索引擎的特定搜索查询获得搜索结果集合。在410处,针对特定搜索查询获得语义
解释的集合,并且每个语义解释表示与特定搜索查询相关联的候选意图。在415处,针对所
述语义解释的集合中的每个语义解释获得规范化搜索查询。

在420处,针对所述语义解释的集合中的每个语义解释生成经修改的搜索查询。所
述经修改的搜索查询能够至少部分基于所述特定搜索查询和针对所述语义解释的规范化
搜索查询。在一些情况下,针对每个语义解释生成经修改搜索查询包括对特定搜索查询进
行重新格?#20132;?#20197;与针对所述语义解释的规范化搜索查询相匹配。在一些实施方式中,针对
每个语义解释生成经修改搜索查询包括将所述特定查询中所包括的识别特定实体的子串
替换为识别针对所述语义解释的规范化搜索查询中所包括的特定实体的替选子串。在425
处,针对所述语义解释的集合中的每个语义解释获得针对所述语义解释的经修改的搜索查
询的搜索结果集合。

在430处,针对所述集合中的每个语义解释,确定针对所述语义解释的经修改的搜
索查询的搜索结果集合与所述特定搜索查询的搜索结果集合之间的相似度的程度。所述相
似度的程度能使用之前所描述的技术来确定。在一些情况下,确定所述相似度的程度至少
部分基于经修改的搜索查询的搜索结果集合和特定搜索查询的搜索结果集合之间的交集
大小或差别大小。在一些情况下,确定所述相似度的程度至少部分基于与特定搜索查询相
关联的特定关键词在经修改的搜索查询的搜索结果集合以及在特定搜索查询的搜索结果
集合中的出?#21046;德省?#30830;定所述相似度的程度可以至少部分基于将经修改的搜索查询的搜索
结果集合的顺序与特定搜索查询的搜索结果集合的顺序进行比较。在一些情况下,可以基
于所述相似度的程度来选择特定的语义解释。

图5是可以作为客户端或者作为一个或多个服务器而被用?#35789;?#29616;本文所描述的系
统和方法的计算设备500、550的框图。计算设备500旨在表示各种形式的数字计算机,诸如
膝上计算机、台?#20132;?#24037;作站、个人数?#31181;?#29702;、服务器、刀锋服务器、主机和其它适当计算机,
计算设备550旨在表示各种形式的移动设备,诸如个人数?#31181;?#29702;、蜂窝电话、智能电话和其
它类似的计算设备。此外,计算设备500或550可以包括通用串行总线(USB)闪存驱动器。USB
闪存驱动器可以存储操作系统和其它应用。USB闪存驱动器能够包括输入/输出组件,诸如
无线传送器或USB连接器,其能够被插入另一个计算设备的USB端口之中。这里所示的组件、
其连接和关系以及其功能仅意在是示例性的,而并不意味着对本文中所描述和/或要求保
护的实施方式进行限制。

计算设备500包括处理器502、存储器504、存储设备506、连接到存储器504和高速
扩展端口510的高速接口508、以及连接到低速总线514和存储设备506的低速接口512。每个
组件502、504、506、508、510和512使用各种总线进行互连,并且可以被安装在共用主板上,
或者以其它适宜方式进行安装。处理器502能够处理指令以便在计算设备500内执行以在诸
如?#33719;?#21512;到高速接口508的显示器516的外部输入/输出设备上显示用于GUI的图形信息,所
述指令包括存储在存储器504中或者存储设备506中的指令。在其它实施方式中,如果适宜,
可使用多个处理器和/或多个总线,以及多个存储器和存储器类型。而且,多个计算设备500
可以与提供操作的部分的每个设备进行连接(例如,作为服务器组、?#24230;?#26381;务器聚组或多处
理器系统)。

存储器504将信息存储在计算设备500内。在一种实施方式中,存储器504是一个或
多个?#36164;源?#20648;器单元。在另一实施方式中,存储器504是一个或多个?#19988;资源?#20648;器单
元。存储器504还可以是其它形式的计算机可读介?#21097;?#35832;如?#25490;?#25110;光盘。

存储设备506能够为计算设备500提供大型存储。在一种实施方式中,存储设备506
可以是或者可包含计算机可读介?#21097;?#35832;如软盘设备、硬盘设备、光盘设备、磁带设备、闪存或
其它类似固态存储器设备、或者设备阵列,包括存储区域网络或其它配置中的设备。计算机
程序产品可被?#34892;?#22320;体现在信息载体中。所述计算机程序产品还可包含指令,所述指令当
被执行时,执行诸如以上所描述的一个或多个方法。所述信息载体是计算机或机器可读介
?#21097;?#35832;如存储器504、存储设备506、处理器502上的存储器。

高速控制器508管理用于计算设备500的带宽密集操作,而低速控制器512管理较
低带宽密集的操作。这样的功能分配仅是示例性的。在一种实施方式中,高速控制器508被
耦合到存储器504、显示器516(例如,通过图?#26410;?#29702;器或加速器),并且?#33719;?#21512;到可接受各种
扩展卡(未示出)的高速扩展端口510。在所述实施方式中,低速控制器512?#33719;?#21512;到存储设
备506和低速扩展端口514。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)
的低速控制端口可?#33719;?#21512;到一个或多个输入/输出设备,诸如键盘、指针设备、扫描仪,或者
例如通过网络适配器耦合到诸如交换机和路由器的联网设备。

如图所示,计算设备500能够以各种不同形式?#35789;?#29616;。例如,其可以被实现为标准
服务器520,或者这样的服务器聚组中的多个服务器。其还可以被实现为机架式服务器系统
524的一部分。此外,其还可以在诸如膝上型计算机522的个人计算机中实现。替选地,来自
计算设备500的组件可以与诸如设备550的移动设备(未示出)中的其它组件相组合。每个这
样的设备可包含计算设备500、550中的一个或多个,并且整个系统可由多个彼此通信的计
算设备500、550所构成。

除其它组件之外,计算设备550包括处理器552、存储器564、诸如显示器554的输
入/输出设备、通信接口566和收发器568。还可以为设备550提供诸如微驱动器或其它设备
的存储设备以提供附加存储。每个组件550、552、564、554、566和568使用各种总线进行互
连,并且若干组件可被安装在共用主板上或者以其它适宜方式进行安装。

处理器552能够执行计算设备550内的指令,包括存储在存储器564中的指令。所述
处理器可被实现为包括单独的且多个的模拟和数字处理器的芯片的芯片集。此外,处理器
可以使用?#25105;?#25968;目的架构被实现。例如,处理器510可以是CISC(复杂指令集计算机)处理
器、RISC(精简指令集计算机)处理器、或MISC(最小指令集计算机)处理器。例如,所述处理
器可提供设备550的其它组件的协同,诸如控制用户接口、设备550所运行的应用以及设备
550所进行的无线通信。

处理器552可以通过?#33719;?#21512;到显示器554的控制接口558和显示接口556与用户进
行通信。显示器554例如可以是TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光二极
管)显示器,或者其它适当的显示技术。显示接口556可以包括用于驱动显示器554以向用户
呈现图形和其它信息的适当电路。控制接口558可以从用户接收命令并且对其进行转换以
便向处理器552提交。此外,可提供与处理器552进行通信的外部接口562,从而使得设备550
能够与其它设备进行近域通信。例如,外部接口562在一些实施方式中可提供有线通信,或
者在其它实施方式中提供无线通信,并且?#37096;?#20351;用多个接口。

存储器564存储计算设备550内的信息。存储器564可以被实现为计算机可读介质
或介质、?#36164;源?#20648;器单元或者?#19988;资源?#20648;器单元中的一个或多个。?#37096;?#20197;提供扩展存
储器574并通过扩展接口572连接到设备550,例如,所述扩展接口572可以包括SIMM(单列存
储器模块)卡接口。这样的扩展存储器574可为设备550提供额外的存储空间,或者还可以为
设备550存储应用或其它信息。特别地,扩展存储器574可以包括执行或补充以上所描述的
过程的指令,并?#19968;?#21487;以包括安全信息。例如,扩展存储器574由此可被提供作为设备550的
安全模块,并且可利用允许对设备550进行安全使用的指令进行编程。此外,可经由SIMM卡
提供安全应用以及附?#26377;?#24687;,诸如以不可破坏的方式在SIMM卡上设置识别信息。

例如,如以下所讨论的,所述存储器可以包括闪存和/或NVRAM存储器。在一种实施
方式中,计算机程序产品以?#34892;?#26041;式体现于信息载体中。所述计算机程序产品包含指令,所
述指令当被执行时,执行诸如以上所描述的一个或多个方法。所述信息载体是计算机或机
器可读介?#21097;?#35832;如存储器564、扩展存储器574、处理器552上的存储器,例如可以通过收发器
568或外部接口562被接收。

设备550可通过通信接口566进行无线通信,在必要情况下,所述通信接口566包括
数?#20013;?#21495;处理电路。通信接口566可根据各种模?#20132;?#21327;议提供通信,除其它之外,所述模式
或协议诸如GSM语音呼?#23567;MS、EMS或MMS消息发送、CDMA、TDMA、PDC、WCDMA、CDMA2000或
GPRS。例如,这样通信可通过射频收发器568发生。此外,诸如可使用蓝牙、WiFi或其它这样
的收发器(未示出)进行短范围通信。此外,GPS(全球定位系统)接收器模块570可为设备550
提供附加的导航和位置相关的无线数据,其可由设备550上运行的应用适当使用。

设备550还使用音频编解码器560进行可听通信,所述音频编解码器560接收来自
用户的话音信息并且将其转换为可用的数?#20013;?#24687;。音频编解码器560同样可以诸如通过扬
声器为用户生成可听声音,例如在设备550的听筒中。这样的声音可以包括来自语音电话呼
叫的声音,可以包括所录制的声音(例如,语音消息、音乐文件等),并?#19968;?#21487;以包括设备550
上操作的应用所生成的声音。

如图所示,计算设备550可以以多种不同方式?#35789;?#29616;。例如,其可以被实现为蜂窝
电话580。其还可以被实现为智能电话582、个人数?#31181;?#29702;或其它类似移动设备的一部分。

各种实施方式可以以数字电路、集成电路、专门设计的ASIC(应用特定集成电路)、
计算机?#24067;?#22266;件、软件和/或其组合?#35789;?#29616;。这些各种实施方式可以包括一个或多个计算
机程序中的实施方式,所述计算机程序可在包括至少一个可编程处理器的可编程系?#25104;?#25191;
行和/或解释,所述可编程系统可以为专用或通用,其?#33719;?#21512;以从存储系统、至少一个输入
设备以及至少一个输出设备接收数据和指令并且向其传送数据和指令。

这些计算机程序(也被称作程序、软件、软件应用或代码)包括用于可编程处理器
的机器指令,并且能够以高级过程和/或面向对象的编程语言?#35789;?#29616;,和/或以汇编/机器语
言?#35789;?#29616;。如这里所使用的,术语“机器可读介质?#34180;ⅰ?#35745;算机可读介质”是指用来向可编程处
理器提供机器指令和/或数据的?#25105;?#35745;算机程序产品、装置和/或设备(例如,磁碟、光盘、存
储器、可编程逻辑设备PLD),其包括接收机器指令作为机器可?#21015;?#21495;的机器可读介质。术语
“机器可?#21015;?#21495;”是指被用来为可编程处理器提供机器指令和/或数据的?#25105;?#20449;号。

为了提供与用户的交互,这里所描述的系统和技术可在具有用于向用户显示信息
的显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)和用户能够通过其为计算
机提供输入的键盘和指针设备(例如,鼠标或轨迹球)的计算机上实现。?#37096;?#20197;使用其它类
型的设备来提供与用户的交互;例如,提供给用户的反馈可以为?#25105;?#24418;式的感觉反馈(例
如,视觉反馈、听觉反馈或触觉反馈);并且来自用户的输入可以以?#25105;?#24418;式被接收,包括语
音、话音或触觉输入。

这里所描述的系统、方法、装置和技术能够在计算系统中被实现,所述计算系统包
括后端组件(例如,作为数据服务器),或者其包括中间件组件(例如,应用服务器),或者其
包括前端组件(例如,具有用户能够通过其与本文所描述的系统和技术的实施方式进行交
互的图形用户界面或web浏览器的客户端计算机),或者这些后端、中间件或前端组件的任
意组合。所述系统的组件可通过?#25105;?#24418;?#20132;?#20171;质的数字数据通信(例如,通信网络)进行互
连。通信网络的示例包括局域网(“LAN”)、广域网(“WAN”)、对等网络(具有点对点或静态成
员)、网格计算基础设施、和互联网。

计算系统可以包括客户端和服务器。客户端和服务器通常彼此?#29420;?#24182;且典型地通
过通信网络进行交互。客户端和服务器的关系通过在相应的计算机上运行的计算机程序所
建立并且彼?#21496;?#26377;客户端-服务器关系。

虽然所述?#24471;?#20070;包含了许多具体实施方式的?#38468;冢?#20294;是这些并不应当被理解为对
?#25105;?#21457;明的范围所请求保护内容的限制,而是相反地作为对可能特定于特定发明的特定实
施方式的特征的描述。在所述?#24471;?#20070;中以单独实施方式的场境中所描述的某些特征?#37096;?#20197;
被实现在单个实施方式的组合中。相反,以单个实施方式的场境所描述的各种特征也能够
单独或以?#25105;?#36866;当子组合的形式在多个实施方式中实现。此外,虽然特征可以在上文中以
某种组合进行描述并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多
个特征在一些情况下也能够从组合中去除,并且所要求保护的组合可以被定向到子组合或
子组合的变化。

类似地,虽然操作在图中以特定顺序进行描绘,但是这并不应当被理解为为了实
现所期望的结果而要求这样的操作以所示出的特定顺序或以连续顺序来执行,或者执行所
有所图示的操作。在某些情况下,多任务和并行处理可能是有利的。此外,以上所描述的实
施方式中的各个系统组件的分离并不应当被理解为要求这样的分离,并且应当理解的是,
所描述的程序组件和系统一般能?#36824;?#21516;集成在单个软件产品中或者被封装为多个软件产
品。

因此,已经对所述主题的特定实施方式进行了描述。其它实施例处于以下权利要
求的范围之内。在一些情况下,权利要求中所引用的动作可以以不同顺序执行并且仍然实
现所期望的结果。此外,附图中所描绘的过程并非必然要求所示出的特定顺序或连续顺序
?#35789;?#29616;所期望的结果。在某些实施方式中,多任务和并行处理可能是有利的。

关于本文
本文标题:评估搜索查询的语义解释.pdf
链接地址:http://www.pqiex.tw/p-6091934.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 深圳股票配资论坛 炒股公式 002647股票分析 股票融资 成本 600285股票行情实时查询 短线股票推荐有哪些 股票涨跌幅限制 股票涨跌涨幅振幅 股票行情大盘走势直播 今天a股大盘上证指数