平码五不中公式规律
  • / 25
  • 下载费用:30 金币  

利用上下文相关的查询进行搜索.pdf

关 键 ?#21097;?/dt>
利用 上下文 相关 查询 进行 搜索
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201580036938.1

申请日:

2015.07.02

公开号:

CN106663119A

公开日:

2017.05.10

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G06F 17/30申请日:20150702|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 微软技术许可有限责任公司
发明人: R·W·霍利; C·海诺; R·威尔赫姆
地址: 美国华盛顿州
优?#28909;ǎ?/td> 2014.07.08 US 62/022,134; 2014.10.23 US 14/522,461
专利代理机构: 永新专利商标代理有限公司 72002 代理人: 刘瑜;王英
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201580036938.1

授权公告号:

|||

法律状态公告日:

2017.06.06|||2017.05.10

法律状态类型:

实质审查的生效|||公开

摘要

响应于接收到对查询的请求,可以结合查询定义与查询相关联的一个或多个属性值,以生成上下文链接的查询。上下文链接的查询可以包括提供针对随后的属性的上下文的第一属性,其中,随后的属性可以联结到第一属性并且对第一属性提供约束。在一些示例中,第一属性可以是定义正被查询的敏感数据的类型的敏感数据类型属性,并且随后的属性可以是上下文属性,例如敏感匹配数目或敏感匹配置信度属性。上下文链接的查询可以被提交给数据存储,并且查询可以被执行,其中,第一属性和/或随后的属性被应用于相同的数据集,而不需要数据存储处的针对每个属性的不同列。

权利要求书

1.一种用于提供上下文链接的查询的方法,所述方法包括:
接收对查询的请求以及与所请求的查询相关联的一个或多个属性值;
通过结合所述查询定义所述一个或多个属性值来生成上下文链接的查询,以使得第一
属性提供针对被联结到所述第一属性的随后的属性的上下文;以及
向数据存储提交所述上下文链接的查询。
2.根据权利要求1所述的方法,其中,生成所述上下文链接的查询包括:
结合所述查询定义所述一个或多个属性值,使得所述随后的属性提供对所述第一属性
的约束。
3.根据权利要求2所述的方法,其中,所述随后的属性是能够选择的。
4.根据权利要求1所述的方法,还包括:
执行所述查询,其中所述第一属性和所述随后的属性被应用于同一数据集,而不需要
在所述数据存储处的针对每个属性的不同列。
5.根据权利要求1所述的方法,还包括:
实?#31181;?#23569;所述第一属性的定制的分类。
6.根据权利要求1所述的方法,还包括:
实现布尔操作符的使用以连接一个或多个属性和谓词。
7.根据权利要求6所述的方法,还包括:
实现上下文属性和非上下文属性以及谓词的连接。
8.一种用于提供上下文链接的查询的系统,所述系统包括:
计算设备,所述计算设备包括输入设备、存储器、以及处理器,其中,所述处理器结合存
储在所述存储器中的指令被配置为:
通过所述输入设备接收对查询的请求以及与所请求的查询相关联的一个或多个属性
值;
通过结合所述查询定义所述一个或多个属性值来生成上下文链接的查询,使得第一属
性提供针对被联结到所述第一属性的随后的属性的上下文,并且所述随后的属性提供对所
述第一属性的约束;以及
提交所述上下文链接的查询以用于执行;以及
数据存储,所述数据存储通信地链接到所述计算设备,其中,所述上下文链接的查询对
存储在所述数据存储处的数据进行执行。
9.根据权利要求8所述的系统,其中,所述处理器还被配置为:
在所述上下文链接的查询内实现针对一个或多个属性的对通配符值、多个值、和/或值
的范围中的一个或多个的插入。
10.根据权利要求8所述的系统,还包括:
显示设备,所述显示设备通信地耦合到所述处理器,其中,所述处理器还被配置为:
通过所述显示设备提供用户界面,以使得用户能够定义所述第一属性的定制的分类。
11.根据权利要求10所述的系统,其中,所述处理器还被配置为:
使得所述用户通过用户界面能够定义针对所述第一属性的?#38236;?#21270;。
12.一种用于提供针对敏感数据的上下文链接的查询的方法,所述方法包括:
接收对与关于敏感数据的搜索相关联的查询的请求;
确定与所请求的查询相关联的一个或多个上下文属性,其中,第一属性是对正被查询
的所述敏感数据的类型进行定义的敏感数据类型属性;
使得用户能够定义所述一个或多个上下文属性,所述一个或多个上下文属性被配置为
提供对所述敏感数据类型属性的一个或多个约束;
通过关于所述敏感数据类型属性来联结所定义的一个或多个上下文属性来生成上下
文链接的查询;以及
向数据存储提交所述上下文链接的查询。
13.根据权利要求12所述的方法,其中,所述一个或多个上下文属性的值包括单个值、
多个值、值的范围、通配符值、或空值。
14.根据权利要求12所述的方法,其中,所述一个或多个上下文属性包括敏感匹配数目
和敏感匹配置信度。
15.根据权利要求12所述的方法,其中,上下文属性的缺乏被解释为针对缺乏的上下文
属性的任何值都是能够接受的。

说明书

利用上下文相关的查询进行搜索

背景技术

系统数据可以存储在数据存储的搜索索引中,以使得其可以由一个或多个用户来
查询。搜索查询可以包括上下文相关的并彼此影响的一个或多个单独的属性。例如,查询可
以针对来自在特定日期的特定人的所有电子邮件执行搜索。人和日期可以是单独的属性,
这些属性在上下文上与电子邮件相关或在电子邮件内,并彼此影响。在一些方法中,可以在
针对查询的每个属性的搜索索引或数据库中创建列,但是所创建的每个额外的列可能?#22909;?br />地影响系统的性能和能力。

因此,生成搜索查询的当前的实施方式可以使用改进和/或替代或另外的解决方
案,以使得一个或多个单独的属性可以在上下文上被连接在搜索查询内,并因此防止对数
据存储处的每个属性的不同列的需求。

发明内容

提供了本发明内容以便以简化的形式介绍对概念的选择,在以下特定实施方式中
进一步描述了该简化形式。本发明内容并非旨在排除性地识别所请求保护的主题的关键特
征或重要特征,也并非旨在辅助确定所请求保护的主题的范围。

实施例用于提供上下文相关的查询。可以接收对查询的请求和在所请求的查询内
相关联的一个或多个属性值,可以通过结合查询定义一个或多个属性值来生成上下文链接
的查询,以使得第一属性提供针对被联结到第一属性的随后的属性的上下文,并且上下文
链接的查询可以被提交到数据存储。

通过阅读以下特定实施方式并查看相关联的附图,这些特征和优点以及其它特征
和优点将显而易见。将理解的是,前述总体描述和以下特定实施方式两者均是解释性的,并
不限制如所请求的方面。

附图说明

图1包括示出了其中可以实现上下文相关的查询的示例的基于数据?#34892;?#30340;系统的
概念图;

图2示出了根据一些实施例的其中可以实现上下文相关的查询的概念系统;

图3示出了与可以被上下文链接的查询相关联的一个或多个属性的示例;

图4示出了与可以不被上下文链接的查询相关联的一个或多个属性的示例;

图5示出了上下文链接的查询的示例;

图6示出了生成上下文链接的查询的示例过程;

图7是示例的通用目的计算设备的框图,该计算设备可以用于生成上下文相关的
查询;以及

图8示出了根据实施例的用于生成上下文相关的查询的方法的逻辑流程图。

特定实施方式

如上面简要描述的,一个或多个上下文相关的属性可以与查询相关联,每个属性
都包括一个或多个属性值。属性值可以结合查询来定义以生成查询,其中,属性是上下文链
接的。例如,上下文链接的查询可以包括提供针对随后的属性的上下文的第一属性,其中,
随后的属性可以联结到第一属性并作为对第一属性的约束。在一些示例中,可以使得用户
能够定义属性值的定制的分类,以便调整查询以适合它们的需求。用户可以定义定制的第
一属性,并且例如可以包括或省略随后的属性中的一个或多个属性。一旦生成,上下文链接
的查询就可以被提交至数据存储,以使得查询可以被执行,其中第一属性和/或随后的属性
被应用于相同的数据集,而不需要数据存储处的针对每个属性的不同列。

在以下特定实施方式中,参照了附图,这些附图形成了本文的一部分,并且其中,
通过例示特定实施例或示例的方式示出了附图。在不脱离本公开内容的精神或范围的情况
下,可以组合这些方面,可以利用其它方面,并且可以作出结构改变。因此,并非在限制性的
意义上获得以下特定实施方式,并且本发明的范围通过所附权利要求和它们的等同形式来
定义。

尽管将在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的
通用上下文中描述了一些实施例,但是本领域技术人员将认识到,这些方面也可以与其它
程序模块组合?#35789;?#29616;。

通常,程序模块包括例程、程序、部件、数据结构、以及执行特定任务或实现特定抽
象数据类型的其它类型的结构。此外,本领域技术人员将意识到,可以利用其它计算机系统
配置?#35789;?#26045;实施例,这些计算机系统配置包括手持式设备、多处理器系统、基于微处理器的
或可编程消费电子产品、小型计算机、大型计算机、和类似的计算设备。实施例也可以在分
布式计算环境中实施,其中,由通过通信网络链接的远程处理设备来执行任务。在分布式计
算环境中,程序模块可以位于?#38236;?#23384;储器存储设备和远程存储器存储设备两者中。

一些实施例可以被实现为计算机实现的过程(方法)、计算系统、或实现为?#30772;罰?#20363;
如计算机程序产品或计算机可读介质。计算机程序产品可以是由计算机系统读取的计算机
存储介?#21097;?#24182;可以对包括用于使得计算机或计算系?#25345;?#34892;示例过程的指令的计算机程序进
行编码。计算机可?#38142;?#20648;介质是计算机可?#38142;?#20648;器设备。计算机可?#38142;?#20648;介质可以例如经
由以下各项中的一个或多个?#35789;?#29616;:?#36164;?#24615;计算机存储器、?#19988;资?#24615;存储器、硬盘驱动器、
?#38142;?#39537;动器、软盘、或压缩盘、以及类似的?#24067;?#20171;质。

贯穿本说明书,术语“平台”可以是用于生成和实施上下文相关的查询的软件和硬
件部件的组合。平台的示例包括但不限于在多个服务器上执行的主机服务、在单个计算设
备上执行的应用、以及类似的系统。术语“服务器”通常指代通常在联网环境中执行一个或
多个软件程序的计算设备。然而,服务器也可以被实现为在被视为网络上的服务器的一个
或多个计算设备上执行的虚拟服务器(软件程序)。下面提供了关于这些技术和示例操作的
更多?#38468;凇?br />

图1包括示出了其中可以实现上下文相关的查询的示例的基于数据?#34892;?#30340;系统的
概念图。

如图100中示出的,数据?#34892;?02可以包括一个或多个服务器110、111、和113,它们
是与数据?#34892;?02的软件和下层?#24067;?#30456;关联的物理服务器。一个或多个服务器110、111、和
113可以被配置为执行一个或多个虚拟服务器104。例如,服务器111和113可以被配置为分
别提供四个虚拟服务器和两个虚拟服务器。在一些实施例中,一个或多个虚拟服务器可以
被组合到一个或多个虚拟数据?#34892;?#20013;。例如,由服务器111提供的四个虚拟服务器可以被组
合到虚拟数据?#34892;?12中。虚拟服务器104和/或虚拟数据?#34892;?12可以被配置为托管大量服
务器以便经?#31245;?06向一个或多个终端用户108(例如个体用户或企业客户)提供云相关的
数据/计算服务,例如不同应用、数据存储、数据处理、或类似的一些服务。

在一些示例中,用户可以提交对存储在数据?#34892;?02处的不同数据的查询。来自用
户的查询请求可以包括与查询相关联的属性,其中,属性中的一个或多个属性可以是上下
文相关的。此外,查询可以包括一个或多个非上下文的属性。

在一个示例中,用户可以请求与对数据?#34892;?02管理的数据存储内的敏感数据的
搜索相关联的查询。与查询相关联的示例属性可以包括提供针对敏感匹配数目属性、敏感
匹配置信度属性或相关联的数目或置信度属性中的一个或多个的上下文。在另一个示例
中,用户可以请求与对数据存储内的内容进行的搜索相关联的查询,所述内容包含特定数
量的特性的实例,例如单词、名称、和/或日期。与查询相关联的示例的属性可以包括提供针
对特性匹配数目属性的上下文的特性类型属性。

当前的方法可以包括针对每个上下文相关的属性在数据存储的搜索索引内创建
单独的列。然而,这可以引入对存储模式的?#35272;?#24615;,其中,所创建的每个另外的列可以?#22909;?br />地影响数据?#34892;?#23384;储装置的性能和能力。此外,该方法可能排除对用户定义的定制的属性
的支持,可能不是可扩展的,并且可能不支持属性名称的?#38236;?#21270;。此外,可能对将必须记住
大量虚拟属性名称的那些写查询呈现可用性挑战。

其它当前方法可以使用布尔操作符,例如,“AND”、“NOT”、和“OR?#20445;?#20197;上下文地链接
属性。这种方法可以重载“AND”以使属性关联,得?#25509;?#20110;类似关联性、交换性、分布性、德摩
根定律、和其它类似的示例的属性而难以验证的查询树。这些属性可以无意地引入对查询
的逻辑解释的不期望的变化,并且查询的逻辑解释与用户的意图之间的匹配可能不是可证
实的。

根据实施例,使用上下文链接的查询可以简化和增加用户提交的查询的效?#30465;?#19968;
些实施例可以涉及一个或多个随后的属性与第一属性的联结,其中,第一属性提供针对随
后的属性的上下文,以生成上下文链接的查询。所联结的属性可以被包括以作为对第一属
性的约束,或者它们可以被省略,以使得第一属性不具?#24615;?#26463;。上下文链接的查询可以被提
交到数据存储并且被执行,以使得第一属性和所联结的随后的属性可以被应用于相同的数
据集,而不需要数据存储处的针对每个属性的不同列。

图2示出了根据一些实施例的其中可以实施上下文相关的查询的概念性系统。

如图200中所例示的,数据?#34892;?02可以包括一个或多个处理服务器204,它们被配
置为除了其它之外执行查询引擎206,以便对存储在数据?#34892;?02的一个或多个数据存储内
的不同数据执行上下文相关的查询。所存储的数据可以例如由处理服务器204或者由专用
数据存储服务器208(例如,数据库服务器)管理。数据?#34892;?02可以与用户210相关联,并且
可以从与用户210相关联的客户端设备212接收上下文相关的查询。客户端设备212可以包
括输入设备、存储器、和处理器,其中,客户端设备212可以是桌面型计算机、膝上计算机、平
板设备、智能电话、和可穿戴设备,等等示例。

在示例实施例中,用户210可以通过客户端设备212的输入设备请求查询。输入设
备可以实现不同的输入方法,例如触摸、?#36136;啤?#30524;球追踪、语音识别、?#30465;?#40736;标、和键盘输入方
法。可以在客户端设备212的处理器处接收对查询的请求以及与所请求的查询相关联的一
个或多个属性值。处理器可以结合查询来定义属性值,以使得第一属性为与第一属性联结
的随后的属性提供上下文,以便生成上下文链接的查询214。

在一些示例中,随后的属性可以是可选的。例如,随后的属性可以被包括,以使得
随后的属性的所定义的值约束第一属性,或者随后的属性可以被省略,以使得第一属性可
以不具?#24615;?#26463;。可以在上下文链接的查询内针对所省略的随后的属性中的一个或多个属性
插入通配符值。或者,可以在上下文链接的查询内针对所省略的随后的属性使值为空。

处理器随后可以向数据?#34892;?02提交上下文链接的查询214,其中,可以在数据中
心202的处理服务器204处接收上下文链接的查询214。处理服务器204可以执行查询引擎
206以便在由数据存储服务器208管理的数据存储218内执行上下文链接的查询214。上下文
链接的查询214可以被执行,其中第一属性和/或随后的属性被应用于相同的数据集,而不
需要数据存储218处的针对每个属性的不同列。在执行上下文链接的查询214之后,查询引
擎206可以处理查询结果216,以便通过客户端设备212传输到用户210。

在一些实施例中,可以通过由客户端设备212的显示器提供的用户界面?#35789;?#29616;由
用户210进行的至少第一属性的定制的分类和?#38236;?#21270;。例如,用户210可以自定义第一属性,
并且用户210可以包括或省略随后的属性中的一个或多个属性,以调整查询以适应它们的
搜索需求。此外,可以使得用户210能够定义第一属性的?#38236;?#21270;。例如,如果第一属性是名
称,则用户能够用发出查询针对由用户所讲出的语言中名称属性来搜索内容。

图3示出了与可以被上下文链接的查询相关联的一个或多个属性的示例。

如先前讨论的,结合图2,响应于接收到对查询的请求,处理器可以结合查询来定
义与查询相关联的一个或多个属性值,以生成上下文链接的查询。第一属性可以提供针对
随后的属性的上下文,随后的属性可以在上下文链接的查询内联结到第一属性,但这不是
必须的。

在图300中,示例的表302显示出了与可以被上下文链接的所请求的查询相关联的
一个或多个属性。第一属性可以是类型属性304,其中,类型属性304的值可以被定义为正在
被查询的数据的类型。在一些示例中,所请求的查询可以与对敏感数据的搜索相关联。在这
样的示例中,第一属性可以是敏感数据类型属性,其中,敏感数据类型属性的值可以被定义
为正在被查询的敏感数据的类型。敏感数据类型属性的值可以包括信用卡号码、社会保险
号码、身份号码(例如,护照号码、牌照号码、等等)、医疗记录号码、以及银行账户号码、等等
示例。在其它示例中,类型属性304可以包括特性,例如名称、日期、和/或单?#21097;?#20854;中,类型属
性304的值可以被定义为正在被查询的特性的类型。

随后的属性可以包括与类型属性304相关的一个或多个上下文属性。上下文属性
可以例如包括匹配数目属性306和匹配置信度属性308。类型属性304可以提供针对随后的
属性的上下文,并因此随后的属性值可以在首先定义类型属性304的值(例如,数据类型)的
情况下才在查询中定义。匹配数目属性306的值可以被定义为在数据存储内的诸如数据、文
档、文件、等等之类的内容中找到所定义的数据类型的多个实例。匹配置信度属性308的值
可以被定义为所定义的数据类型的每个实例不是误报的置信度的百分?#21462;?br />

在一些实施例中,匹配数目属性306和匹配置信度属性308可以是可选的。例如,匹
配数目属性306和匹配置信度属性308的值可以被包括在查询中并在查询中被定义以提供
对类型属性304的一个或多个约束。或者,匹配数目属性306和匹配置信度属性308中的一个
或两者可以从查询中省略,以使得类型属性304具有较少约束或不具?#24615;?#26463;。

示例的表302还可以显示与可在查询内使用的每个属性相关联的操作符。类型属
性304可以与分号310或等号312相关联,以定义正被查询的数据的类型。例如,敏感类型=
“信用卡号码”或敏感类型:“信用卡号码?#20445;?#20182;们在查询内可以具有实质上相同的含义(即,
正被查询的敏感数据是信用卡号码)。在一些示例中,类型属性304可以支持用户可以定义
的定制的类型和/或敏感类型。可以通过当在当前实施方式中执行时,添加针对每个定制的
类型的相关联的匹配数目和匹配置信度属性的新的列来在不改变数据存储内的存储模式
的情况下支持定制的类型。相反,根据实施例,新的值可以被添加到数据存储内的现有类型
属性列。

匹配数目属性306和匹配置信度属性308可以与整数操作符316相关联。具体而言,
匹配数目属性306可以与等于或大于1的任何正整数相关联,并且匹配置信度属性308可以
和1与100之间的正整数相关联。在一些示例中,整数操作符316可以指示范围。此外,当匹配
数目属性306和匹配置信度属性308中的一个值或两者被插入了通配符值时,匹配数目属性
306和匹配置信度属性308可以与星号操作符314相关联。星号操作符314可以指示当执行查
询时,在类型属性304上可以不设置数目和/或置信度的约束。因此,查询可以搜索包含所定
义的数据类型的所有内容,而?#36824;?#25968;目或置信度。在其它示例中,匹配数目属性306和匹配
置信度属性308中的一个值或两者在上下文链接的查询内可以是空的,以指示当执行查询
时,可以对类型属性304未设置数目和/或置信度的约束。

下面的表1A和表1B可以分别针对匹配数目属性306和匹配置信度属性308提供示
例的整数操作符316和星号操作符314,以及它们在查询内的含义。这些仅仅是例示性的示
例,而并非旨在以任何方式限制实施例。

表1A:用于匹配数目属性的示例的操作符

匹配数目属性值
含义
5
内容包括数据类型的5个实例
5..
内容包括数据类型的5个或更多的实例
..5
内容包括数据类型的5个或更少的实例
5..10
内容包括数据类型的5个实例与10个实例之间
*
内容包括?#25105;?#25968;量的数据类型的实例

表1B:用于匹配置信度属性的示例操作符

匹配置信度属性值
含义
85
实例是数据类型的85%的置信度
85..
实例是数据类型的85%或更高的置信度
..85
实例是数据类型的85%或更低的置信度
85..100
实例是数据类型的85%与100%之间的置信度
*
实例是数据类型的任何%的置信度

在一些实施例中,布尔操作符可以用在上下文链接的查询中以连接上下文属性和
谓词中的一个或多个。例如,采用布尔操作符的上下文链接的查询可以看起来如下:

敏感类型=“信用卡号码?#20445;?#20854;中,数目=50AND置信度=85,其中,数目和置信度可
以正确地与敏感类型相关联,以使得可以验证和执行查询。

图4示出了根据实施例的与可以不被上下文链接的查询相关联的一个或多个属性
的示例。

所请求的查询可以包括与查询相关联的一个或多个属性值。属性值可以结合查询
来定义,以使得第一属性提供针对联结到第一属性的随后的属性的上下文,以便生成上下
文链接的查询。第一属性可以是定义正被查询的数据的类型的类型属性,其中,数据类型可
以包括敏感数据或数据特性,举例来说,例如名称、日期、和/或单词。随后的属性可以包括
与类型属性相关的一个或多个上下文属性,例如匹配数目属性和匹配置信度属性。此外,可
以存在与不被上下文链接的查询相关联的一个或多个其它属性。

在图400中,示例的表402显示出了与可以不被上下文链接的所请求的查询相关联
的属性。非上下文的属性可以是数字属性类型418或布尔属性类型420,其例如包括总的匹
配数目属性404、最后类型内容扫描属性406、“受IRM保护的”属性408、“可由外部用户查看”
属性410。示例的表402还可以显示与可在查询内使用的非上下文属性中的每个属性相关联
的操作符。

总匹配数目属性404可以是数字属性类型418,其中,总匹配数目属性404的值可以
被定义为在数据存储的内容内找到数据类型的实例的总数量。例如,总匹配数目属性404的
值可以指示?#25105;?#31867;型的敏感数据的实例的总数量,例如信用卡号码、社会保险号码、和银行
账户号码、等等示例的实例的总数目。整数操作符412可以与总匹配数目属性404相关联,其
中,总匹配数目属性404的值可以包括等于或大于1的任何正整数。在一些示例中,整数操作
符412可以指示范围。

最后类型内容扫描属性406可以是数字属性类型418,其中,当最后对数据存储内
的数据类型的内容执行扫描时,最后类型内容扫描属性406的值可以被定义为日期。例如,
最后类型内容扫描属性406的值可以是针对敏感数据扫描内容的最后日期。最后类型内容
扫描属性406也可以与整数操作符412相关联,其中,最后类型内容扫描属性406的值可以包
括具有日期的形式的整数。

“受IRM保护的”属性408可以是布尔属性类型420,其中,“受IRM保护的”属性408的
值可以定义数据存储内的内容是否受信息权限管理(IRM)技术保护。“受IRM保护的”属性
408可以与分号414或等号416相关联,其中,“受IRM保护的”属性408的值可以包括TRUE(真)
或FALUSE(假)。分号414和等号416操作符在查询内可实质上具有相同的含义。例如,受IRM
保护的=FALSE和受IRM保护的:FALSE可以均指示查询可以针对不受IRM保护的内容在数据
存储内执行搜索。

“可由外部用户查看”属性410可以是布尔属性类型420,其中,“可由外部用户查
看”属性410的值可以定义数据存储内的内容是否与一个或多个外部用户共享。“可由外部
用户查看”属性410也可以与分号414或等号416相关联,其中,“可由外部用户查看”属性410
的值可以包括TRUE或FALSE。如先前结合“受IRM保护的”属性408所讨论的,分号414和等号
416在查询内可实质上具有相同含义。

在一些实施例中,布尔操作符(例如“AND”、“OR”和“NOT”)可用于连接属性和谓词
中的一个或多个。属性可以包括上下文属性两者,例如,如结合图3所讨论的数目和置信度
属性,以及非上下文属性,例如在表402中所显示的那些。例如,采用布尔操作符将上下文和
非上下文属性连接到谓词的查询可以看起来如下:

敏感类型=“信用卡号码∣5..”

AND

受IRM保护的=FALSE

其中,查询可以在数据存储内对包括5个或更多个信用卡号码(具有任何置信度)
并且不受IRM保护的内容执行搜索。

根据示例的场景,企业可以与通过许多网站集合已经产生了成千上万的企业文件
的协同服务相关联。最近已经阅读到偶然泄露成千上万信用卡和社会保险号码的全国连锁
店的企业管理部门可以关心由协同服务产生的内容内的敏?#34892;?#24687;,尤其是信用卡号码和社
会保险号码。管理部门可以对所有内容(例如具?#34892;?#29992;卡号码和社会保险号码的数据、文
档、和文件)请求查询。回来的结果可以是大量的,因为这对于内容具有这些敏感类型是常
见的,尤其是来自企业的零售和人力资源部门。管理部门可以通过对包括5个或更多个信用
卡号码的内容,尤其是不受IRM保护的并已经与组织机构外部的用户共享的内容请求查询
来缩小结果的范围。因此,可以生成以下查询,利用副词连接上下文属性和非上下文属性:

敏感类型=“信用卡号码∣5..”

AND

受IRM保护的=FALSE AND可由外部用户查看=TRUE。

查询的结果可以为管理部门提供包括5个或更多个信用卡号码的、不受IRM保护
的、并且已经与组织机构外部的用户共享的内容。例如,内容可以被存储在云存储文件夹
中,该云存储文件夹很久以前与合作公司共享并且已经针对该存储改变用?#23613;?#31649;理部门可
以导出结果并联?#30340;?#23481;的所有者以将其移动到安全位置。

此外,布尔操作符可以将上下文和非上下文属性连接到复杂的谓?#21097;?br />

(敏感类型=“信用卡号码∣5..∣85..”

AND不受IRM保护=FALSE AND可由外部用户查看=TRUE)

OR

(敏感类型=“社会保险号码∣5..100”

AND NOT可由外部用户查看=FALSE)

其中,查询可以在数据存储内对具有85%或更高置信度的包括5个或更多个信用
卡号码的、不受IRM保护的、并且被一个或多个外部用户查看的内容进行搜索;或者包括在5
个与10个之间的社会保险号码(具有任何置信度)的、不受IRM保护的、并且已经被一个或多
个外部用户查看的内容执行搜索。

图5示出了根据实施例的上下文链接的查询的示例。上下文链接的查询可以包括
与查询相关联的一个或多个上下文链接的属性,其中,每个属性都可以包括单个值或多个
值,例如,一系列的值。本文中针对与对敏感数据的搜索相关联的上下文链接的查询描述了
示例的实施例,其中,与查询相关联的属性包括敏感类型、数目、和置信度属性。

如图500中所例示的,上下文链接的查询502的示例格式可以包括与类型值504相
关联的敏感类型属性、与数目值506相关联的匹配数目属性、以及与置信度值508相关联的
敏感匹配置信度属性。敏感匹配数目属性和敏感匹配置信度属性可以联结到敏感类型属
性,并?#20197;?#19968;些实施例中可以是可选的。例如,敏感匹配数目属性和敏感匹配置信度属性中
的一个或两者可以被包括以作为对敏感类型属性的约束,或者它们可以被省略,以使得敏
感类型属性不具?#24615;?#26463;。如果敏感匹配数目属性和敏感匹配置信度属性中的一个或两者被
省略,则属性值可以用通配符值来代替,或者属性值可以为空。

敏感类型属性的类型值504可以在查询502的最左侧位置中被定义为在数据存储
中的正被查询的敏感数据的类型。例如,类型值504可以包括信用卡号码、社会保险号码、身
份号码(例如,护照号码、牌照号码、等等)、医疗记录号码、以及银行账户号码、等等示例。敏
感匹配数目属性的数目值506和敏感匹配置信度属性的置信度值508可以在查询502中的敏
感类型属性的?#20918;?#30340;位置中定义。敏感匹配数目属性的数目值506可以被定义为在数据存
储内的内容中找到敏感数据类型的实例的数量,其中,数目值506可以是单个值或者一系列
值。敏感匹配置信度属性的置信度值508可以被定义为每个实例不是误报的百分比置信度,
其中,置信度值508可以是单个值或一系列值。

如图500中进一步例示的,表510显示出了被提交给数据存储的上下文链接的查询
的特定示例。这些仅是例示性的示例,而并非旨在以任何方式限制实施例。

查询512可以被定义为敏感类型:“信用卡号码”。敏感类型属性的类型值504可以
指示正被查询的敏感数据是信用卡号码。敏感匹配数目属性和敏感匹配置信度属性的数目
值506和置信度值508的缺乏可以指示已经从查询512中省略了数目和置信度约束,这可以
被解释为任何值都是可接受的。因此,查询512可以在数据存储内对包含信用卡号码的内容
执行搜索,其中,内容可以包括以任何置信度的任何数量的信用卡号码。

查询514可以被定义为敏感类型:“信用卡号码∣1..∣85..”。敏感类型属性的类型
值504可以指示正被查询的敏感数据为信用卡号码。敏感匹配数目属性506的数目值506,
1..,可以指示信用卡号码的一个或多个实例。敏感匹配置信度属性508的置信度值508,
85..,可以指示一个或多个实例实际上是信用卡号码并且不是误报的85%或更高的置信
度。因此,查询514可以在数据存储内执行对包含一个或多个信用卡号码的内容的搜索,并
且其中,内容包括一个或多个信用卡号码的置信度为85%或更高。

查询516可以被定义为敏感类型:“IBAN∣5..10∣*”。敏感类型属性的类型值504可
以指示正被查询的敏感数据是国际银行账户号码(IBAN)。敏感匹配数目属性506的数目值
506,5..10,可以指示IBAN的5至10个实例。敏感匹配置信度属性508的置信度值508,*,可以
指示通配符值已经被插入作为置信度约束并且因此指示5至10个实例实际上为IBAN的任何
置信度并且将被接受。因此,查询516可以在数据存储内对包含5与10个之间的IBAN、以及内
容包括5至10个IBAN的任何置信度的内容执行搜索。

查询518可以被定义为敏感类型:“社会保险号码∣…5∣”。敏感类型属性的类型值
504可以指示在被查询的敏感数据为社会保险号码。敏感匹配数目属性506的数目值506,
..5,可以指示社会保险号码的五个或更少的实例。敏感匹配置信度属性的置信值508的缺
乏可以指示已经从查询518中省略了置信度约束,并且因此指示5个或更少的实例实际上是
社会保险号码并且不是误报的任何置信度。因此,查询518可以在数据存储内对包含社会保
险号码的5个或较少实例、以及内容包括社会保险号码的5个或较少实例的任何置信度的内
容执行搜索。

查询520可以被定义为敏感类型:“信用卡号码∣*∣80..90∣”。敏感类型属性的类型
值504可以指示正被查询的敏感数据为信用卡号码。敏感匹配数目属性的数目值506,*,可
以指示通配符值已经被插入作为数目约束,并因此指示信用卡号码的?#25105;?#25968;量的实例。敏
感匹配置信度属性508的置信度值508,85..90,可以指示?#25105;?#25968;量的实例实际上为信用卡
号码并且不是误报的80%到90%的置信度范围。因此,查询520可以在数据存储内对包含任
意数量的信用卡号码的内容执行搜索,其中,内容包括信用卡号码的置信度从80%到90%。

在上面提供的示例查询512-520中,等号可以代替分号作为操作符,并且具有基本
上相同的含义。此外,可以忽略任何制表符、新的行、和/或敏感类型属性的前?#23435;?#32622;或后端
位置处的其它形式的空?#20303;?#20363;如,以下两个查询可以具有相同含义:

敏感类型:“信用卡号码∣6..”

敏感类型:“信用卡号码∣6..”

其中,含义可以是在数据存储内对包含6个或更多个信用卡号码、以及内容包括6
个或更多个信用卡号码的任何置信度的内容执行搜索。

在一些实施例中,布尔操作符可以用在上下文链接的查询中以连接属性和谓词中
的一个或多个。例如,采用布尔操作符的上下文链接的查询可以看上去如下:

敏感类型=“信用卡号码?#20445;?#20854;中,数目=50AND置信度=85

其中,数目和置信度可以正确地与敏感类型相关联,以使得查询可以被验证和执
行。用于生成查询的实际语言(包括讲的语言和编程语言两者)可以改变,但是功能可以保
持相同,利用简单的操作符为属性提供了上下文。在其它示例中,布尔操作符还可以实现上
下文和非上下文的属性和谓词的连接。下面的表2提供了连接属性、上下文和非上下文、以
及谓词的布尔操作符以生成查询的示例。这些仅仅是例示性的示例,并非旨在以任何方式
限制实施例。

表2:使用布尔操作符连接上下文和非上下文的属性和谓词的示例的查询



图6示出了生成上下文链接的查询的示例过程。生成上下文链接的查询的示例过
程可以例如由计算设备来执行。计算设备可以包括输入设备、存储器、和处理器、等等其它
部件。

如图600中所例示的,计算设备的处理器可以从用户接收对查询602的请求,连同
与所请求的查询相关联的一个或多个属性值。处理器可以在子过程604处结合查询来定义
属性值。属性值可以被定义为使得第一属性可以提供针对联结到第一属性的随后的属性的
上下文,以便生成上下文链接的查询606。

处理器可以在判定608处判断属性值中的一个或多个是否包括多个值。如果属性
值包括多个值610,则可以针对上下文链接的查询内的属性值插入612范围值。如果属性值
不包括多个值614,则可以在上下文链接的查询内插入616所定义的单个属性值。

处理器可以在判定618处判断随后的属性值中的一个或多个是否已经被用户省
略。如果随后的属性值中的一个或多个被省略620,则可以针对上下文链接的查询内的随后
的属性值插入622通配符值或空值。如果随后的属性值中的一个或多个尚未被省略624,则
可以在上下文链接的查询内插入626所定义的随后的属性值。

处理器可以向数据存储628提交上下文链接的查询。上下文链接的查询可以被提
交,使得查询可以被执行,其中,第一属性和/或随后的属性被应用于相同的数据集,而不需
要数据存储处的针对每个属性的不同列。

图1到图6中的示例已经被描述为包括数据?#34892;摹?#31995;统、计算设备、过程、和交互的
特定平台。实施例并不限于根据这些示例的配置的系统。上下文相关的查询可以使用本文
中所描述的原理、以类似的方式以使用包括数据?#34892;摹?#31995;统、计算设备、过程、和交互的其它
类型的平台的配置来生成和实现。

使用上下文链接的查询可以简化和提高用户提交的查询的效?#30465;?#20363;如,上下文链
接的查询可以对存储在数据存储内的数据执行,以使得属性被应用于相同的数据集,而不
需要数据存储处的针对每个属性的不同列。因此,上下文链接的查询可以有利地需要数据
存储内的较少的存储空间,并因此减少?#24067;?#38656;求。此外,上下文链接的查询可以有利地提高
可用性。例如,可以使得用户能够自定义第一属性(其为随后的属性提供上下文),以及包括
或省略对随后的属性进行约束以调整查询?#35789;?#37197;它们的搜索需求。此外,可以使得用户能
够通过用户界面来定义第一属性的?#38236;?#21270;,以使得用户能够用用户定义的语言来搜索内
容。

图7和相关联的讨论旨在提供对通用计算设备的简要的、总体描述,该计算设备可
以用于生成根据本文中所描述的至少一些实施例布置的上下文相关的查询。

例如,计算设备700可以被用作为服务器、桌面型计算机、便携式计算机、智能电
话、专用计算机、或类似的设备。在示例的基本配置702中,计算设备700可以包括一个或多
个处理器704和系统存储器706。存储总线708可以用于在处理器704与系统存储器706之间
进行通信。基本配置702在图7中通过内部虚线内的那些部件进行例示。

取决于期望的配置,处理器704可以具有任何类型,包括但不限于微处理器(μP)、
微控制器(μC)、数?#20013;?#21495;处理器(DSP)、或它们的组合。处理器704可以包括一个或多个级别
的高速缓存,例如,一级高速缓存存储器712、一个或多个处理器核714、以及寄存器716。示
例的处理器核714可以(各自)包括算法逻辑单元(ALU)、浮点单元(FPU)、数?#20013;?#21495;处理核
(DSP核)、或者它们的?#25105;?#32452;合。示例的存储器控制器718也可以与处理器704一起使用,或
者在一些实施方式中,存储器控制器718可以是处理器704的内部部分。

取决于期望的配置,系统存储器706可以具有任何类型,包括但不限于?#36164;?#24615;存储
器(例如,RAM)、?#19988;资?#24615;存储器(例如,ROM、?#38142;妗?#31561;等)或者它们的?#25105;?#32452;合。系统存储器
706可包括操作系统720、搜索应用722、查询模块726、以及编程数据724。搜索应用722可以
从用户接收对查询的请求连同与查询相关联的一个或多个属性值,并执行查询模块726,其
中,查询模块726可以被配置为通过定义属性值来生成上下文链接的查询,以使得第一属性
为一个或多个随后的属性提供上下文。查询模块726随后可以被配置为向数据存储提交上
下文链接的查询,以使得查询可以被执行,其中第一属性和/或随后的属性被应用于相同数
据集,而不需要数据存储处的针对每个属性的不同列。除了其它以外,程序数据724可以包
括与和查询相关联的所定义的属性值相关的查询数据728,如本文中所描述的。

计算设备700可以具有附加特征或功能以及附加接口以有助于基本配置702与任
何期望的设备和接口之间的通信。例如,总线/接口控制器730可以用于有助于经由存储接
口总线734而进行基本配置720与一个或多个数据存储设备732之间的通信。数据存储设备
732可以是一个或多个可移动存储设备736、一个或多个不可移动存储设备738、或者它们的
组合。可移动存储设备和不可移动存储设备的示例包括?#25490;?#35774;备,例如软盘驱动器和硬盘
驱动器(HDD)、光盘驱动器例如压缩盘(CD)驱动器或数字多功能盘(DVD)驱动器、固态驱动
器(SSD)、磁带驱动器,仅举几例。示例的计算机存储介质可以包括用任何方法或技术实现
以用于存储信息(例如计算机可读指令、数据结构、程序模块、或其它数据)的?#36164;?#24615;和?#19988;?br />失性、可移动或不可移动的介质。

系统存储器706、可移动存储设备736和不可移动存储设备738是计算机存储介质
的示例。计算机存储介质包括但不限于,RAM、ROM、EEPROM、?#38142;?#25110;其它存储技术、CD-ROM、数
字多功能盘(DVD)、固态驱动器、或其它光学存储器、磁带?#23567;?#30913;带、?#25490;?#23384;储或其它磁存储
设备、或可用于存储期望的信息并且可由计算设备700访问的任何其它介质。任何这种计算
机存储介质可以是计算设备700的部分。

计算设备700也可以包括用于有助于经由总线/接口控制器730从不同的接口设备
(例如,一个或多个输出设备742、一个或多个外围部件接口744、和一个或多个通信设备
746)到基本配置702的通信。示例的输出设备742中的一些包括图?#26410;?#29702;单元748和音频处
理单元750,其可以被配置为经由一个或多个A/V端口752与不同的外?#21487;?#22791;(例如,显示器
或者扬声器)进行通信。一个或多个示例的外围部件接口744可以包括串行接口控制器754
或并行接口控制器756,其可以被配置为经由一个或多个I/O端口758与诸如输入设备(例
如,键盘、鼠标、?#30465;?#35821;音输入设备、触摸输入设备、等等)或其它外围设备(例如,打印机、扫
描仪、等等)之类的外?#21487;?#22791;进行通信。示例的通信设备746包括网络控制器760,其可以被
布置为经由一个或多个通信端口764、通过网络通信链路与一个或多个其它计算设备762进
行通信。一个或多个其它计算设备762可以包括服务器、客户端设备、等等设备。

网络通信链路可以是通信介质的一个示例。通信介质通常可以通过计算机可读指
令、数据结构、程序模块、或者用经调制的数据信号(例如载波或其它传输机制)的其它数据
来体现,并且可以包括任何信息传送介质。“经调制的数据信号”可以是使得其特性中的一
个或多个以对信号中的信息进行编码的方式来进行设置或者改变的信号。通过示例而不是
限制的方式,通信介质可以包括诸如有线网络或直接有线连接之类的有线介?#21097;?#20197;及诸如
声波、射频(RF)、微波、红外(IR)或其它无线介质之类的无线介质。如本文中所使用的术语
计算机可读介质可以包括存储介质和通信介质两者。

计算设备700可以被实现为通用或专用服务器、主机、或包括以上功能中的任何功
能的类似的计算机的一部分。计算设备700也可以被实现为包括膝上计算机和非膝上计算
机配置两者的个人计算机。

示例的实施例也可以包括用于提供上下文相关的查询的方法。这些方法可以以任
何数量的方式(包括本文中所描述的结构)?#35789;?#29616;。一个这样的方式可以是通过本公开内容
中所描述的类型的设备的机器操作。另一种可选的方式可以是对于要被执行的方法的个体
操作中的一个或多个操作,结合一个或多个人类操作员执行操作中的某些操作,而其它操
作可以由机器来执行。这些人类操作员不需要彼此?#21442;唬?#32780;是每个可以仅具有执行程序的
一部分的机器。在其它实施例中,人类交互可以例如通过预定标准来自动化,该预定标准可
以是机器自动化的。

图8示出了根据实施例的用于生成上下文链接的查询的方法的过程800的逻辑流
程图。过程800可以在服务器、计算设备、或其它系统上实现。

过程800从操作810开始,其中,可以从用户接收对查询的请求。请求可以包括与所
请求的查询相关联的一个或多个属性值。

在操作820处,属性值可以结合查询来定义以生成上下文链接的查询。属性值可以
被定义为使得第一属性提供针对被联结到第一属性的一个或多个随后的属性的上下文。随
后的属性可以是可选的。例如,随后的属性可以被包括以作为对第一属性的一个或多个约
束,或者随后的属性可以被省略,以使得第一属性不具?#24615;?#26463;。在一些示例中,上下文链接
的查询内的属性中的一个或多个属性可具有被定义为一系列的值的多个值。在其它示例
中,响应于属性被省略的判断,可以针对一个或多个属性值在上下文链接的查询内插入通
配符值。或者,响应于属性被省略的判断,可以针对一个或多个属性在上下文链接的查询内
使值为空。

在操作830处,上下文链接的查询可以被提交给数据存储。上下文链接的查询可以
被提交,使得查询可以被执行,其中,第一属性和/或随后的属性被应用于相同的数据集,而
不需要数据存储处的针对每个属性的不同列。

包括在过程800中的操作用于例示的目的。上下文相关的查询的生成和实施方式
可以通过具有较少或附加步骤的类似过程、以及使用本文中所描述的原理、以不同的操作
顺序?#35789;?#26045;。

根据一些实施例,可以提供用于提供上下文链接的查询的方法。示例的方法可以
包括用于接收对查询的请求以及与所请求的查询相关联的一个或多个属性值的单元,用于
通过结合查询定义属性值来生成上下文链接的查询以使得第一属性提供针对被联结到第
一属性的随后的属性的上下文的单元,以及用于向数据存储提交上下文链接的查询的单
元。

根据一些示例,可以提供用于提供上下文链接的查询的方法。示例的方法可以包
括接收对查询的请求以及与所请求的查询相关联的一个或多个属性值,通过结合查询定义
属性值来生成上下文链接的查询以使得第一属性提供针对被联结到第一属性的随后的属
性的上下文,以及向数据存储提交上下文链接的查询。

在其它示例中,生成上下文链接的查询可以包括结合查询定义属性值以使得随后
的属性向第一属性提供约束。随后的属性可以是可选的。查询可以被执行,其中第一属性和
随后的属性被应用于相同的数据集,而不需要数据存储处的针对每个属性的不同列。可以
实现在上下文链接的查询内针对一个或多个属性插入通配符。

在另外的示例中,上下文链接的查询内的属性中的至少一个属性可以具有多个
值。上下文链接的查询内的属性中的至少一个属性的多个值可以被定义为值的范围。可以
实?#31181;?#23569;第一属性的?#38236;?#21270;。可以实?#31181;?#23569;第一属性的定制的分类。可以使得用户能够定
义第一属性的定制的分类。可以实现布尔操作符的使用以连接一个或多个属性和谓词。也
可以实现上下文属性和非上下文属性以及谓词的连接。

根据一些实施例,可以描述用于提供上下文链接的查询的系统。示例的系统可以
包括计算设备,该计算设备包括输入设备、存储器、以及处理器。处理器连同存储在存储器
中的指令可以被配置为通过输入设备接收对查询的请求以及与所请求的查询相关联的一
个或多个属性值,通过结合查询定义属性值来生成上下文链接的查询,以使得第一属性提
供针对被联结到第一属性的随后的属性的上下文并且随后的属性向第一属性提供约束,以
及提交上下文链接的查询以用于执行。示例的系统还可以包括通信地链接到计算设备的数
据存储,其中,上下文链接的查询可以对存储在数据存储处的数据来执行。

在其它实施例中,可以实现在上下文链接的查询内针对一个或多个属性插入通配
符值、多个值、和/或值的范围。显示设备可以通信地耦合到处理器,其中,用户界面可以通
过显示设备提供以使得用户能够定义第一属性的定制的分类。可以使得用户通过用户界面
能够定义第一属性的?#38236;?#21270;。

根据一些实例,可以提供用于针对敏感数据提供上下文链接的查询的方法。示例
的方法可以包括接收对与敏感数据的搜索相关联的查询的请求,确定与所请求的查询相关
联的一个或多个上下文属性,其中,第一属性是敏感数据类型属性,其定义正被查询的敏感
数据的类型,使得用户能够定义上下文属性,该上下文属性被配置为提供对敏感数据类型
属性的一个或多个约束。示例的方法还可以包括通过在敏感数据类型属性上联结所定义的
上下文属性来生成上下文链接的查询,以及向数据存储提交上下文链接的查询。

在其它示例中,上下文属性的值可以包括单个值、多个值、值的范围、通配符值、或
空值。上下文属性可以包括敏感匹配数目和敏感匹配置信度。缺乏上下文属性可以被解释
为针对缺乏的上下文属性的任何值是可接受的。

以上说明书、示例和数据提供了对实施例的组成的制造和使用的完整描述。尽管
已经用特定于结?#22266;?#24449;和/或方法行为的语言描述了主题,但是应当理解的是,在所附权利
要求中所定义的主题并非必须限于上面所描述的特定特征或动作。相反,上面所描述的特
定特征和动作被公开为实现权利要求和实施例的示例形式。

关于本文
本文标题:利用上下文相关的查询进行搜索.pdf
链接地址:http://www.pqiex.tw/p-6091901.html
关于我们 - 网站声明 - 网?#38236;?#22270; - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 股票指数期货的交割方式 炒股指南 上证指数走势 怎么用算式来计算股票涨跌 万达股票 股票涨跌幅如何计算 指南针炒股软件下载 南天信息股票 云南白药股票分析报告 上海股票配资哪家好