平码五不中公式规律
  • / 23
  • 下载费用:30 金币  

文档的搜索及展现的系统.pdf

关 键 词:
文档 搜索 展现 系统
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201310005829.6

申请日:

2013.01.08

公开号:

CN103914486A

公开日:

2014.07.09

当前法律状态:

授权

有效性:

有权

法?#19978;?#24773;: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20130108|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 邓寅生
发明人: 邓寅生
地址: 200041 上海市黄浦区青海路118号8楼
优?#28909;ǎ?/td>
专利代理机构: 上海专利商标事务所有限公司 31100 代理人: 施浩
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201310005829.6

授权公告号:

||||||

法律状态公告日:

2017.02.15|||2014.08.06|||2014.07.09

法律状态类型:

授权|||实质审查的生效|||公开

摘要

本发明公开了文档的搜索及展现的系统,搭建了某一专业领域的基于计算机系统的知识管理系统,提高了对专业领域知识的学习效率和利用效率。其技术方案为:在不特定文档中以关键词搜索方式标识和关联与一组关键词有文档间逻辑关?#26723;?#19968;系列文档,并对该系列文档组成的关系图以该组关键词按一定的逻辑组合进行命名。并以符合人?#36816;?#32500;逻辑的方式将该系列的文档间关系图通过图形化的形式展现出来。

权利要求书

权利要求书
1.  一种文档的搜索及展现的系统,包括文档库平台服务器以及客户端访?#39318;?#32622;,文档库平台服务器包括文档间关系图的搜索装置以及文档间关系图的展现装置,文档存储装置的主节点部署在外部的文档分类存储管理平台服务器上,文档存储装置的主节点的镜像版本部署在系统的文档库平台服务器上,其中:
文档存储装置镜像版本,根据主节点所存储的已建立文档间关系图的文档信息及指定的格式文件通过数据交换引擎同步到文档库平台服务器数据库中;
文档间关系图的搜索装置,建立具有自动维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图名称进行全文检索;
文档间关系图的展现装置,对文档间关系图进行展示、对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。

2.  根据权利要求1所述的文档的搜索及展现的系统,其特征在于,文档存储装置镜像版本进一步包括:
关系型数据库管理系统,用于建立文档分类存储管理平台主节点在文档库管理平台的镜像版本;
文档库管理系统,用于建立文档库平台;
写入操作模块,对各装置的调用执行数据库的写入操作;
平台数据同步模块,通过数据交换引擎将相关数据在文档分类存储管理平台服务器和文档库平台服务器之间传递。

3.  根据权利要求2所述的文档的搜索及展现的系统,其特征在于,文档间关系图的搜索装置进一步包括:
索引建立模块,建立一套具有自动维护功能的文档间关系图索引;
关键词检索模块,根据用户输入的查询词语对文档间关系图名称进行全文检索。

4.  根据权利要求3所述的文档的搜索及展现的系统,其特征在于,文档间关系图的展现装置进一步包括:
文档间关系图展现模块,根据用户的搜索结果展现指定的文档间关系图;
文档单元展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元的展现;
单一文档展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。

5.  根据权利要求1所述的文档的搜索及展现的系统,其特征在于,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关?#26723;?#36923;辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。

6.  根据权利要求1所述的文档的搜索及展现的系统,其特征在于,具体的实现方式还包括基于云技术构建的服务架构体系,实现诸如云端的数据查询、程序更新以及文件更新处理等服务。

7.  根据权利要求1所述的文档的搜索及展现的系统,其特征在于,文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。

8.  一种文档的搜索及展现的系统,以单机版的方式在单台设备上运行,包括:
文档存储装置,将已建立文档间关系图的文档信息存储到单台设备的数据库中,将指定的格式文件归档到单台设备的数据库中;
文档间关系图的搜索装置,建立具有自动维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图名称进行全文检索;
文档间关系图的展现装置,对文档间关系图进行展示、对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。

9.  根据权利要求8所述的文档的搜索及展现的系统,其特征在于,文档间关系图的搜索装置进一步包括:
索引建立模块,建立一套具有自动维护功能的文档间关系图索引;
关键词检索模块,根据用户输入的查询词语对文档间关系图名称进行全文检索。

10.  根据权利要求9所述的文档的搜索及展现的系统,其特征在于,文档间关系图的展现装置进一步包括:
文档间关系图展现模块,根据用户的搜索结果展现指定的文档间关系图;
文档单元展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元的展现;
单一文档展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。

11.  根据权利要求8所述的文档的搜索及展现的系统,其特征在于,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关?#26723;?#36923;辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。

12.  根据权利要求8所述的文档的搜索及展现的系统,其特征在于,文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。

说明书

说明书文档的搜索及展现的系统
技术领域
本发明涉及文档系统,尤其涉及在某一特定专业领域中对在线或单机文档(含手持设备)的搜索和展现的高效的处理系统。
背景技术
通过世界上现有的许多文档的搜索及展示的系统,专业技术人员获取、学习并研究文档,并需要从多份生成日期不同、作者不同(独立作者或联合作者)的文档中获取有效的信息作为相关行事准则的参?#23478;?#25454;。可能最终需要的某一知识内容仅占其所查询的文档内容5%以下,而且这些知识内容可能分散在若干个不明显相关的文档之中。
本申请人认识到,需要为这些专业技术人员,从他们所关心的领域中寻?#19994;?#31526;合他们要求的、准确的特定信息,即需要在海量文档提取出相应信息的解答是非常耗时的。而且能够为这些专业人员提供相关类?#21697;?#21153;的人员非常稀少。
因此,本申请人认识到需要建立一种更好的针对文档进行搜索及展现的系统方法。
发明内容
本发明的目的在于解决上述问题,提供了一种文档的搜索及展现的系统,搭建了某一专业领域的基于计算机系统的知识管理系统,提高了对专业领域知识的学习效率和利用效率。
本发明的技术方案为:本发明揭示了一种文档的搜索及展现的系统,包括文档分类存储管理平台服务器、文档库平台服务器以及客户端访?#39318;?#32622;,文档库平台服务器包括文档间关系图的搜索装置以及文档间关系图的展现装置,文档存储装置的主节点部署在文档分类存储管理平台服务器上,文档存储装置的主节点的镜像版本部署在文档库平台服务器上,其中:
文档存储装置镜像版本,根据主节点所存储的已建立文档间关系图的文档信息及指定的格式文件通过数据交换引擎同步到文档库平台服务器数据库中;
文档间关系图的搜索装置,建立具有自动维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图名称进行全文检索;
文档间关系图的展现装置,对文档间关系图进行展示、对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。
根据本发明的文档的搜索及展现的系统的一实施例,文档存储装置镜像版本进一步包括:
关系型数据库管理系统,用于建立文档分类存储管理平台主节点在文档库管理平台的镜像版本;
文档库管理系统,用于建立文档库平台;
写入操作模块,对各装置的调用执行数据库的写入操作;
平台数据同步模块,通过数据交换引擎将相关数据在文档分类存储管理平台服务器和文档库平台服务器之间传递。
根据本发明的文档的搜索及展现的系统的一实施例,文档间关系图的搜索装置进一步包括:
索引建立模块,建立一套具有自动维护功能的文档间关系图索引;
关键词检索模块,根据用户输入的查询词语对文档间关系图名称进行全文检索。
根据本发明的文档的搜索及展现的系统的一实施例,文档间关系图的展现装置进一步包括:
文档间关系图展现模块,根据用户的搜索结果展现指定的文档间关系图;
文档单元展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元的展现;
单一文档展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。
根据本发明的文档的搜索及展现的系统的一实施例,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关?#26723;?#36923;辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。
根据本发明的文档的搜索及展现的系统的一实施例,具体的实现方式还包括基于云技术构建的服务架构体系,实现诸如云端的数据查询、程序更新以及文件更新处理等服务。
根据本发明的文档的搜索及展现的系统的一实施例,文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。
本发明揭示了一种文档的搜索及展现的系统,以单机版的方式在单台设备上运行,包括:
文档存储装置,将已建立文档间关系图的文档信息存储到单台设备的数据库中,将指定的格式文件归档到单台设备的数据库中;
文档间关系图的搜索装置,建立具有自动维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图名称进行全文检索;
文档间关系图的展现装置,对文档间关系图进行展示、对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。
根据本发明的文档的搜索及展现的系统的一实施例,文档间关系图的搜索装置进一步包括:
索引建立模块,建立一套具有自动维护功能的文档间关系图索引;
关键词检索模块,根据用户输入的查询词语对文档间关系图名称进行全文检索。
根据本发明的文档的搜索及展现的系统的一实施例,文档间关系图的展现装置进一步包括:
文档间关系图展现模块,根据用户的搜索结果展现指定的文档间关系图;
文档单元展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元的展现;
单一文档展现模块,根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。
根据本发明的文档的搜索及展现的系统的一实施例,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关?#26723;?#36923;辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。
根据本发明的文档的搜索及展现的系统的一实施例,文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。
本发明对比现有技术有如下的有益效果:本发明的方案是在海量文档中以关键词搜索方式寻?#19994;?#19982;一组特定的关键词有文档逻辑关?#26723;?#19968;系列文档,并对该特定的一系列文档间的关系图以一组与之强相关的关键词进行命名,以符合人?#36816;?#32500;逻辑的方式将该系列的文档间关系图通过图形化的形式展现出来。具体而言,本发明的方案是由若?#21830;?#26381;务器群以约定的排序方式收集保存某一专业领域的日益增多的文档,并将其放置于相应的数据库进行保存。由文档分类存储管理平台对最新文档进行采集后按多个维度的关键?#35782;?#25991;档进行文档片段分类,根据指定的关键?#39135;?#21462;所有对应的文档片段组成文档单元,建立关键词索引,并通过文档单元同时产生符合人?#36816;?#32500;逻辑的关系图,并以多个维度的关键?#39318;?#23545;该文档关系图进行命名。通过数据交换引擎将多个维度的关键词定义文档片段分类后的文档及其索引,以及符合人?#36816;?#32500;逻辑的文档关系图传送到文档库平台。系统使用者可以通过电脑终端登录或其他单机设备(含手持设备)文档库平台的网页入口,并从系统中输入多个维度的关键词来查询特定文档及文档关系图,系统以关联程度自动排序,系统将进行文档正文、文档间关系图名称等元素进行分词并进行全文检索,帮助用户?#19994;?#30456;关特定知识点的关系图。
通过这一系统的搭建,可以帮助使用者以最快的速度从数据库的海量文档中搜索到某一具体文档间关系图完整内容和相关信息,提高对该专业领域知识的学习效率和利用效率。
附图说明
图1是对应于本发明的文档的搜索及展现的系统的一实施例的框图。
图2A-2C分别示出了系统中各个装置的细化结构。
图3是对应于本发明的一个操作图1系统及针对文档搜索及展现的示例性方法的框图。
图4是对应于本发明的单一文档在数据库层面存储实现原理图。
图5是对应于本发明的单一文档标识关联及文档间关系图在数据库层面存储实现原理图。
图6是对应于本发明中的文档分类存储管理平台、文档库平台之间数据流通部分实现框图。
图7是对应于本发明中的文档间关系图的搜索实现原理框图。
图8是对应于本发明的文档间关系图搜索装置数据库层面实现原理图。
图9是对应于本发明中的文档间关系图展示实现原理框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1示出了本发明的文档的搜索及展现的系统的一实施例的结构。本发明的系统既适用于在线文档,也适用于单机文档(包含手持设备)。本发明的实施例是以在线文档为例来说明的,单机文档的应用类似,区别仅在于?#26576;?#21333;机版,这是本领域技术人员熟知的。请参见图1,本实施例的系统包括文档库平台服务器12以及客户端访?#39318;?#32622;14。客户端访?#39318;?#32622;14不限数量,可以为图1所示的三个:客户端访?#39318;?#32622;140、142、144。
文档库平台服务器12除了常见的中央处理器、操作系统以及数据交换引擎之外,还包括控制应用部分:文档间关系图的搜索装置120、文档间关系图的展现装置122以及部署在文档库平台服务器上的文档存储装置的主节点的镜像版本124。
本实施例的搜索及展现的系统外接一个文档分类存储管理平台服务器10。文档分类存储管理平台服务器10除了常见的中央处理器、操作系统以及数据交换引擎之外,还包括控制应用部分:单一文档的采集装置100、单一文档的标识和关联装置102、文档间关系图建立装置104、以及部署在文档分类存储管理平台服务器上的文档存储装置的主节点106。
在说明本实施例的搜索及展现的系统之前,首?#20154;?#26126;外接的文档分类存储管理平台服务器10所实现的功能。
单一文档的采集装置100总体实现了所需管理类型文档的搜集、初步加工以及导入系统的功能。其具体实现为:在系统外将文档整理成指定的格式文件,在系统外将格式文件按照要求添加初步分类信息,包括但不限于:标题信息、标识号信息、文档头信息、文档正文信息、附件信息、多语言版本信息等。格式文件通过系统导入到文档分类存储管理平台服务器10上。
图3示出了本发明系统的运行流程,结合图3说明单一文档的采集装置100的运行流程如下。
首先,提供包含至少一个将指定格式的文档文件与文档数据关联起来的数据结构(文档信息基础表、作者表、文档全文内容表、文档全文关键词表)的知识库。图4示出了单一文档的采集装置100的数据库层面的表间关系。
本发明的系统提供给用户一套完整的采集指定文档的系统工具及其实现方法,用户可以发起一个文档采集的流程用户可以对由上一步搜集的文档进行判断,判断其是否具有收录的价值,如果没有则本流程终止,反之则继续进行后续处理。
然后,将文档整理成系统能够识别的指定文件格式后上传到系统临时库中。响应于接收到来自请求者的上传请求,将所使用的上传文件通过文件流的方式传送到服务器端,将指定的符合格式要求的文件分行读取并解析。
对提交的文档进行审核,判断其格式及内容是否符合要求,如果不符合要求则退回文件上传临时库这一步骤要求重新处理。如果审核通过后,则将指定格式文件中的信息分字段并经过转换后存入到文档信息基础表中,将该文档的作者存入到作者表中(一个文档可以有多个作者,因此?#24066;?#26377;多条记录),其中基础表ID字?#38382;?#25991;档信息基础表的外键,并将文档正文对应的关键词存入文档全文关键词表中(文档正文可以有多个关键词,因此?#24066;?#26377;多条记录),其中全文内容表ID是全文内容表的外健。
在上述操作全部成功之后,将指定格式文件存入到文档库中,并将执行结果反馈给请求者。上述写入数据库以及文档库的操作都是调用文档存储装置106?#35789;?#29616;的。
单一文档的标识和关联装置102部署于文档分类存储管理平台服务器10上,其主要实现以下功能:1、按照不同的维度对预设的专业术语进行分类和定义,建立和维护对应专业领域的关键词列表;2、对单一文档按照不同的属性进行定义,这些相关属性成为系统的查询条件;3、在单一文档中设置若干个文档单元;4、定义?#25105;?#20004;个单 一文档或文档单元之间可能产生的逻辑关系列表;5、通过已设定的逻辑关系种类实现两个单一文档之间的逻辑关?#26723;?#20851;联设置。
在单一文档进行属性标识的同时,建立起多个维度的关键词分类体系,使用关键?#35782;?#25991;档进行多角度全方位的划分。具体方法包括:针对文档的每一个文档片段分别标识一组关键词;在同一个文档中将拥有含义相似、概念相近关键词的文档片?#26410;?#19981;同维度定义为若干个文档单元;依据分门别类、解构建构的思路设定这些文档单元之间的逻辑关系,并对每一种逻辑关系设定一个专属的图标进行标识,组成的最基本展现画面?#28006;?#20026;文档间关系图展现。例如,派生关系表示:文档B是依据文档A的某一的文档片段撰写的。平行关系表示:对于共同基于文档A的某一的文档片段撰写的两个或多个文档间的关系,为平行文档。设定平行文档时,发布时间早的居左,发布时间晚的居右。
文档间关系图一般会根据不同的专业领域分别定义若干个不同维度的关键词中至少选择不少于2个的关键?#39318;?#25104;。
单一文档的标识和关联装置102在收到操作者的对单一文档进行标识和关联的命令后执行相关操作并与用户进行交互,内部数据库表间的关系请参见图5。
单一文档的标识和关联装置102提供包含至少一个将关键词数据与文档数据、文档片段数据关联起来的数据结构(关键词表、文档信息基础表、文档全文内容表、文档全文关键词表、文档段落内容表、文档段落关键词表)的知识库。
系统提供对关键词维度进行定义的功能,对应数据库关键词表中的关键词种类字段。系统提供对已确认的关键词维度进行编辑具体的关键词的功能,包括但不限于:关键词名称、关键词维度(种类)等属性进行编辑,并发起一个关键词定义的流程。
系统提供对提交的关键词必要性及其各属性设置情况进行审核的功能,如果审核不通过则退回具体关键词编辑的步骤,如果审核通过则将数据保存入数据库的关键词表中。
系统提供将文档按文档片段分别定义对应的关键词的功能。该功能将数据存入文档段落内容表、文档段落关键词表。文档片段其中文档段落内容表的基础表ID字?#38382;?#25991;档信息基础表的自增长ID字段的外键文档段落关键词表的段落表ID是文档段落内容表的自增长ID字段的外键,关键词ID字?#38382;?#20851;键词表的自增长ID字段的外键。
系统提供将文档正式存入文档分类存储管理平台数据库及文档库,并执行发布操作的功能。
上述写入数据库、文档库的操作最终都是调用文档存储装置106?#35789;?#29616;。
文档间关系图建立装置104部署于文档分类存储管理平台服务器10之上,其对文档间关系图进行定义,对文档间关系图的各组成部分之间的关系进行定义。
文档间关系图建立装置104在接收到操作者的文档间关系图建立命名后执行相关操作,并与用户进行交互,而数据库表间关系请参见图5。
提供包含至少一个将关键词数据与文档数据、文档间关系图数据关联起来的数据结构(关键词表、文档信息基础表、文档全文内容表、文档全文关键词表、文档段落内容表、文档段落关键词表、文档间关系图头表、文档间关系图基本表、文档间关系图对应段落表)的知识库。
系统中提供一套完整的对文档间关系图进行创建及维护流程的功能。系统提供一种定义本文档间关系图所涉及到的关键词维度的功能。并定义所设计关键词维度中需要对应的具体关键词。将数据存入文档知识点头表,其中关键词维度1ID~关键词维度[N]ID分别是关键词表自增长ID字段的外键。
系统将会根据所设定的关键词列出所有符合条件的文档,并且按同时符合数的数量降序排序。
系统提供一种列出在所有符合条件的文档中筛选出最符合本文档间关系图概念的文档单元的功能。就某一特定专业领域的文档间的逻辑关系而言,可分为N类(N为自然数)逻辑关系,?#28909;紓号?#29983;关系(即A派生B)、平行关系/与关系(即A与B平行)、或关系(即A或B皆成立)、包含关系(即A包含B)、修订关系(即B对A的部分表述、内容进行修订)、覆盖关系(B的内容完全包含A,但又明?#21592;華完整,?#30340;?#24191;泛认同B而不是A,则A被B覆盖)、否定关系(A与B相反)。
举例来说,A教材中分为10章,每?#36335;?0节。第4章和第5?#36335;?#21035;?#27493;?#21516;一事物的两个不同的属性,属于平行关系。第1章与第1章第2节属于包含关系,即第1章包含第1章第2节。第8章第3节和第8章第4节阐述了同一事物的两个相反的但都未被证?#26723;?#29702;论假设,前者成立则后者不能成立,反之亦如是,即两者是否定关系。第9章第7节和第9章第8节阐述了同一事物的两个平行的但都未被证?#26723;?#29702;论假设, 前者成立与后者成立没有必然关系,即两者是或关系。B教材中的第X?#29575;?#23545;A教材第5章的释读,则前者与后者是派生关系。
在此,系统将会为每一种文档间的逻辑关系赋与唯一的图形标识,在展示?#24065;?#35813;特定标识作为两个文档单元之间的逻辑关?#26723;?#26631;识,以便系统使用者直接理解和辨识。
每一个单一文档都可以被分解成若干个文档片段,每个文档片段可以被定义为一个文档单元。对于某一专业领域的任何文档,必然拥有该领域的一个以上专业术语的属性,这个专业术语可以通过计算机系统?#25345;档?#24418;式定义为与该文档单元文档片段对应的关键词。
举例来说,文档片段X和Y是平行关系,文档片段X对应的关键词为A、B、C、D,文档片段Y对应的关键词为B、C、D、E,则?#24065;訠-C-D关键词进行搜索,则系统显示结果为B-C-D。
每一个选中的文档单元都会在文档间关系图基本表中以记录的形式体现,其中知识点头表ID字?#38382;?#25991;档间关系图头表的自增长ID字段的外键,文档基础表ID是文档信息基础表的自增长ID字段的外键,元素ID字?#38382;?#26681;据规则自动产生的。具体规则为:
文档单元:“PF_”+选择元素时时间戳所转换的数字;
派生关系:“PL_”+选择元素时时间戳所转换的数字;
平行关系:“PE_”+选择元素时时间戳所转换的数字;
修订关系:“PM_”+选择元素时时间戳所转换的数字;
覆盖关系:“PN_”+选择元素时时间戳所转换的数字;
包含关系:“PQ_”+选择元素时时间戳所转换的数字;
否定关系:“PT_”+选择元素时时间戳所转换的数字。
同时在子表文档间关系图对应段落表中需要填入所选择文档单元具体所对应的段落号,其中文档间关系图基本表ID字?#38382;?#25991;档间关系图基本表自增长ID字段的外键,段落序号字?#38382;?#25991;档段落内容表的段落排序号字段的外键。
系统提供对所筛选出的文档单元进行布局,同时设置这些文档单元之间的逻辑关?#26723;?#21151;能,这种逻辑关系包括但不仅限于?#21495;?#29983;关系、平行关系、修订关系、覆盖关系、包含关系、否定关?#26723;取?
实现的方法为?#21512;?#28155;加所要连接关?#26723;?#25991;档单元到设计区上,调整坐标位置;再添加所需要设计的关?#26723;?#35774;计区上,系统将实时画出关系图形效果,并可以根据用户的?#29486;?#31227;动调整关系元素的位置、大小、粗细等?#38468;冢?#20998;别设定关系元素的连接两端的文档单元元素,关系元素的两端只能选择文档单元元素,文档单元元素也只能由关系元素连接起来。
以派生关系为例,在文档间关系图基本表中,派生关系元素需要分别设置它的上元素ID、下元素ID。同时被上元素ID、下元素ID选中的两个文档单元,在该表中同样要更新下元素ID及相应的上元素ID,以及对被上元素ID所对应的文档单元需要设置它跳过关系元素直接连接到的下元素实体ID,对被下元素ID所对应的文档单元需要设置它跳过关系元素直接连接到的上元素实体ID。这里的上元素ID、下元素ID、上元素实体ID、下元素实体ID都是文档间关系图基本表中的元素ID字段的外键。
其他如平行关系、修订关系、覆盖关系、包含关系、否定关系都是按与派生关系相同的处理方法进行处理;
同时对于文档单元在文档间关系图基本表中需要记录它在设计区上的元素开始X坐标、元素开始Y坐标,以设计区左上角为(0,0)点。
同时对于各关系元素在文档间关系图基本表中需要记录它在设计区上的元素开始X坐标、元素开始Y坐标、元素结束X坐标、元素结束Y坐标,以设计区左上角为(0,0)点,以及线条?#35745;?#27969;数据。
其中线条?#35745;?#27969;数据,是将在设计区上所最终确定下来关系元素的大小、粗细等?#38468;?#36716;换成非常通用的矢?#23458;紁ng?#35745;?#26684;式并再次转换成二进制的?#35745;?#27969;数据存储到数据库。
系统提供对所提交的文档间关系图进行审核的功能,判断该文档间关系图的定义以及文档单元间的逻辑关系设置等是否正确,如果不正确则将退回文档间关系图的创建的这一步重新执行,反之审核通过则继续进行后续处理。
系统提供将文档间关系图正式存入文档分类存储管理平台数据库及文档库,并执行发布操作的功能。
上述写入数据库、文档库的操作最终都是调用文档存储装置106?#35789;?#29616;。
文档存储装置的主节点106部署在文档分类存储管理平台服务器10之上,而在文档库平台上部署主节点的镜像版本124。文档存储装置的镜像版本124根据主节点所存储的已建立文档间关系图的文档信息及指定的格式文件通过数据交换引擎同步到文档库平台服务器数据库中。
如图2A所示,文档存储装置106包括关系型数据库管理系统1060、文档库管理系统1061、写入操作模块1062、和平台数据同步模块1064。关系型数据库管理系统1060用于建立文档分类存储管理平台主节点在文档库管理平台的镜像版本。文档库管理系统1061用于建立文档库平台。写入操作模块1062对各装置的调用执行数据库的写入操作。平台数据同步模块1064通过数据交换引擎将相关数据在文档分类存储管理平台服务器10和文档库平台服务器12之间传递。
文档存储装置106在接收到来自其他装置的请求后执行数据库存储和文档库归档的交互式方法。
请参见图6,文档存储装置106提供包含至少一个将本系统所有平台所有数据全部关联起来的数据结构的知识库。提供包含至少一个经过配置可以按版本归档指定格式文件的文档库。提供包含至少一套完整的数据库调用接口,供单一文档的采集装置100、单一文档的标识和关联装置102、文档间关系图建立装置104、文档间关系图的搜索装置120、文档间关系图的展现装置124按需使用。提供包含至少一套完整的文档库调用接口,供单一文档的采集装置100、单一文档的标识和关联装置102用来归档及更新指定格式文件。
提供包含至少一套完整的数据同步机制,并调用数据交换引擎?#35789;?#24688;当的数据能够及时在文档分类存储管理平台、文档库平台两者之间流通。
文档分类存储管理平台服务器10通过接口程序与文档库平台服务器12进行数据的交互传递,部分实现请参见图6。它将需要发送的数据通过远端写入的方式写入到文档库平台待同步信号表及相关临时表,再由文档库平台的接口程序进行相关后续处理。同时它也将根据并主动抓取文档库平台中的待回传信号表及同步临时表中的数据。
当在文档分类存储管理平台服务器10?#29616;?#34892;各?#22336;?#24067;操作,包括但不仅限于:关键词发布、单一文档发布、文档间关系图发布等时,首先将待同步信号写入到临时表,以便接口程序循?#20998;?#34892;周期开始时进行后续相关处理。
文档分类存储管理平台服务器10上的调度定时器,根据所设定的时间步长向量,定时循?#20998;?#34892;接口程序,一旦因为接口程序未在一个时间步长向量内完成数据传递工作,或者因为接口程序出现异常等情况,具备智能?#25351;?#30340;功能。
文档库平台服务器12通过接口程序来获取文档分类存储管理库平台服务器10传递过来的数据,部分实现请参见图5。根据文档分类存储管理平台服务器10的接口程序主动推送到本平台的待同步信号表及同步临时表的相关数据对目标数据库的数据进行更新处理。同时对于由本平台的包括但不仅限于:用户行为信息等操作所产生的数据进行抓取后并写入待回传信号表及同步临时表,以便文档分类存储管理平台的接口程序进行后续处理。
当文档库平台服务器12通过接口程序接收到文档间关系图等数据时,会触发全文搜索引擎重建索引的功能。
在介绍完上述的外接的文档分类存储管理平台服务器之后,下面是对本实施例的文档的搜索及展现的系统的详?#35813;?#36848;。
文档间关系图的搜索装置120建立具有自维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图进行全文检索。文档间关系图的搜索装置120包括如图2B所示的索引建立模块1200和关键词检索模块1202。
索引建立模块1200建立一套具有自动维护功能的文档间关系图索引。关键词检索模块1202根据用户输入的查询词语对文档间关系图进行全文检索。
文档间关系图的搜索装置120部署在文档库平台服务器12之上,在搜到来自最终用户的请求后按照既定规则执行数据检索。运行流程如图7所示,数据库表间关系图如图8所示。
系统提供包含至少一套将文档间关系?#21152;?#26597;询条件元素建立组合索引的数据结构的知识库。在数据库?#26800;?#26377;文档间关系图相关信息进行同步更?#29575;?#31995;统将自动更新,针对文档间关系图查询而特别建立的由文档间关系图名称的字段而联合建立的全文搜索索引表,数据库表间关系图请参见图8。
当用户使用文档间关系图的全文检索时,系统首先调用全文搜索引擎中的分?#39318;?#20214;进行分词处理。再次调用全文搜索引擎进行预搜索并自动完成查询词语,针对用户输入的查询词语在文档间关系图名称列中进行检索,并根据用户的渐进输入自动完成, 给出的自动完成列表中按文档间关系图被查询调用的次数(根据文档间关系图被搜索词频记录表的次数字段,该表的文档间关系图头表ID字?#38382;?#25991;档间关系图头表的自增长ID字段的外键)降序排序。
系统根据确切的查询词语或者在自动完成列表中所选择的具体文档间关系图名称,再次调用全文搜索引擎中的分?#39318;?#20214;进行分词处理。将分词后的各词语到全文搜索索引表中根据文档间关系图名?#28006;?#34892;检索。系统将判断是否?#19994;?#30456;关的结果,如果未?#19994;?#23558;执行记录查询词语的功能,反之则继续进行后续处理。
系统将记录该查询词语(写入无结果词记录表),并将通过文档存储装置调用数据交换引擎将数据传回文档分类存储管理平台。
将检索到的查询结果按文档间关系图被搜索选择次数及网罗度进行降序排序后分页返回,将由用户点击进入查看某个具体文档间关系图。并且搜索词将高?#26009;?#31034;。
当用户点击某个具体的文档间关系图进入明细查看画面,系统将调用文档间关系图的展现装置122进行展示。
文档间关系图的展现装置122对文档间关系图进行展示,对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。文档间关系图的展现装置122包括如图2C所示的文档间关系图展现模块1220、文档单元展现模块1222、单一文档展现模块1224。文档间关系图展现模块1220根据用户的搜索结果展现指定的文档间关系图。文档单元展现模块1222根据用户的搜索结果展现指定的文档间关系图中的某个文档单元的展现。单一文档展现模块1224根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。
文档间关系图的展现装置122部署在文档库平台服务器12之上。
文档间关系图的展现装置122在收到来自最终用户的请求后按既定规则将信息进行展现的交互式方法如图9所示,具体描述如下。
系统提供包含至少一套完整文档全文信息、完整文档间关系图信息数据结构的知识库。
系统根据最终用户的选择,将所选择的文档间关系图的自增长ID到文档间关系图头表中执行检索操作,执行文档间关系图的展示功能,数据库表间关系图请参见图5。
文档间关系图的展示处理过程为:根据文档间关系图编号到文档间关系图基本表中获取该文档间关系图的所有组成元素及其相关属性。
构建所有的文档单元,并初始化文档单元的宽度?#36879;?#24230;以及进行坐标定位。
构建所有文档单元之间的逻辑关系,并初始化这些逻辑关系线条的长度、高度、宽度以及进行坐标定位。从数据库文档间关系图基本表中的线条?#35745;?#27969;数据字段中将二进制数据转成为png格式的?#35745;?#25991;件并在画面上进行显示。
处理包括但不限于:修订/被修订、覆盖/被覆盖等特殊关?#26723;?#20301;置以及文档单元的层叠属性。当某两个文档单元修订关系元素、覆盖关系元素等特殊元素所连接时,连接的文档单元将置于上层,被连接的文档单元将被置于下层。例如:覆盖关系,A覆盖于B,则A文档单元将置于上层,B文档单元将置于A文档单元的下层,两个文档单位呈层叠显示?#30784;?
获取所有文档单元中所对应文档的具体文档片?#25991;?#23481;,根据文档间关系图基本表的文档基础表ID字段+文档间关系图对应段落表的段落序号字段到文档段落内容表获取该文档单元所对应的全部段落内容记录,并排段落序号升序排序。
至此,文档间关系图展示处理完成,将处理结果返回并显示。
根据最终用户的选择,将所选择文档单元传递给系统执行文档单元的单独展现。
根据所选择的文档单元在文档间关系图基本表的文档基础表ID字段+文档间关系图对应段落表的段落序号字段到文档段落内容表获取该文档单元所对应的全部段落内容记录,并排段落序号升序排序,以单一文档单元的独立方式展示,独立方式整个屏幕只能看到该文档单元而不显示其他文档单元。
根据所选择的文档单位,在该单元的四周按逻辑关?#26723;?#19981;同,在不同位置,并按该文档单元的实际连接情况,构建逻辑关系连接线。例如:A文档单元被派生关系连接于?#36335;劍?#21516;时?#40644;?#34892;关系连接于?#20918;擼?#21017;在该文档单元的上部显示派生关系向上箭头图标,在文档单元的左边显示平行关系向左箭头图标。
同时,在文档单元单独展现画面上?#22266;?#20379;该文档单元所在文档的文档标识号连接。
通过点击文档标识号,画面将跳转到该单一文档全文展示画面,以便用户查看完整的文档内容。
文档单元的单独展现处理完毕,将处理结果返回并显示。
根据最终用户的选择,将所选择的文档标识号到文档信息基础表中执行检索操作,执行对应该文档单元的单一文档全文展示功能。
从文档段落内容表中抽取该文档的所有段落,并按段落排序号升序排序后展现在画面上。
需要注意的是,在本发明中,可以被搜索和展现的文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告等,包括但不限于文字、音频、视频、网页等多媒体介质,包括但不限于某一特定专业领域的知识(可以是自然科学知识,?#37096;?#20197;是社会科学知识),也不限于中文或其它文字。
此外,上述方案具体的实现方式还包括基于云技术构建的服务架构体系,例如部署于云端的数据查询、程序更新以及文件更新处理等服务。
以上的实施例均是基于在线文档来描述的,本发明的上述方案还可稍作修改之后应用于单机文档。系统是以单机版的方式在单台设备(例如单机方式运行的计算机、手持设备等)上运行。单机版系统包括:文档存储装置、文档间关系图的搜索装置、文档间关系图的展现装置。
文档存储装置将已建立文档间关系图的文档信息存储到单台设备的数据库中,将指定的格式文件归档到单台设备的数据库中。
文档间关系图的搜索装置,建立具有自动维护功能的文档间关系图索引,并根据输入的查询词语对文档间关系图名称进行全文检索。文档间关系图的搜索装置进一步包括:索引建立模块和关键词检索模块。索引建立模块建立一套具有自动维护功能的文档间关系图索引。关键词检索模块,根据用户输入的查询词语对文档间关系图名称进行全文检索。
文档间关系图的展现装置对文档间关系图进行展示、对文档间关系图中的某个文档单元的单独展现以及对文档间关系图中的某个文档单元对应的单一文档全文进行展现。文档间关系图的展现装置进一步包括:文档间关系图展现模块、文档单元展现模块、单一文档展现模块。文档间关系图展现模块根据用户的搜索结果展现指定的文档间关系图。文档单元展现模块根据用户的搜索结果展现指定的文档间关系图中的某个 文档单元的展现。单一文档展现模块根据用户的搜索结果展现指定的文档间关系图中的某个文档单元对应的单一文档全文的展现。
在单机版的实施例中,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关?#26723;?#36923;辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。
上述实施例是提供给本领域普通技术人员?#35789;?#29616;和使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种?#20013;?#25913;或变化,因而本发明的保护?#27573;?#24182;不被上述实施例所限,而应该是符合权利要求书所提到的创新性特征的最大?#27573;А?/p>

关于本文
本文标题:文档的搜索及展现的系统.pdf
链接地址:http://www.pqiex.tw/p-6115871.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 欧乐棋牌游戏 p图中彩票 组选791 北京pk10牛牛软件 河南福彩中心工作福利 14任选9场奖金 体彩泳坛夺金赚钱技巧 股票融资率多少算危险 新疆福利彩票时时彩公式 黑龙江十一选五遗漏