平码五不中公式规律
  • / 25
  • 下载费用:30 金币  

网页运行方法和系统.pdf

关 键 词:
网页 运行 方法 系统
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201310006595.7

申请日:

2013.01.08

公开号:

CN103914490A

公开日:

2014.07.09

当前法律状态:

授权

?#34892;?#24615;:

有权

法?#19978;?#24773;: 授权|||专利申请权的转移IPC(主分类):G06F 17/30登记生效日:20160914变更事项:申请人变更前权利人:纽海信息技术(上海)有限公司变更后权利人:?#26412;?#20140;东尚科信息技术有限公司变更事项:地址变更前权利人:201203 上海市浦东新区祖冲之路295号102室变更后权利人:100195 ?#26412;?#24066;海淀区杏石口路65号西?#21363;?#24847;园四区11号楼东段1-4层西段1-4层|||实质审查的生效IPC(主分类):G06F 17/30申请日:20130108|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 纽海信息技术(上海)有限公司
发明人: 黄申; 韩军
地址: 201203 上海市浦东新区祖冲之路295号102室
优?#28909;ǎ?/td>
专利代理机构: 上海智信专利代理有限公司 31002 代理人: 薛琦;王聪
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201310006595.7

授权公告号:

|||||||||

法律状态公告日:

2018.06.12|||2016.10.12|||2015.11.25|||2014.07.09

法律状态类型:

授权|||专利申请权、专利权的转移|||实质审查的生效|||公开

摘要

本发明公开了一种网页运行方法和系统,所述网页运行方法包括步骤:从一网页中提取主题内容;从一数据库获取每个与所述主题内容相关联的关键?#23460;?#21450;为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面;分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数;?#32874;?#20851;系数从高到低的顺序选取与一预设数值相等数量的关键?#39318;?#20026;显示关键词;将各个包含所述显示关键词的页面组合作为所述网页的显示内容。本发明?#22266;?#20379;了一种使用所述网页运行方法的系统。本发明通过判断页面内容与主题内容的相关?#26085;?#36873;最匹配的页面内容,所以便于用户获取与主题内容关联的更有价值的信息。

权利要求书

权利要求书
1.  一种网页运行方法,其特征在于,所述网页运行方法包括以下步骤:
S1、从一网页中提取主题内容;
S2、从一数据库获取每个与所述主题内容相关联的关键?#23460;?#21450;为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面;
S3、分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数;
S4、?#32874;?#20851;系数从高到低的顺序选取与一预设数值相等数量的关键?#39318;?#20026;显示关键词;
S5、将各个包含所述显示关键词的页面组合作为所述网页的显示内容。

2.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S3为:
通过下式计算每个页面的关键词的相关系数,
Rs(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
其中所述Rs(T,K)为所述相关系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且w1+w2+w3=1。

3.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S3为:
通过下式计算每个页面的关键词的相关系数,
Ri(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
Rs(T,K)=(1-i/n)×Rm+i/n×Ri(T,K)
其中所述Rs(T,K)为所述相关系数,所述Ri(T,K)为系统相关系数,所述Rm为干预系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1,所述n为干预时间段长度,所述i为当前运行时间,其中0≤i≤n。

4.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S5之后还包括步骤S6,其中步骤S6中包括:
S61、为所述数据库中每个主题生成包含所述主题在一特定时间段的点击次数和购买次数的一第一主题页面;
S62、分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数;
S63、按所述第一相关系数从高到低的顺序选取与一第一预设数值相等数量的主题作为第一显示主题;
S64、将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。

5.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S5之后还包括步骤S7,其中步骤S7中包括:
S71、从所述网页提取用户身份数据;
S72、从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第二主题页面;
S73、分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数;
S74、按所述第二相关系数从高到低的顺序选取与一第二预设数值相等数量的主题作为第二显示主题;
S75、将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。

6.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S5之后还包括步骤S8,其中步骤S8中包括:
S81、从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第三主题页面;
S82、分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数;
S83、按所述第三相关系数从高到低的顺序选取与一第三预设数值相等数量的主题作为第三显示主题;
S84、将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。

7.  如权利要求1所述的网页运行方法,其特征在于,所述步骤S5之后还包括步骤S9,其中步骤S9中包括:
S91、为所述数据库中每个主题生成包含所述主题在一样本时间段的点击次数和购买次数的一第四主题页面;
S92、基于所述第四主题页面的点击次数和购买次数计算所述主题的第四相关系数;
S93、从所述网页提取用户身份数据;
S94、从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第五主题页面;
S95、基于所述第五主题页面的点击次数和购买次数计算所述主题的第五相关系数;
S96、从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第六主题页面;
S97、基于所述第六主题页面的点击次数和购买次数计算所述主题的第六相关系数;
S98、分别基于所述数据库中每个主题的第四相关系数、第五相关系数和第六相关系数计算所述主题的总相关系数;
S98、按所述总相关系数从高到低的顺序选取与一第四预设数值相等数量的主题作为第四显示主题;
S99、将各个包含所述第四显示主题的主题页面组合作为所述网页的显示内容。

8.  如权利要求7所述的网页运行方法,其特征在于,所述步骤S98为:
通过下式计算所述主题的总相关系数:
Rz(T)=v1×H(T)+v2×P(T)+v3×A(T,T')
其中所述Rz(T)为总相关系数,所述H(T)为第四相关系数,所述P(T)为第五相关系数,所述A(T,T’)为第六相关系数,所述v1、v2和v3均大于等于零,且所述v1+v2+v3=1。

9.  一种网页运行系统,其特征在于,所述网页运行系统包括一网页服务器和多个客户端,其中所述网页服务器包括一数据库、一页面生成模块、一相关度计算模块和一网页生成模块;
所述网页服务器从所述客户端获取的网页中提取一主题内容,并从所述数据库获取每个与所述主题内容相关联的关键词;
所述页面生成模块为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面;
所述相关度计算模块分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数;
所述网页服务器?#32874;?#20851;系数从高到低的顺序选取与一预设数值相等数量的关键?#39318;?#20026;显示关键词;
所述网页生成模块将各个包含所述显示关键词的页面组合作为所述网页的显示内容并将所述页面发送?#20102;?#36848;客户端。

10.  如权利要求9所述的网页运行系统,其特征在于,所述相关度计算模块通过下式计算每个页面的关键词的相关系数,
Rs(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
其中所述Rs(T,K)为所述相关系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述 Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1。

11.  如权利要求9所述的网页运行系统,其特征在于,所述相关度计算模块通过下式计算每个页面的关键词的相关系数,
Ri(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
Rs(T,K)=(1-i/n)×Rm+i/n×Ri(T,K)
其中所述Rs(T,K)为所述相关系数,所述Ri(T,K)为系统相关系数,所述Rm为干预系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1,所述n为干预时间段长度,所述i为当前运行时间,其中0≤i≤n。

12.  如权利要求9所述的网页运行系统,其特征在于,所述网页服务器的页面生成模块还为所述数据库中每个主题生成包含所述主题在一特定时间段的点击次数和购买次数的一第一主题页面;
所述相关度计算模块分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数;
所述网页服务器按所述第一相关系数从高到低的顺序选取与一第一预设数值相等数量的主题作为第一显示主题;
所述网页生成模块还将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。

13.  如权利要求9所述的网页运行系统,其特征在于,所述网页服务器还从所述客户端获取的网页提取用户身份数据;
所述页面生成模块还从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第二主题页面;
所述相关度计算模块分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数;
所述网页服务器按所述第二相关系数从高到低的顺序选取与一第二预设数值相等数量的主题作为第二显示主题;
所述网页生成模块还将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。

14.  如权利要求9所述的网页运行系统,其特征在于,所述网页服务器的页面生成模块还从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第三主题页面;
所述相关度计算模块分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数;
所述网页服务器按所述第三相关系数从高到低的顺序选取与一第三预设数值相等数量的主题作为第三显示主题;
所述网页生成模块还将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。

说明书

说明书网页运行方法和系统
技术领域
本发明涉及一种网页运行方法和系统,特别是涉及一?#21482;?#32852;网?#26800;?#32593;页运行方法和系统。
背景技术
互联网已经成为计算机领域的热门技术,互联网的普及使得人们可以?#40644;?#31354;间、地域的限制,方便地共享信息资源。互联网作为一种信息服务,自诞生以来得到的迅猛发展,使其成为一个巨大的信息库,存储着大量有价值的信息,所以人们可以在其上查找自己?#34892;?#36259;的各种内容。
但是正是由于互联网的数据量非常庞大,所以与请求页面中主题内容相关联的页面内容非常多,动辄上万,甚至是数十万。这其中有相?#24065;?#37096;分页面内容虽然与主题内容相关,但是与请求页面实际请求的内容无关,汇集并反馈这些无关的页面内容将浪费用户的大量时间并分散用户的精力。
发明内容
本发明要解决的技术问题是为了克服现有技术中为请求页面的主题内容关联了大量包含?#23435;?#29992;信息的页面内容的缺陷,提供一种网页运行方法和系统,通过判断包含主题内容的页面内容与主题内容的相关度来甄选与主题内容最为匹配的页面内容,所以提高了主题内容关联的效率。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种网页运行方法,其特点是,所述网页运行方法包括以下步骤:
S1、从一网页中提取主题内容;
本发明中利用现有的网页解析技术,从包含主题内容的网页中解析提取主题内容,而?#20918;?#21457;明中所述主题内容是指用户的点击网页、网页查找或检 索等操作的操作内容,通过这些操作本发明可以将用户对应于所述操作的结果或过程中间?#26723;?#25968;据回馈给用户。
S2、从一数据库获取每个与所述主题内容相关联的关键?#23460;?#21450;为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面;
本发明中通过比较与主题内容相关联的所述关键词的关联程度来确定反馈数据。其中所述主题内容相关联的所有所述关键词是通过现有的关联技术设定好的关键词,所以本发明中不再详细阐述所述主题内容和所述关键词的关联机理。而且所述关键词的点击次数、购买次数、搜索次数和显示次数均是预先设定的所述关键词的参数数据,所?#28304;?#22788;同样不再详细阐述所述关键词的上述参数的取得等机理。
其中所述页面是互联网技术中网页的构成部分,所?#28304;?#22788;对页面的结构以及其与网页的关联不在详细赘述。而?#20918;?#21457;明在确定关键词后,通过现有的页面解析方法,为每一个关键词生成包含上述参数内容的一个页面。
S3、分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数;
S4、?#32874;?#20851;系数从高到低的顺序选取与一预设数值相等数量的关键?#39318;?#20026;显示关键词;
由于主题内容所关联的关键词的数量是很大的,例如100万等等,所以本发明通过相关系数确定与所述主题内容关联度最高一组关键词寻?#39029;?#26469;,作为反馈的数据。
S5、将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
其中所述显示内容是现有网页页面中以图形等方式显示出来的内容,所?#28304;?#22788;不再详细阐述所述内容的具体显示机理。
较佳地,所述步骤S3为:
通过下式计算每个页面的关键词的相关系数,
Rs(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
其中所述Rs(T,K)为所述相关系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1。
本发明中利用加权权重的方式来调节所述搜索次数、点击次数以及购买次数?#36816;?#36848;关键词和所述主题内容之间的关联度的影响。也就是说,通过这种相关度的计算来确定所述主题内容和各个页面之间的相关度。
较佳地,所述步骤S3中为:
通过下式计算每个页面的关键词的相关系数,
Ri(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
Rs(T,K)=(1-i/n)×Rm+i/n×Ri(T,K)
其中所述Rs(T,K)为所述相关系数,所述Ri(T,K)为系统相关系数,所述Rm为干预系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,而且所述w1、w2和w3均大于等于零,所述w1+w2+w3=1,所述n为干预时间段长度,所述i为当前运行时间,其中0≤i≤n。
本发明中为了可以修正和检测所述页面相关度,本发明通过加入人工干预的参数来调整所述页面相关度的计算,因此所述Rm和n是本领域技术人员可以?#25105;?#35774;置的。而且由于所述i随着运行时间的流逝而不断变大,从而所述人工干预的参数对计算得到的页面相关度的影响越小。而?#20918;?#39046;域技术人员通过改变n可以控制修正和检测的时间,并?#19994;眎=n时,本领域技术人员可以重新进行上述页面相关度的计算或彻底摒弃人工干预,而将系统相关系数直接作为所述相关系数。
较佳地,所述步骤S5之后还包括步骤S6,其中步骤S6中包括:
S61、为所述数据库中每个主题生成包含所述主题在一特定时间段的点击次数和购买次数的一第一主题页面;
S62、分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数;
S63、按所述第一相关系数从高到低的顺序选取与一第一预设数值相等数量的主题作为第一显示主题;
S64、将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。
其中本发明中所述主题是数据库中预先记录的,而且所述主题同样是现有技术中常用的表征一类关键词的索引,所?#28304;?#22788;不再赘述所述主题的功能和构造。而?#20918;?#21457;明中所述特定时间段是用户可以?#25105;?#35774;定的。
较佳地,所述步骤S5之后还包括步骤S7,其中步骤S7中包括:
S71、从所述网页提取用户身份数据;
S72、从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第二主题页面;
S73、分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数;
S74、按所述第二相关系数从高到低的顺序选取与一第二预设数值相等数量的主题作为第二显示主题;
S75、将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。
本发明中通过将当前网页的用户信息数据也作为主题页面的关联的一个影响因素来确定与当前网页关联度高的主题页面,其中所述用户信息数据也是用户在操作网页等活动中,网页代码中所包含的数据信息,所?#28304;?#22788;不再详细阐述所述用户信息数据。
较佳地,所述步骤S5之后还包括步骤S8,其中步骤S8中包括:
S81、从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第三主题页面;
S82、分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数;
S83、按所述第三相关系数从高到低的顺序选取与一第三预设数值相等数量的主题作为第三显示主题;
S84、将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。
本发明还进一步地通过主题页面与网页中主题内容的关联度来确定与当前网页关联度高的主题页面。
上述的第一预设数值、第二预设数值和第三预设数值的数值均是可以?#25105;?#35774;置的。
较佳地,所述步骤S5之后还包括步骤S9,其中步骤S9中包括:
S91、为所述数据库中每个主题生成包含所述主题在一样本时间段的点击次数和购买次数的一第四主题页面;
S92、基于所述第四主题页面的点击次数和购买次数计算所述主题的第四相关系数;
S93、从所述网页提取用户身份数据;
S94、从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第五主题页面;
S95、基于所述第五主题页面的点击次数和购买次数计算所述主题的第五相关系数;
S96、从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第六主题页面;
S97、基于所述第六主题页面的点击次数和购买次数计算所述主题的第六相关系数;
S98、分别基于所述数据库中每个主题的第四相关系数、第五相关系数和第六相关系数计算所述主题的总相关系数;
S98、按所述总相关系数从高到低的顺序选取与一第四预设数值相等数量的主题作为第四显示主题;
S99、将各个包含所述第四显示主题的主题页面组合作为所述网页的显示内容。
本发明中为数据库中存储的所有的主题与主题内容均进行不同相关度的计算,并通过每个主题的各个相关度的综合计算,来判断主题与主题内容之间关联程度的高低。其中没有进行某项相关度计算的主题中该项相关度的相关系数默认为0等不会对总相关度有任何影响的数值。
优选地,所述步骤S98为:
通过下式计算所述主题的总相关系数:
Rz(T)=v1×H(T)+v2×P(T)+v3×A(T,T')
其中所述Rz(T)为总相关系数,所述H(T)为第四相关系数,所述P(T)为第五相关系数,所述A(T,T’)为第六相关系数,所述v1、v2和v3均大于等于零,且所述v1+v2+v3=1。
本发明中利用加权权重的方式来调节所述主题与主题内容之间的关联度的影响。也就是说,通过这种相关度的计算来确定所述主题内容和各个主题页面之间的相关度。
本发明?#22266;?#20379;了一种网页运行系统,其特点是,所述网页运行系统包括一网页服务器和多个客户端,其中所述网页服务器包括一数据库、一页面生成模块、一相关度计算模块和一网页生成模块;
所述网页服务器从所述客户端获取的网页中提取一主题内容,并从所述数据库获取每个与所述主题内容相关联的关键词;
所述页面生成模块为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面;
所述相关度计算模块分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数;
所述网页服务器?#32874;?#20851;系数从高到低的顺序选取与一预设数值相等数 量的关键?#39318;?#20026;显示关键词;
所述网页生成模块将各个包含所述显示关键词的页面组合作为所述网页的显示内容并将所述页面发送?#20102;?#36848;客户端。
为了便于描述,本发明中将所述网页服务器按照功能划分为各种模块进行分别描述,所以在实施本发明时,可以把各模块的功能在同一个或多个软件和/或?#24067;?#20013;实现。
较佳地,所述相关度计算模块通过下式计算每个页面的关键词的相关系数,
Rs(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
其中所述Rs(T,K)为所述相关系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1。
较佳地,所述相关度计算模块通过下式计算每个页面的关键词的相关系数,
Ri(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)]]>
Rs(T,K)=(1-i/n)×Rm+i/n×Ri(T,K)
其中所述Rs(T,K)为所述相关系数,所述Ri(T,K)为系统相关系数,所述Rm为干预系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1,所述n为干预时间段长度,所述i为当前运行时间,其中0≤i≤n。
较佳地,所述网页服务器的页面生成模块还为所述数据库中每个主题生成包含所述主题在一特定时间段的点击次数和购买次数的一第一主题页面;
所述相关度计算模块分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数;
所述网页服务器按所述第一相关系数从高到低的顺序选取与一第一预 设数值相等数量的主题作为第一显示主题;
所述网页生成模块还将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。
较佳地,所述网页服务器还从所述客户端获取的网页提取用户身份数据;
所述页面生成模块还从所述数据库中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第二主题页面;
所述相关度计算模块分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数;
所述网页服务器按所述第二相关系数从高到低的顺序选取与一第二预设数值相等数量的主题作为第二显示主题;
所述网页生成模块还将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。
较佳地,所述网页服务器的页面生成模块还从所述数据库中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第三主题页面;
所述相关度计算模块分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数;
所述网页服务器按所述第三相关系数从高到低的顺序选取与一第三预设数值相等数量的主题作为第三显示主题;
所述网页生成模块还将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。
在符合本领域常识的基础上,上述各优选条件,可?#25105;?#32452;合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明的网页运行方法和系统通过判断包含主题内容的页面内容与主 题内容的相关度来甄选与主题内容最为匹配的页面内容,所以提高了主题内容关联的效率,便于用户获取与主题内容关联的更有价值的信息。
附图说明
图1为本发明的实施例1的网页运行系统的结构示意图。
图2为本发明的实施例1的网页运行方法的流程图。
图3为本发明的实施例2的网页运行方法的流程图。
图4为本发明的实施例3的网页运行方法的流程图。
图5为本发明的实施例4的网页运行方法的流程图。
图6为本发明的实施例5的网页运行方法的流程图。
具体实施方式
本发明通过判断包含主题内容的页面内容与主题内容的相关度来选取与主题内容最为匹配的页面内容,从而在海量的页面内容中快速选取与主题内容匹配的页面内容,便于用户获取更有价值的信息。下面通过实施例的方式进一步说明本发明,但并不因?#31169;?#26412;发明限制在所述的实施例?#27573;?#20043;中。
实施例1
如图1所示,本实施例?#26800;?#32593;页运行系统中包括一网页服务器1和多个客户端2,本实施例中所有的客户?#23435;?#32593;页服务器提供包含主题内容的网页,所?#36816;?#36848;客户端2的数量是可以?#25105;?#30340;。
其中所述网页服务器1包括一数据库11、一页面生成模块12、一相关度计算模块13和一网页生成模块14。
本实施例中所述网页服务器1与各个客户端2之间均建立有通信链路,所?#36816;?#36848;网页服务器1能够分别单独与每个客户端2通信,其中所述通信链路的建立和通信方式均是现有网络通信技术?#26800;?#24120;用手段,所?#28304;?#22788;不再详细赘述。
本实施例所述网页服务器1通过与所述客户端2的通信链路从所述客户 端2获取的网页中提取一主题内容,并从所述数据库11获取每个与所述主题内容相关联的关键词。其中本实施例中所述数据库11包括所有的关键?#23460;?#21450;与所述关键词相关的数据内容,所述数据库11中具体包括的数据内容可以根据技术人员工作的实?#24066;?#35201;进行?#25105;?#35843;整,本实施例中并不限定所述数据11中所包含的具体的数据内容。
所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的一页面。也就是说,本实施例中将在数据库11中查?#19994;?#21040;的所述关键词相关联的数据整合至一个页面,即所述页面中包括涉及所述关键词的相关内容。
所述相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
具体地说,所述相关度计算模块13通过下式1)计算每个页面的关键词的相关系数,
Rs(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)---1)]]>
所述式1)中所述Rs(T,K)为所述相关系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1。
本实施例中可以通过调节所述w1、w2和w3的数值来调节加权权重,进而调节所述搜索次数、点击次数以及购买次数?#36816;?#36848;关键词和所述主题内容之间的关联度的影响。即通过计算式1)来确定所述主题内容和各个页面之间的相关度。
具体地说,本实施例中上述实现方式的伪代码如下:


本实施例中计算相关系数的另一种实现方式如下:
所述相关度计算模块13通过式2)和式3)计算每个页面的关键词的相关系数,
Ri(T,K)=w1×Search(T,K)+w2×Click(T,K)+w3×Sale(T,K)Show(T,K)---2)]]>
Rs(T,K)=(1-i/n)×Rm+i/n×Ri(T,K)     3)
式2)和式3)中所述Rs(T,K)为所述相关系数,所述Ri(T,K)为系统相关系数,所述Rm为干预系数,所述Search(T,K)为所述搜索次数,所述Click(T,K)为所述点击次数,所述Sale(T,K)为所述购买次数,所述Show(T,K)为显示次数,所述w1、w2和w3均大于等于零,且所述w1+w2+w3=1,所述n为干预时间段长度,所述i为当前运行时间,其中0≤i≤n。
在这种计算相关系数的实现方式中,可以修正和检测所述页面相关度,具体地说,就是通过加入人工干预的参数来调整所述页面相关度的计算,因此所述Rm和n是本领域技术人员可以?#25105;?#35774;置的。而且由于所述i随着运行时间的流逝而不断变大,从而所述人工干预的参数对计算得到的页面相关度的影响越小。而?#20918;?#39046;域技术人员通过改变n可以控制修正和检测的时间,并?#19994;眎=n时,本领域技术人员可以重新进行上述页面相关度的计算,或者彻底摒弃人工干预,?#35789;?#29992;本实施例中计算相关系数的第一种实现方式,将系统相关系数直接作为所述相关系数。
具体地说,本实施中所述实现方式的伪代码如下:

所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与一预设数值N相等数量的关键?#39318;?#20026;显示关键词。具体的说,本实施例中所述网页服务器1基于每个页面的相关系数将所述页面降序排列,并按照所述预设数值N的数值大小,从相关系数最大的页面开始,选取与所述预设数值N的数值相等数量的页面。
此后,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容并将所述页面发送?#20102;?#36848;客户端2。此时客户端2也就得到了与主题内容最匹配的页面内容。
所以如图2所示,本实施例的网页运行系统的工作流程如下:
步骤101,从客户端2的网页中提取主题内容。
步骤102、从数据库11获取每个与所述主题内容相关联的关键词。
步骤103,所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的页面。
步骤104,相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
其中所述相关度计算模块13既可以使用式1)的计算方法计算相关系数,也可以使用式2)和式3)的计算方法计算相关系数。
步骤105,所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与所述预 设数值N相等数量的关键?#39318;?#20026;显示关键词。
步骤106,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
实施例2
本实施例在实施例1的基础上,对甄选的页面内进一步计算相关度,从而使得甄选的页面与主题内容更加匹配。
具体的说,本实施例的所述页面生成模块12还为所述数据库11中每个主题生成包含所述主题在一特定时间段T的点击次数和购买次数的一第一主题页面。本实施例中不但使用了所述数据库1包括的所有的关键?#23460;?#21450;与所述关键词相关的数据内容,还使用了所有的主题及其相关的数据内容。
所述特点时间段T的具体时间点和时间长度是可以?#25105;?#35774;置的,例如选定2012-12-2123:00至2012-12-221:00的时间?#25991;?#25152;述主题的点击次数和购买次数。所述数据库11中具体包括的主题相关的数据内容同样是可以根据技术人员工作的实?#24066;?#35201;进行?#25105;?#35843;整,本实施例中同样并不限定所述数据11中所包含的具体的所述数据内容。
所述相关度计算模块13分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数。其中所述第一相关系数可以采用?#25105;?#29616;有的相关系数计算方式,本实施例并不限定所述第一相关系数的具体计算方式。
所述网页服务器1按所述第一相关系数从高到低的顺序选取与一第一预设数值N1相等数量的主题作为第一显示主题。此处所述主题的选取方式与实施例1中相同,所?#28304;?#22788;不再赘述。
所述网页生成模块14还将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。
所以如图3所示,本实施例的网页运行系统的工作流程如下:
步骤201,从客户端2的网页中提取主题内容。
步骤202、从数据库11获取每个与所述主题内容相关联的关键词。
步骤203,所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的页面。
步骤204,所述相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
其中所述相关度计算模块13既可以使用实施例1中式1)的计算方法计算相关系数,也可以使用实施例1中式2)和式3)的计算方法计算相关系数。
步骤205,所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与所述预设数值N相等数量的关键?#39318;?#20026;显示关键词。
步骤206,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
步骤207,所述页面生成模块12为所述数据库11中每个主题生成包含所述主题在所述特定时间段T的点击次数和购买次数的一个所述第一主题页面。
步骤208,所述相关度计算模块13分别基于每个所述第一主题页面的点击次数和购买次数计算所述第一主题页面的主题的第一相关系数。
步骤209,所述网页服务器1按所述第一相关系数从高到低的顺序选取与所述第一预设数值N1相等数量的主题作为第一显示主题。
步骤210,所述网页生成模块14将各个包含所述第一显示主题的主题页面组合作为所述网页的显示内容。
实施例3
本实施例同样在实施例1的基础上,对甄选的页面内进一步计算相关度,从而使得甄选的页面与主题内容更加匹配。
具体的说,所述网页服务器1还从所述客户端2获取的网页中提取用户身份数据。
所述页面生成模块12还从所述数据库11中提取与所述用户身份数据相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次 数的一第二主题页面。本实施例的所述数据库11中所述主题涉及的数据在实施例2中所述数据内容的基础上至少还具有用户身份数据。
所述相关度计算模块13分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数。同样,本实施例中所述第二相关系数可以采用?#25105;?#29616;有的相关系数计算方式,本实施例并不限定所述第二相关系数的具体计算方式。
所述网页服务器1按所述第二相关系数从高到低的顺序选取与一第二预设数值N2相等数量的主题作为第二显示主题。此处所述主题的选取方式与实施例1中相同,所?#28304;?#22788;同样不再赘述。
所述网页生成模块14还将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。
所以如图4所示,本实施例的网页运行系统的工作流程如下:
步骤301,从客户端2的网页中提取主题内容。
步骤302、从数据库11获取每个与所述主题内容相关联的关键词。
步骤303,所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的页面。
步骤304,所述相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
其中所述相关度计算模块13既可以使用实施例1中式1)的计算方法计算相关系数,也可以使用实施例1中式2)和式3)的计算方法计算相关系数。
步骤305,所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与所述预设数值N相等数量的关键?#39318;?#20026;显示关键词。
步骤306,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
步骤307,所述网页服务器1从所述网页提取用户身份数据。
步骤308,所述网页服务器1从所述数据库11中提取与所述用户身份数 据相关联的每个主题。
步骤309,所述页面生成模块12分别为每个主题生成包含所述主题的点击次数和购买次数的一个所述第二主题页面。
步骤310,所述相关度计算模块13分别基于每个所述第二主题页面的点击次数和购买次数计算所述第二主题页面的主题的第二相关系数。
步骤311,所述页面服务器1按所述第二相关系数从高到低的顺序选取与所述第二预设数值N2相等数量的主题作为第二显示主题。
步骤312,所述网页服务器1将各个包含所述第二显示主题的主题页面组合作为所述网页的显示内容。
实施例4
本实施例同样在实施例1的基础上,对甄选的页面内进一步计算相关度,从而使得甄选的页面与主题内容更加匹配。
具体的说,所述网页服务器1的页面生成模块12还从所述数据库11中提取与所述主题内容相关联的每个主题,并分别为每个主题生成包含所述主题的点击次数和购买次数的一第三主题页面;
所述相关度计算模块13分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数。同样,本实施例中所述第三相关系数可以采用?#25105;?#29616;有的相关系数计算方式,本实施例并不限定所述第三相关系数的具体计算方式。
所述网页服务器1按所述第三相关系数从高到低的顺序选取与一第三预设数值N3相等数量的主题作为第三显示主题。此处所述主题的选取方式与实施例1中相同,所?#28304;?#22788;同样不再赘述。
所述网页生成模块14还将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。
所以如图5所示,本实施例的网页运行系统的工作流程如下:
步骤401,从客户端2的网页中提取主题内容。
步骤402、从数据库11获取每个与所述主题内容相关联的关键词。
步骤403,所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的页面。
步骤404,所述相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
其中所述相关度计算模块13既可以使用实施例1中式1)的计算方法计算相关系数,也可以使用实施例1中式2)和式3)的计算方法计算相关系数。
步骤405,所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与所述预设数值N相等数量的关键?#39318;?#20026;显示关键词。
步骤406,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
步骤407,所述网页服务器1从所述数据库11中提取与所述主题内容相关联的每个主题。
步骤408,所述页面生成模块12分别为每个主题生成包含所述主题的点击次数和购买次数的一个所述第三主题页面。
步骤409,所述相关度计算模块13分别基于每个所述第三主题页面的点击次数和购买次数计算所述第三主题页面的主题的第三相关系数。
步骤410,所述网页服务器1按所述第三相关系数从高到低的顺序选取与所述第三预设数值N3相等数量的主题作为第三显示主题。
步骤411,所述网页生成模块14将各个包含所述第三显示主题的主题页面组合作为所述网页的显示内容。
实施例5
本实施例整合了所述实施例2-4,对甄选的页面内进一步优化计算相关度,从而使得甄选的页面与主题内容更加匹配。
具体的说,本实施例中所述网页运行系统中各个部件和模块的功能与实施例2-4中相同,所?#28304;?#22788;不再详细赘述。其中所述第四相关系数为实施例2的第一相关系数;所述第五相关系数为实施例3的第二相关系数;所述第 六相关系数为实施例4的第三相关系数。所述第四主题页面相当于实施例2?#26800;?#19968;主题页面;所述第五主题页面相当于实施例3?#26800;?#20108;主题页面;所述第六主题页面相当于实施例4?#26800;?#19977;主题页面。?#36865;猓?#27491;是由于本实施例包含了上述实施例?#26800;?#21151;能,所以本实施例中其余参数与上述实施例中涉及的各个参数相互对应。
?#36865;猓?#26412;实施例中相关度计算模块13还所述进一步通过上述相关系数和式4)计算所述主题的总相关系数:
Rz(T)=v1×H(T)+v2×P(T)+v3×A(T,T')     4)
其中所述Rz(T)为总相关系数,所述H(T)为第四相关系数,所述P(T)为第五相关系数,所述A(T,T’)为第六相关系数,所述v1、v2和v3均大于等于零,且所述v1+v2+v3=1。
具体地说,本实施例中所述总相关系数的实现方式的伪代码如下:


所以如图6所示,本实施例的网页运行系统的工作流程如下:
步骤501,从客户端2的网页中提取主题内容。
步骤502、从数据库11获取每个与所述主题内容相关联的关键词。
步骤503,所述页面生成模块12为每个关键词生成包含所述关键词的点击次数、购买次数、搜索次数和显示次数的页面。
步骤504,所述相关度计算模块13分别基于每个页面中关键词的点击次数、购买次数、搜索次数和显示次数计算所述页面的关键词的相关系数。
其中所述相关度计算模块13既可以使用实施例1中式1)的计算方法计算相关系数,也可以使用实施例1中式2)和式3)的计算方法计算相关系数。
步骤505,所述网页服务器1?#32874;?#20851;系数从高到低的顺序选取与所述预设数值N相等数量的关键?#39318;?#20026;显示关键词。
步骤506,所述网页生成模块14将各个包含所述显示关键词的页面组合作为所述网页的显示内容。
步骤507,所述页面生成模块12为所述数据库11中每个主题生成包含所述主题在一样本时间段T1的点击次数和购买次数的一个所述第四主题页面。
步骤508,所述相关度计算模块13基于所述第四主题页面的点击次数和购买次数计算所述主题的第四相关系数。
步骤509,所述网页服务器1从所述网页提取用户身份数据。
步骤510,所述网页服务器1从所述数据库中提取与所述用户身份数据相关联的每个主题。
步骤511,所述页面生成模块12分别为每个主题生成包含所述主题的点击次数和购买次数的一个所述第五主题页面。
步骤512,所述相关度计算模块13基于所述第五主题页面的点击次数和购买次数计算所述主题的第五相关系数。
步骤513,所述网页服务器1从所述数据库中提取与所述主题内容相关联的每个主题。
步骤514,所述相关度计算模块13分别为每个主题生成包含所述主题的点击次数和购买次数的一个所述第六主题页面。
步骤515,所述相关度计算模块13基于所述第六主题页面的点击次数和购买次数计算所述主题的第六相关系数。
步骤516,所述相关度计算模块13还分别基于所述数据库中每个主题的第四相关系数、第五相关系数和第六相关系数计算所述主题的总相关系数。
步骤517,所述网页服务器1按所述总相关系数从高到低的顺序选取与一第四预设数值N4相等数量的主题作为第四显示主题。
步骤518,所述网页生成模块14将各个包含所述第四显示主题的主题页面组合作为所述网页的显示内容。
通过以?#31995;?#20855;体实施方式的描述可知,本领域的技术人员可以清楚地?#31169;?#21040;本申请可借助软件加必需的通用?#24067;?#24179;台的方式?#35789;?#29616;。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可?#28304;?#20648;在存储介质中,如ROM/RAM(只读存储器/随机存取存储器)、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等) 执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书?#26800;?#21508;个实施例均采用递进的方式描述,各个实施例之间相同相似的部?#21482;?#30456;参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶?#23567;?#21487;编程的消费电子设备、网络PC(个人电脑)、小型计机、大型计算机、包括以上任何系统或设备的分布式计算环境等?#21462;?
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等?#21462;?#20063;可以在分布式计算环?#25345;?#23454;践本申请,在这些分布式计算环?#25345;校?#30001;通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环?#25345;校?#31243;序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护?#27573;?#26159;由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修?#27169;?#20294;这些变更和修改均落入本发明的保护?#27573;А?/p>

关于本文
本文标题:网页运行方法和系统.pdf
链接地址:http://www.pqiex.tw/p-6115749.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 比分波胆窍门 幸运飞艇如何看六码走势 单机金蟾捕鱼 爱彩票软件下载 渲染指尖魔盒怎么赚钱 千米红包怎么快速赚钱 赛车pk10走势图官方 北京快乐8开奖直播 澳贝娱乐 登陆 dnf90要不要做镇魂赚钱