平码五不中公式规律
  • / 32
  • 下载费用:30 金币  

通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构.pdf

关 键 ?#21097;?/dt>
通过 混合 基于 统计 用户 测量方法 测量 屏幕 互联网 概况 交易 行为 群体 结构
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201480078454.9

申请日:

2014.02.26

公开号:

CN106663258A

公开日:

2017.05.10

当前法律状态:

实审

?#34892;?#24615;:

审中

法?#19978;?#24773;: 实质审查的生效IPC(主分类):G06Q 30/02申请日:20140226|||公开
IPC分类号: G06Q30/02; G06F11/34; H04L29/08 主分类号: G06Q30/02
申请人: 威图数据研究公司
发明人: ?#21495;?#38886;尔卡萨罗; 克里斯·莫泽莱夫斯基; 埃里克·马尔米
地址: 芬兰埃斯波
优?#28909;ǎ?/td>
专利代理机构: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 李丙林;曹桓
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201480078454.9

授权公告号:

|||

法律状态公告日:

2017.06.06|||2017.05.10

法律状态类型:

实质审查的生效|||公开

摘要

用于获取和分析数据的系统(100、108、110),诸如若干个服务器(108),所述数据关于与可连接互联网的用户设备相关的在线用户行为和其他活动,所述用户设备可选地为移动设备,该系统被配置成从多个数据源采集(404、408)数据,其中采集的所述数据至少包括从用户设备(104、104a、104b、105、217、402)获取的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据(107a、211),其中所述用户级数据是优选地使用具有受控的构成的至少一个用户研究小组(216)采集的,进一?#25509;?#36873;地从所述用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、媒体、应用程序和/或设备使用;利用本体的元数据方?#38468;?#33719;得的用户级数据和统计级数据组织(406)到分类数据集中,所述数据集优选是多义的;基于所述用户级数据和统计级数据的结合确定电子交付物(112、206、416),其中统计级数据被用于校准用户级数据;在关于使用的设备或在线行为的若干?#34892;?#36259;因素方面,所述交付物具有动态地可选择的、优选地用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。

权利要求书

1.用于获得和分析数据的系统(100、108、110),所述数据关于与可连接互联网的用户
设备有关的在线用户(102)行为和其他活动,所述用户设备可选地为移动设备,所述系统被
配置成:
从多个数据源采集(404、408)数据,其中,采集的所述数据至少包括从用户设备(104、
104a、104b、105、217、402)获取的个人用户级数据和表明整个用户群体、活动设备或测量的
服务上的行为和人口统计特征的统计级数据(107a、211),其中所述用户级数据是优选地使
用具有受控的构成的至少一个用户研究小组(216)采集的,进一?#25509;?#36873;地是从用户小组中
的每个参与者的多个设备(104、104a、104b)采集的,采集的所述数据表明互联网(107)、内
容、媒体、应用程序和/或设备使用,
利用本体的元数据方案(214、414)将获得的用户级数据和统计级数据组织(406)到分
类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据和所述统计级数据的结合确定电子交付物(112、206、416),其中
统计级数据被用于校准用户级数据,
就关于使用的设备或在线行为的若干?#34892;?#36259;因素而言,所述交付物具有动态可选择的
范围,所述范围优选为用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程序使用、应用
程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备
使用和/或时间因素。
2.根据权利要求1所述的系统,其中,采集的所述数据进一步包括从样?#38236;?#21040;的统计分
层数据(208),所述统计分层数据估计用户群体上的人口统计特征的分布,所述系统被配置
成还将所述分层数据组织到所述数据集中,并且在确定交付物时利用所述分层数据,所述
确定交付物包括校准所述用户级数据。
3.根据权利要求1所述的系统,被配置成从具有受控的构成且具有第一数目的参与者
的第一用户研究小组(216)和具有?#26723;?#30340;注册要求且具有更多数目的参与者的第二用户研
究小组(218)采集(217)用户级数据。
4.根据权利要求3所述的系统,被配置成使用统计级数据——可选地为从样?#38236;?#21040;的
分层数据——以及借助于所述第一用户研究小组获得的用户级数据校准通过所述第二用
户研究小组获得的用户级数据。
5.根据权利要求1所述的系统,其中,所述本体的元数据方案包括统一的元数据数据
库,所述元数据数据库描述相互关系并且提供匹配概念和对象,即使所述元数据数据库在
提供采集的所述数据但?#20174;?#30456;同主题的不同平台和数据源中被不同地测量和?#20174;场?br />
6.根据?#25105;?#21069;述权利要求所述的系统,其中,所述元数据方案包括用于分类和组织数
据的多个规范方案,其中可选地存在若干单义方案和多义方案,进一步可选地所述规范方
案中的一个或多个用于生成由交付物接?#29031;?#21160;态地选择的交付物。
7.根据?#25105;?#21069;述权利要求所述的系统,被配置成利用所述元数据方案以通过数据分类
将较大粒度的用户级数据与较小粒度的统计级数据配准。
8.根据?#25105;?#21069;述权利要求所述的系统,被配置成利用安装在所述用户设备——可选地
为无线终端设备——处的测量和记?#21152;?#29992;程序(217)来采集用户级数据。
9.根据?#25105;?#21069;述权利要求所述的系统,被配置成利用与旨在用于其他用途的软件集成
的测量和记录逻辑(217)来采集用户级数据,所述逻辑与所述软件捆绑。
10.根据?#25105;?#21069;述权利要求所述的系统,被配置成采集表明经由设备的传感器——可
选地为摄像机——或传声器获得的、用户设备外部的行为或情景事件的用户级数据。
11.根据?#25105;?#21069;述权利要求所述的系统,其中,用于使能用户级数据采集的在用户设备
(104、104a、104b、217、402)处的测量和记录逻辑包括选自由以下组成的组中的至少一个特
征:表明设备或用户活动周期的心跳数据采集器和/或相对于互联网的连接性周期、用户认
证、用户识别、用户身份记录、事件数据记录、事件元数据或情景数据记录、时间戳记录、地
理位置记录、WiFi状态记录、在线状态记录、载体记录、漫游状态记录、定位模式记录、下载
数据记录、上传数据记录、设?#24178;?#30340;数据和外?#21487;?#22791;提供的数据的匹配和记录。
12.根据权利要求1所述的系统,被配置成通过具有多个用户设备的用户的一个或多个
主设备(104)采集所述用户级数据,其中,存在功能性连接到所述主设备中的一个或多个的
若干其他用户设备(104a、104b),通过相应的主设备测量所述其他用户设备的使用,所述主
设备充当朝向所述系统的数据采集和连接节点。
13.根据权利要求12所述的系统,其中,主设备被配置成执行选自由以下组成的组中的
至少一个动作:跟踪和记录在附接设备和主设备之间发生的数据通讯、信号或其他事件;被
动地或主动地轮询一个或多个功能性附接设备的应用程序编程接口(API)以采集测量数
据;暂时地或在预定的?#20013;?#26102;间内存储采集的测量数据;以及将数据发送到一个或多个基
于网络的数据采集服务器以用于分析。
14.根据?#25105;?#21069;述权利要求所述的系统,被配置成从或经由若干互联网网络?#34892;?#25968;据
源(107a、602、604)获得统计级数据,所述互联网网络?#34892;?#25968;据源包括选自由以下组成的组
中的至少一个元素?#21644;?#32476;载体、广告网络、广告交换、网站或应用程序分析平台、网络网关、
网络代理、内容管理平台、应用程序(APP)商店以及其他内容交付或分发平台。
15.根据权利要求1所述的系统,被配置成从互联网网络?#34892;?#25968;据源获得表明对象特征
的分布和/或规模的统计级数据。
16.根据权利要求15所述的系统,其中,所述统计级数据包括数据点,所述数据点表明
一个或多个限定的用户群体、设备、应用程序、服务或网站在每个预定时间期间的行为,可
选地为每天的行为。
17.根据?#25105;?#21069;述权利要求所述的系统,被配置成从至少一个内容分发平台(602、604)
获得关于若干应用程序的统计级数据,所述内容分发平台可选地包括应用程序商店或数字
市场。
18.根据?#25105;?#21069;述权利要求所述的系统,被配置成利用爬行器或机器人逻辑实体连接
到至少一个应用程序商店(602、604)或其他远程内容分发平台,所述爬行器或机器人逻辑
实体被配置成为了获得所述统计级数据,执行选自由以下组成的组中的至少一个动作:仿
真与平台关联的用户或用户设备;应用平台相关的API(应用程序编程接口);连接到系统与
平台之间的代理(606);以及应用VPN隧?#20848;?#26415;。
19.根据权利要求17或18所述的系统,被配置成估计(700)应用程序的下载数量,所述
估计基于应用程序的排名位置和应用所述排名位置以提供所述估计的模型进行。
20.根据权利要求19所述的系统,被配置成利用选自由以下组成的组中的至少一个模
型:指数模型、对数正态模型、具有指数截断的基于幂律的模型以及洛马克斯模型。
21.根据权利要求19或20所述的系统,其中,基于排名位置信息——优选地为每日排名
位置信息——估计每日下载数量。
22.根据权利要求17至21中?#25105;?#39033;所述的系统,被配置成使用从所述至少一个内容分
发平台获得的所述统计级数据来对基于用户级数据得到的行为估计进行质量控制和/或校
准所述用户级数据。
23.根据?#25105;?#21069;述权利要求所述的系统,被配置成基于所述统计级数据确定若干人口
统计和行为校准因素用于所述用户级数据以进行校准。
24.根据?#25105;?#21069;述权利要求所述的系统,包括若干功能性连接的服务器(108)。
25.根据权利要求24所述的系统,进一步包括多个用户设备(104、104a、104b)并可选地
包括若干提供统计级数据的网络?#34892;?#25552;供数据源。
26.根据?#25105;?#21069;述权利要求所述的系统,被配置成基于统计数据估计用户设备的用户
基础以及可选地估计该用户基础的改变速?#21097;?#25152;述统计数据优选地包括互联网网络?#34892;?#25968;
据。
27.一种用于获取和分析数据的方法(1100),所述数据关于与可连接互联网的用户设
备有关的在线用户行为和其他活动,所述用户设备可选地为移动设备,所述方法包括:
从多个数据源采集(1106、1108)数据,其中,采集的所述数据至少包括从用户设备获取
的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征
的统计级数据,可选地还包括从样?#38236;?#21040;的统计分层数据,所述统计分层数据估计用户群
体上的人口统计特征的分布,其中所述用户级数据是优选地使用具有受控的构成的至少一
个用户小组采集的,进一?#25509;?#36873;地是从所述用户小组中的每个参与者的多个设备采集的,
采集的所述数据表明互联网、内容、媒体、应用程序和/或设备使用,
利用本体的元数据方?#38468;?#33719;得的用户级数据、统计级数据以及可选的从样?#38236;?#21040;的分
层数据组织(1110)到分类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据、统计级数据以及可选的从样?#38236;?#21040;的分层数据的结合确定电子
交付物,其中统计级数据和可选的从样?#38236;?#21040;的分层数据被用于校准用户级数据,
其中,就关于使用的设备或在线行为的若干?#34892;?#36259;因素而言,所述交付物(1112)具有
动态地可选择的范围,所述范围优选为用户可选择的范围,所述?#34892;?#36259;因素优选地包括应
用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分
布、设备特征、设备使用和/或时间因素。
28.一种计算机程序,所述计算机程序包括代码装置,当在计算机上运行时,所述代码
装置适于获得和分析关于与可连接互联网的用户设备相关的在线用户行为和其他活动的
数据,所述用户设备可选地为移动设备,包括
从多个数据源采集数据,其中,采集的所述数据至少包括从用户设备获取的个人用户
级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数
据,并且可选地还包括从样?#38236;?#21040;的统计分层数据,所述统计分层数据估计用户群体上的
人口统计特征的分布,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户
小组采集的,进一?#25509;?#36873;地是从所述用户小组中的每个参与者的多个设备采集的,采集的
所述数据表明互联网、内容、媒体、应用程序和/或设备使用,
利用本体的元数据方?#38468;?#33719;得的用户级数据、统计级数据以及可选的从样?#38236;?#21040;的分
层数据组织到分类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据、统计级数据以及可选的从样?#38236;?#21040;的分层数据的结合确定电子
交付物,其中统计级数据和可选的从样?#38236;?#21040;的分层数据被用于校准用户级数据,
其中,就关于使用的设备或在线行为的若干个?#34892;?#36259;因素而言,所述交付物具有动态
地可选择的范围,所述范围优选是用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程
序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设
备特征、设备使用和/或时间因素。
29.一种包括根据权利要求28所述的计算机程序的载体介质。

说明书

通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构

技术领域

本发明总体上涉及数字设备、包括有线或移动通信的通信以及相关应用程序和服
务。具体地,但不完全地,本发明涉及采集(collection)多点互联网?#24067;?#21644;使用数据、将该
数据融合到一起并?#31227;?#32321;地发布围绕与数字设备有关的市场级和用户级行为的有代表性
的度量以及有关的市场结构信息。

背景技术

各种现代的媒体测量和分析解决方案集中在仅基于一个源收集数据。一般地,源
是所谓的小组研究,其中通过专用设备或可下载的软件计量器(meter)来计量用户行为,或
者通过采集关于特定的应用程序的数据的?#24230;?#24335;标签(在(网络)?#38236;?#25110;应用程序(应用))
或SDK(应用程序)来计量用户行为。替代地,可以通过传统的用户调查研究或访谈来获取所
需的数据,这会遇?#20132;?#31572;者主观性和不准确性的问题。

在前述研究中,明显的目标是掌握用户的潜在趋势、习惯、问题和需求。然而,现有
方法的每个都具有其本身潜在的问题。例如,极少例外地,?#24515;肌?#32500;持和使合法化一个在行
为上且人口统计方面有代表性的小组的花费是过高的。SDK(软件开发工具包)和标签仅提
供关于参与属性但不是所有的参与属性的数据。调查和访谈比实际行为更好地表明品牌实
力,并且,目前没有能够提供关于互联网生态系统的所有关键领域在如下“?#24067;?#30340;”、对象
的、观察驱动的数据方面的概念性信息的方法,所述数据诸如:?#24067;?#23433;装的基础和销售、内
容和应用程序分布以及如由用户完成的使用/交易。

当今媒体和互联网服务(诸如网站或网络可访问的服务)的发展比以往任何时候
都快,并且新的设备不断出现在市场中。而且,通常一个用户具有多个(不只一个)能够连接
互联网的设备。不仅需要对使用的整体理解,而且需要对设备和内容分布的整体理解,以向
参与互联网生态系统的关键客户解释市场动态并提供一体化的研究产品。

如一个实例,某个类型设备的普及影响着某个服务的分布,这或者是因为该服务
被预?#24230;?#21040;设备中,或者是因为应用程序商店(或其他内容分布机制)推动用该特定设备下
载该服务。如另一个实例,?#31169;?#22810;少人从应用程序商店下载某些应用程序是?#36824;?#30340;,而越来
越重要的是?#31169;?#20174;下载到实际使用的转换,并且进一步到用户在使用服务中花钱的转换。
进一步地,由于更好的感知功能、用户体验或通过社交圈,在某个设?#24178;?#21487;获得的服务的普
及性和多样性可以影响着该设备的销售。因此在这个系统中有显著的反馈回路。

另一个普遍的趋势是,人们不仅有多个设备,而且他们还使用由所谓的主设备完
全或部分支持着工作的多个用户界面、可穿戴技术产品或附接设备。真实的实例包括智能
手表或数字眼镜类型的设备,所述设备进一步附接至智能?#21482;?#35774;备。通过这些附接的设备
和可穿戴设备的活动测量当然未来也具有关键重要性。

由此,需要更好地适应现代媒体环境的能够进行观察性互联网测量的可扩展的媒
体测量解决方案,在现代媒体环境中,设备、应用程序和服务的复?#26377;?#21644;碎片化已变得普
遍。因此,这样的媒体测量解决方?#38468;?#25552;供动态的、高分辨率的方法,用于全面的互联网计
量和分析,将围绕?#24067;?#23433;装的基础、内容分布以及用户行为的度量整合到单个框架中,以及
利用一流的方法来捕获在线生态系统的每个方面。结果产生了能够提供远超过系统的各部
分的总和?#20197;?#36229;过先前孤立的解决方案的一种整合的?#24050;?#36895;响应的系统。

发明内容

因此,根据本发明的一个方面,一种用于获取和分析数据的至少基本?#31995;?#23376;的系
统,所述数据关于与可连接互联网的用户设备有关的在线用户行为和其他活动,所述用户
设备可选地为移动设备,所述系统被配置成:

从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用
户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计
级数据,其中所述用户级数据是优选地使用具有受控的构成(constitution)的至少一个用
户研究小组采集的,进一?#25509;?#36873;地是从用户小组中的每个参与者的多个设备采集的,所述
采集的数据表明互联网、内容、媒体、应用程序和/或设备使用;

利用本体(ontological)元数据方?#38468;?#33719;取的用户级数据和统计级数据组织到分
类数据集中,所述分类数据集优选是多义的(multivalent);

基于用户级数据和统计级数据的结合确定电子交付物(deliverable),其中统计
级数据用于校准用户级数据;

在关于使用的设备或在线行为的若干?#34892;?#36259;因素方面,交付物具有动态可选择的
范围,所述范围优选是用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程序使用、应用
程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备
使用和/或时间因素。

可选地,该系统可以进一步包括采集从样?#38236;?#21040;的统计分层(stratification)数
据,该统计分层数据估计用户群体上的特征的分布,其中该系统被配置成还将分层数据组
织到数据集中并且利用该数据确定交付物,包括校准用户级数据。

在一个实施方案中,从第二、潜在更大的用户小组采集用户级数据。但是,优选地,
两个小组自然地均包括多个用户。优选地,小组没有重叠(没有共享的用户)。相比于第一小
组,可以减少对第二用户小组构成的控制。第二小组可以对至少非常大数量(如果不是几乎
所有)的参与者开放,所述参与者可能需要简单地满足若干基本要求例如法律上成年。

在另一个补充的或替代的实施方案中,利用用户设备的数据采集包括将相关的测
量软件?#24230;?#21040;功能性分离的其他软件片段中,其他软件优选地包括被主要设计用于不同的
目的,而不是数据测量/记录和/或在例如娱乐、通信或消息发送相关的功能、数据处理工具
等方面提供不同的、有区别的用户益处。在对于用户的单个电子软件交付物中,可以包括测
量软件组件作为额外的模块。

在再一个补充的或替代的实施方案中,通过用户的一个或多个主设备采集用户级
数据,可以有一个或多个其他附接设备,诸如外部UI(用户界面)设备(智能眼镜等),至少功
能性地连接至所述主设备,通过利用主设备作为到网络数据采集服务器的连接点,并且在
记录附接设备的活动中直接地(例如,通过附接设备的直接的API呼叫来观察附接设备的状
态和活动)或间接地(例如,通过用作所谓的网关设备的设备来观察附接设备与互联网络之
间的通讯跟踪)利用主设备来测量所述附接设备的使用。

可选地,在多设备测量的情况下,至少一个附接设备连接至的主设备被配置成执
行选自由以下组成的组的至少一个动作:

a.跟踪在附接设备与主设备之间发生的通讯、信号、或其他事件;

b.被动地或主动地轮询附接设备的应用程序编程接口,以采集测量数据;

c.暂时地或在预定的?#20013;?#26102;间内将采集的测量数据存储到主设备中;以及

d.将数据发送到基于网络的数据采集服务器以用于分析目的。

在再一个补充的或替代的实施方案中,采集的统计级数据包括描述整个目标群体
或目标群体的完整的严格限定的子集中的特征分布的数据,诸如若干数据点,所述数据是
从若干以互联网网络?#34892;?#25968;据源获得的,并且潜在地包括但不限于载体数据、广告网络数
据、广告交换数据、网站/应用程序分析平台提供的数据、网络网关或代理数据和/或基于需
求供应或其他内容交付物平台的数据。

应用大体上以与在此提供的描述一致的方式处理且建模的基于互联网(网络)的
数据的集合,可以构成例如在给定市场中目标用户(互联网)设备的静态当前用户基础的估
计。可以动态地建模不同的特征,诸如这样的群体的增长率或下降率。换句话说,潜在地甚
至作为省略在此大体上阐明且优选的用户数据校准方面的单独的解决方案,可以利用统计
级数据诸如网络(?#34892;?#30340;)数据以估计互联网设备的结构和例如安装基础的增长。

此外,在再一个补充的或者替代的实施方案中,采集的统计级数据包括描述目标
群体的集合行为的数据,诸如多个数据点,该数据可以从例如若干内容分发平台获得,诸如
从用户通过数字(用户)设备和例如互联网能够访问的公共应用程序商店或数?#36136;?#22330;获得。

可选地,在利用统计级数据的情况下,其中获得的统计级数据的数据是不完整的,
可以使用适应于可应用的最佳理论和方法实践的若干统计上?#34892;?#30340;建模方法(诸如归属、
校准和融合)来补充或调整不完整的数据。

在再一个补充的或者替代的实施方案中,通过叠加元数据平台来结合用户级数据
源和统计级数据源,该叠加元数据平台将在校准和处理之前和之后在不同数据源中观察的
概念、主题与实体之间的相互关系建模。

在再一个补充的或者替代的实施方案中,若干个用户设备被配置成提供与设备外
部的行为或情景事件有关的数据,例如自动捕获的摄像机照片或音频记录的环?#25104;?#38899;或图
像识别交付物,由测量软件将该数据与其他采集的测量数据一起发送到系统的外部数据采
集服务器以用于分析目的。

在另一个方面,一种用于获取和分析数据的方法,所述数据关于与可连接互联网
的用户设备有关的在线用户行为和其他活动,所述用户设备可选地为移动设备,该方法包
括:

从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用
户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计
级数据,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组,进一步
优选地从用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、
媒体、应用程序和/或设备的使用;

利用本体元数据方?#38468;?#33719;取的用户级数据和统计级数据组织到多义的分类数据
集中;以及

基于用户级数据和统计级数据的结合确定电子交付物,其中统计级数据用于校准
用户级数据;

其中,在关于用户设备或在线行为的若干?#34892;?#36259;因素方面,交付物具有动态可选
择的范围,所述范围优选地是用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程序使
用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特
征、设备使用和/或时间因素。

在再一个方面,包含在非临时性计算机可读介质上的计算机程序产品,包括用于
获取和分析数据的代码,所述数据关于与可连接互联网的用户设备(可选地为移动设备)有
关的在线用户行为和其他活动,所述获取和分析数据包括:

从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用
户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计
级数据,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组采集的,
进一?#25509;?#36873;地从用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联
网、内容、媒体、应用程序和/或设备的使用;

利用本体元数据方?#38468;?#33719;取的用户级数据和统计级数据组织?#25509;?#36873;的多义的分
类数据集中;以及

基于用户级数据和统计级数据的结合确定电子交付物,其中统计级数据用于校准
用户级数据;

其中,就关于用户设备或在线行为的若干?#34892;?#36259;因素而言,交付物具有动态可选
择的范围,所述范围优选是用户可选择的范围,所述?#34892;?#36259;因素优选地包括应用程序使用、
应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、
设备使用和/或时间因素。

根据所?#33268;?#30340;具体实施方案,本发明的效用体现在多种方面。本发明提供了一种
用于将某些类型的以用户为?#34892;?#30340;数据和以网络为?#34892;?#30340;数据组合到一起的可行的解决
方案,其中,通过整合的方法可以便利地获得所需的电子报告和其他信息交付物,在交付物
中可用信息的代表性和范围优于单独使用不同数据源能够获得的可用信息的代表性和范
围,并且在?#24067;?#21644;用户行为方面的度量的可用性比先前看到的更广泛。本发明的效用还在
于?#30340;?#20154;士可以询问这样的数据的方式以通知他们的战术和战略决策,包括围绕产品营
销、营销活动设计、产品特征或定价的决策、或者与数字生态系统中的个人参与者相关的投
资决策。

进一步地,本发明的不同实施方案使得能够构造交付物以在数?#36136;?#22330;中识别市场
趋势、获得有竞争力的见解并且?#31169;?#26032;出现的机会。所述发明提供了多屏幕框架以及时地
?#31169;?#25968;?#36136;?#22330;的各种特征、?#34892;?#22320;确定能够在当今的多屏幕世界(包括移动设备)中获得统
计级数据的系统、并且将该系统与从这样的设备采集交易、行为和情景数据、通过结合的元
数据框架处理产生的数据、并且通过统一的受众测量投影运算提供聚集市场度量的创新方
法关联。

此外,本发明的各种实施方案?#35748;?#26377;技术产生了在经济上和技术上更可扩展的解
决方案,并且相信该解决方案提供了关于更广泛的典型数?#36136;?#22330;的更广泛的度量阵列的更
精确的估计。由于其设计且?#35272;?#20110;使用多样的用户级数据、多样的统计级数据和多样的从
样?#38236;?#21040;的分层数据的多数据源,所述实施方案通常能够更好地适应在数?#36136;?#22330;中的变
化,尤其是在围绕数字内容开发、分布和使用以及设备制造、分布和使用的盛行的市场趋势
中那些可观察的变化。

表述“若干(a number of)”在此指代从一(1)开始的任何正整数,例如一、二或三。

表述“多个(a plurality of)”在此指代从二(2)开始的任何正整数,例如二、三或
四。

根据在数据传输动作相关的分析下特定实体的角色(即发送者的角色、接?#29031;?#30340;
角色或二者),表述“数据传输”可以指代发送数据、接收数据或二者。

术语“一个(a)”和“一个(an)”不表示数量的限制,而表示存在至少一个所引用的
项目。

术语“第一”和“第二”不表示任何顺序、数量或重要性,而是用于将一个元件与另
一个元件区分。

术语“统计(census)”在此指代?#20174;?#32473;定的且精确限定的测量对象(例如用户、服
务、设备等)的组的优选地全部成员的行为、特征或性能的系统或数据集。该数据明确地基
于限定的和测量的群体的全部对象/成员,不过该限定的和测量的群体可以本身自然地是
更大群体的子集。

术语“校准(calibration)”在此指代统计建模过程,通过该统计建模过程数据被
加权以调整例如无?#20174;?#20197;及其他偏见的样本以更好地?#20174;?#29992;户群体、服务或设备的测量。
该统计建模过程可能涉及在文献中良好地确立的各种统计技术,包括但不限于样本平衡、
特征属性、特征投影以及数据结合。

术语设备的“安装基础(installed base)”指的是沟通和?#20174;?#20363;如在给定市场中
在某个目标群体中分布或使用的互联网设备(优选地包括主设备和附接设备)的数目、结构
和/或交叉所有权的信息和度量。

术语“数据集(data set)”在此指的是例如借助于本体方案的彼此相关联的数据
元素的集合。所述数据元素可以被物理地放置为分布在若干设备和/或数据结构(诸如数据
库或数据表)中。

在从属权利要求中公开了本发明的不同实施方案。根据以下详?#35813;?#36848;,本领域技
术人员将明了本发明的各种其他的实施方案和进一步的益处。

附图说明

参考所附附图更详细地说明本发明的各种方面和实施方案,附图中:

图1从?#24067;?#30340;角度例示了根据本发明的系统的一个实施方案。

图2例示了相比于图1具有更多概念的和功能的方法的系统的实施方案。

图3例示了包括若干主设备和附接用户设备的多设备使用的一个实施方案。

图4用功能/逻辑和?#24067;?#35270;图提供了对根据本发明的系统的一个实施方案的内部
的更详细观察。

图5例示了可以由本发明的不同实施方案测量的不同的、潜在地以及可能地重叠
的群体。

图6例示了能够和本发明结合地利用的网站、或特别是应用程序商店、爬行
(crawling)技术的一个实施方案。

图7描述了关于基于以例如应用程序排名的形式的可用信息对下载统计数据(例
如应用程序下载的数目)估计的一个实施方案的不同方面。

图8例示了用户设备计量和相关记录文件管理的一个实施方案。

图9例示了用于与本发明结合地使用的情景分类/归类和相关关联的一个可行的
应用。

图10例示了为了校准变量和类别选择(缩减)的目的的样本审核程序的一个实施
方案,用以使得能够控制用户级数据的数值确定和校准。

图11是根据本发明的一种方法的高级流程图。

具体实施方式

现代社会,设备碎片化是改变个人社交、沟通、消费媒体以及执行个人和专业任务
的方式的因素之一。近来消费者与数?#32622;?#20307;以及资源的交互已经变为移动的:他们使用智
能?#21482;?#24179;板电脑、笔记?#38236;?#33041;、台?#20132;?#31561;来执行这样的任务,并且许多人甚至在日常基础
上(每天)利用多个设备用于这些目的。

此处描述的框架可以体现为用于或者至少能够用于测量关于或者围绕在各种数
字设?#24178;?#34920;示的消费者行为的大量特征的系统。

可以确定的特征包括但不限于消费者、或大体上用户、各种设备的使用、这样的设
备的安装基础、用户动作,即用户用他们的设备做什么,由此?#39029;?#20363;如用户如何经由这些设
备使用应用程序(应用)和网站的方式,用户下载的应用程序、网站或媒体是什么和/或用户
与什?#20174;?#29992;程序、网站或媒体交互,以及如何将这些应用程序、服务和内容首先分配到设
备。可以建立下载应用程序和实际使用应用程序之间的联系。可以分析与数字设备有关的
或使用数字设备的经济交互。可以调查在多个数字设备的使用中的区别和联系。

可以如由根据本发明的系统和方法的实施方案提供的,以不同层次的?#38468;?即在
全部应用程序上,对于各种类型的应用程序或对于特定的应用程序),为各?#36136;?#20247;(即用户/
消费者组)和/或在不同的时间周期内(例如在每日/每周/每月基础上)检查以上特征。

通用使用纵向被动计量,此处描述的框架被用于使用大规模?#20013;?#26679;本(例如Verto
Partner PanelsTM)来观察性地、有利地测量数字行为以捕获碎片化活动的长尾(long-
tail)。可以在若干基本上独立的数据源的基础上校准所获得的数据并且对所获得的数据
进行质量控制,所述数据源包括例如用于人口分布校准的从样?#38236;?#21040;的分层数据、用于行
为概况分析的具有被动计量的仔细-分层的纵向小组、以及用于行为校准和衡量的统计-数
据。

本文描述的系统的交付物下面的一个概念在于将例如以下三个不同类别的信息
桥接在一起的能力:

1:?#24067;?#20998;布数据,该数据表示不同(移动的)平台和设备的普及和分布,?#20174;?移动
的)?#24067;?#24066;场中的?#20013;?#21464;化;

2:应用程序(应用)分布和货币化数据,该数据表示不同(移动)应用的普及和分
布、量化通过这些应用程序的销售和由用户所做的应用程序中的购买产生的收入的数据;
以及

3:应用程序/内容使用和参与数据——该数据示出消费者如何与(移动的)内容
(例如应用程序、微件、网站)交互和接合。

除了或替代移动平台/设备/应用程序相关的分析,假设有足够的源数据可用,则
可以进行涉及基本上不移动的或不可携带的设备的相应的分析。

图1在100处从概念的和以设备为?#34892;?#30340;角度例示了根据本发明的系统的一个实
施方案。

提供了一个包括若干至少功能性连接的服务器108的电子系统110用于如下活动,
像关于用户102(典型为人)的与可连接的网络(优选的可连接的互联网107)、用户设备104
诸如台式电脑、笔记?#38236;?#33041;、平板电脑、蜂窝电话并且特别是智能电话、附接设备诸如各种
辅助设备104a、104b(例如,眼镜类型的用户界面、智能电视或其他用户界面设备)相关的在
线行为或其他活动的数据获取和分析。根据该实施方案和所采用的角度,系统110可被认为
包括若干用户设备104——可选地为辅助设备104a、104b——以及另外的元件(诸如数据
源)。

除了利用用户设备104、104a、104b,优选地经由用户设备中提供的可被称为研究
计量器的计量/数据采集应用逻辑105(软件)捕获的用户级数据之外,还可以从若干用户独
立的数据源107a(诸如在线服务)获得表示整个目标群体或例如整个目标群体的完整的且
严格限定的子集中的特征分布的统计级数据,所述用户独立的数据源可以包括至少一个网
络载体、广告网络、广告交换、网站或应用程序分析平台、网络网关、网络代理和/或内容交
付/分发平台例如内容管理平台或应用程序商店。可以由关联的数字、连接网络的设备(诸
如服务器)通过由系统110经由例如可用的应用程序编程接口(API)发起的轮询或提取程
序,和/或通过由数据源/服务器107a本身根据预定的逻辑例如响应于满足触发条件发起的
推送机制来提供来自这些数据源107a的数据,所述触发条件可以包括基于定时器的条件
(除了其他选项之外,每日、每周或每月进行数据传输)。

系统110被配置成借助于本体元数据方案和若干不同处理技术将在所获得的数据
中观察的实体采集、分类并集合到多级分类本体中以恰当地服务目标实体102a,所述目标
实体可能包括一个或多个公司、人或基本上任何订购分析结果和/或对分析结果?#34892;?#36259;的
目标群组或客户。即,这些群组可以被提供有所需类型的交付物,所述交付物潜在地包括但
不限于经由适当的客户端装置(诸如计算装置和在计算装置上运行的浏览器)可访问和/或
可观察的以数字文件或其他表示(有利地包括视觉表示)形式的电子报告。

实际上,用于访问系统110和/或检查交付物的用户界面112可以包括优选地经由
一般网络浏览应用程序可访问的、可选地补充有定制的附加模块以增强使用体验的基于网
络的用户界面。基于网络的界面可以被配置成?#24066;?#29992;户便利地监测最新的或历史数据(分
析结果)、识别数据中的变化(趋?#39057;?和/或可选地如果需要的话使用历史或当前的数据通
过基于网络的报告界面的交互和?#20174;?#30340;部件来执行点对点(ad-hoc)的分析。另外或替代
地,可以经由若干其他输出通道,例如经由通过目标应用程序和/或服务可访问的若干应用
程序编程接口,或者经由电子邮件来提供交付物。

由于群组的兴趣可能变化,系统110被配置成根据经由UI 112向系统提供的客户
端的需求优选地动态地确定分析的范围和/或交付物的范围。除了其他选项外,可以由用户
群体、使用的设备、使用的应用程序、应用程序货币化和/或时间因素来限?#21697;?#22260;。例如,系
统110可以被配置成提供如下一个用户界面112,该用户界面实现用于调节数据分析和/或
数据表示的范围的至少一个用户可改变的特征,所述数据分析和/或数据表示的范围选自
由以下组成的组:在例如一个或多个目标组/受众方面的过滤器、用以探索的一个或多个度
量的选择、范围(例如设备类别、设备品牌、应用程序类别、特定应用程序、网?#38236;?的选择以
及所需时间周期(例如“2014年1月”)和/或时间分辨率(例如每日、每周、每月等)。

图2在200处从更多概念和功能的角度表示了系统的一个实施方案。总体的数据
(处理)流程在图中由数据采集活动与产生/输出活动之间的水平箭头表明。

在202处,结构研究208被表示为例如在系统中被用作数据校准的基础的一个信息
源。

优选地,结构研究208是独立调查或者包括独立调查,以提供用于诸如确定用于
(第一)研究小组216?#24515;?#30340;所需小组分层(即配额(quotas))的若干动作以及在数据采集过
程202期间采集的以及在数据产生过程204期间采集或收集的结果数据的校准的独立基础
(潜在地连同统计级数据211一起)。结构研究208可以被实现为离线研究以最大化例如其覆
盖范围/代表性。

结构研究208被设计成概述基础统计假设,所述基础统计假设描述研究的群体。结
构研究208可用于回答(概念性地)例如以下问题:

●期望市场(例如,某个国家、州、地区或其他地理区域)的(成人)群体的设备所有
权特征是什么?

●测量的设备所有者的社会人口统计特征是什么?

可以通过也将实现本发明描述的系统的群组或替代地以方法的某些实现方式来
实现结构研究208,所述研究208可以由?#34892;?#35465;的且可信的市场研究供应者或可用的其他社
会研?#31354;?#25480;权或委?#23567;?#23384;在能够提供足够满足以上所?#34892;?#27714;的数据、并且能够容易地从第
三方研究供应者授权或委托的多种研究方法。

统计数据211可以包括网络统计数据210,该网络统计数据可以例如通过网络通讯
或网络活动监测获得,以及具体地例如应用程序商店数据212。优选地,统计级数据描述了
各种对象,在一些实施方案中所述对象可以包括设备、用户、服务、应用程序或网站。由此包
括在统计级数据中的每个数据集应当提供关于特定数据集应用到的整个群体的聚集的或
者实例级(case-level)的特征和信息。统计数据211可与结构数据208一起使用以校准在数
据采集过程202中采集的数据以及在数据生成过程204中采集或收集的数据。

元数据214是、包括或者限定了用于限定实体分类法(taxonomy)的本体数据集,所
述实体分类法服务用于将在数据采集过程202和数据生成过程204期间发现或观察的实体
(例如移动设备、操作系统、访问的网站、应用程序等)分类。该数据可用于:

●将相关数据项分组到如在数据生产过程204期间所需的类别中,和/或

●在交付物206中获得分类组织的数据。

研究计量器217可以实现为软件,该软件被获得、可选地下载到并且安装在数字设
备(例如,计算机、智能?#21482;?#24179;板电脑等)上以监测和记录数字设?#24178;?#30340;活动。研究计量器
可以基本上作用为用于本发明描述的系统和框架的数据的主要源,并且其数据被用于采
集:

●关于在第一研究小组(参见以下)216中监测的设备的行为/活动的观察数据,
和/或

●关于在第二研究小组218(例如前述的Verto Partner PanelTM)中监测的设备的
行为/活动的观察数据。

现在,最后更详细地考虑小组216、218,第一研究小组216优选地是数字设备用户
的被动计量小组,应当优选地使用一种选定的且限定的方法来聘用该小组。在一些实施方
案中,该方法可以涉及诸如通过弹出窗口拦截、在线访问小组邀请、机会登记拦截促进的
CAWI(计算机辅助网络访谈)、CATI(计算机辅助电话访谈)、CAPI(计算机辅助个人访谈)的
技术或其他常用的且很好地建立的研究方法。

应当有利地基于从结构研究中得到的目标配额确定小组组成。小组成员将具有安
装在他们数字设?#24178;?#30340;研究计量器217,并?#24050;?#31350;计量器217将随后被动地监测他们的行
为。被动计量通常指的是这样的技术,其中软件跟踪用户活动或情景参数,至少在很大程度
上运行在所述设备的后台,用户不需要与该软件单独交互。在将这些软件计量器安装到数
字设备时,用户可能需要完成安装相关的步骤。在一些实施方案中,运行在这样的设备的一
个软件计量可能还产生关于若干其他数字设?#24178;?#30340;测量数据,所述其他数字设备例如功能
性附接到主设备并且由此可选地无线地与主设备通信的数字设备。

第一研究小组216的一个目的是为消费者行为提供高质量(即,高度受控、良好校
准的)数据源。研究样本的大小将提供有限的数据深度(即,长尾数据的有限可用性),然而
该小组将专门为那些对象(例如,应用程序、网站、设备制造商、人口统计组等)提供高质量
数据,如果仔细实现的?#22467;?#25152;述对象的受众/用户足够多。

详细地并且根据研究计量器217的实施方案,并且在数据生成过程204完成时,小
组216可以被设计成提供回答例如以下问题的高质量数据:

●在某个市场的消费者中数字设备的使用率和普及率是多少?

●消费者在他们的数字设?#24178;?#19982;什么资源(例如,应用程序、网站、媒体)交互?

●消费者如何经由他们的数字设备与上层资源(例如,应用程序、网站、媒体)交
互?

●消费者为什?#30784;?#20309;时、如?#25105;?#21450;以多少数量在数字设?#24178;?#33457;钱?

●当考虑具有多个数字设备的消费者时,以上问题在设备之间如何变化?

●应用程序/内容分布、使用、替换和/或增量使用中的趋势是什么?

来自小组216的数据可以形成或被用于形成一个主要的交付物206,并且将体现基
于第二研究小组218(例如,Verto Partner PanelTM)得到的输出数据的形式。

如在此提到的,可以基于一组分层的配额来?#24515;?#23567;组216,并且可以基于结构研究
208的结果确定小组分层。

在被邀请参加第一研究小组216之前(即,在进入抽样框架之前),回答者应当满足
若干基本的标准,所述标准可以包括关于例如回答者的年龄以及住所、设备/网络所有权以
及可访问性、调查参与历史等的不同要求。

可以用所期望的形式补偿参?#26377;?#32452;216的小组成员。应当与产生这样的小组成员
的样本供应者一起合作来为每个特定的小组成员确定满意机制和激励处理。激励可以是数
字的并且数字地分派,诸如对数字内容、服务、应用程序等的访问或提升的访问/用户权限。

第二研究小组(例如,Verto Parnter PanelTM)18优选地是最有利地经由?#25105;?#25277;样
?#24515;?#30340;数字设备用户的被动计量小组。在一些情况下,?#24515;?#21487;能是间接的,考虑到例如以下
情?#22467;?#22312;所述场景中研究计量器217由于?#24230;?#22312;用户最初不是为了参与研究学习的目的而
下载的某个面向终端用户的应用程序中而被包括。小组将由如下的用户组成或包括如下的
用户,即用户已经:

●安装捆绑有一个或多个移动应用程序的研究计量器217;

●向系统提供他们的人口统计概况数据;和/或

●同意向系统提供匿名数据。

由于默认情况下小组的组成基本上是不受控制的(即,“基本上都是受欢迎的”)或
几乎不受控制的,小组218的作用在于开发能够提供深层次的长尾数据的非常大的样本。小
组218可以被具体地配置成为大量的对象(例如,应用程序、网站、设备等)提供补充数据。

并且鉴于前述内容,由于样本的人口统计和行为代表性是不受控制的,样本的数
据将不用于校?#35745;?#20182;数据。替代地,在数据产生过程204期间用更有代表性和受自然控制的
数据(诸如来自第一研究小组216的数据和在数据采集过程202中采集的其他数据)来校准
来自小组218的数据本身。

更详细地涉及小组218的哲学和相关技术特征,由于在此描述的框架旨在对于其
进行报告的对象非常碎片化,在实?#26159;?#20917;下,不可能在没有非常大的样本规模的情况下提
供关于数字行为的完整的/深度的数据。使用为第一研究小组216(参见以上)设计的严格的
程序?#24515;?#38750;常多的样本在每个小组成员的基础上将是非常昂贵的。因此,将通过开发优选
地在方便的(不受控制的,或“利用任何可能方法的(catch-as-catch-can)”)基础上发展的
第二小组218来补充第一小组216。

小组218优选地不限制规模。然而,在一些实施方案中,当通过应用的质量控制和
确认过程选择的小组成员的数量超过预定数量例如20,000(两万)时,仅可以在交付物206
中包括来自小组218的数据。

在优选的实施方案中,第二小组218的组成不是先验地受控的,但是确认状态被有
利地设计以另选择相关回答者包括为事后确认(标签内)的小组成员。

可以从移动设备用户(即,例如iOS、黑莓、安卓和/或Windows移动设备的用户)群
体中?#24515;?#31532;二小组218的小组成员。例如,小组成员的特定的源可以是那些已经安装了集成
有研究计量器217的一个或多个移动应用程序或例如研究SDK(软件开发工具包)的用户。

原则上,已经安装了集成的应用程序的每个用户可以被邀请参加第二小组218。可
以经由应用程序本身,使用例如可视消息提供邀请。该参与是基于用户的自愿选择参加的。
但是,为了监管和道德要求,可能必要的是在选择参加的同时,用户表明他们的出生年份作
为预选的特征(例如,低于18岁的用户将被自动地退出)。

可以执行?#24515;?#35843;查以采集关于回答者的基本的/最小的数据,以适当地对他们的
数据加权。在小组218的?#24515;?#35843;查中采集的基本的人口统计信息可以包括例如设备类型、移
动载体、性别、教育、地理位置、家庭规模?#21462;?br />

从若干源技术性地得到用以给巨大的小组成员数据加权的该信息,可选地自动利
用例如基于软件的观察、或者集成选择的第三方以描述小组成员、或者使用一些弹出窗口
或问卷形式为小组成员实现这一目的。

交付数据206是在此描述的系统的最终输出,但是显然地如果需求出现,接收交付
数据的客户102a可以进一步例如用专有工具?#28909;?#31435;数据。交付物206包括例如关于设备使
用、应用程序/服务使用和用户行为的校准的、处理的和归类的信息,可选地经由基于网络
的用户界面使得交付物对客户完全地或部分地可用。替代地,例如可以利用本地应用程序
来消耗该信息。

交付物206可以例如在后端体现为单一的、统一的数据库。然而,每个客户可以被
指定特定的用户权限以通过可用的用户界面诸如基于网络的界面访问交付物的有限部分。

例如,交付物可以包括选自由以下组成的组的至少一个元素:?#24067;?#20998;布、内容分
布、应用程序/内容使用和参与以及应用程序分析。

图11示出了根据本发明的方法的一个实施方案的总体流程图1100,涉及以上解释
的主题和特征。

在开始1102处,该系统被增加,这可能指的是获取和配置相关?#24067;?#21644;软件。系统可
以包括可选地布置在例如云计算环境中的若干服务器设备。此外,可能已经在这个阶段发
起至少第二用户小组的小组成员的“沉默的?#38381;心跡?#20363;如经由方便的采样以及传递到多个用
户设备(诸如移动终端或其他终端,优选地如捆绑有其他软件)的相关的测量、记录和报告
软件。而且,例如可以选择统计级数据的供应者并且可以建立必要的数据通信通道。

在1104处,执行结构研究以确定第一研究小组的分层(配额)、测量领域的属性(人
口统计等),这些应当被用于小组数据的校准?#21462;?#28982;后可以相应地执行小组成员的?#24515;跡?#29305;
别是为第一小组216。

在1106处,优选地从多个源诸如应用程序商店、网络数据供应者等获得统计级数
据。

在1108处,从小组成员接收用户级数据。

在1110处,发生数据处理,包括将数据进行组织。校准用户级数据例如用从样?#38236;?br />到的分层数据(从结构研究208)和/或统计级数据如以下将进一步详?#35813;?#36848;的那样执行。

在1112处,构建基于采集的统计级数据和用户级数据的交付物。项目1116指的是
形成交付物的内容和/或形式的消费者输入(尽管直到项目1112才在图中表明,但是这样的
输入可以在各种处理阶段被系统接收并考虑)。

在1114处,方法执行结束。

如在图中由各?#20013;?#32447;回路箭头表明的,如对于本领域技术人员在该公开文本的基
础上清楚的,项目的执行可以是并且通常是重复的和/或迭代的。执行顺序还可以根据例如
新数据的可用性改变,并且考虑到例如潜在的用户级数据的迭代校准,并行或替代的项目
处理可能并且通常将在现实生活的实现中发生。

参考图3,在300处描述了与本发明结合使用的可行的多设备方法的一个实施方
案。总体上,在用户102与他/她的设备104、104a之间的通信用实线例示,并且在设备之间的
通信用虚线表明。实际上,在本发明的优选实施方案中,即使由于实?#35797;?#22240;这些设备中一个
或多个不能或将不被配置成执行基于至少全面的软件或?#24067;?#30340;数据采集技术,依然可以跟
踪单个用户的多个设备。特别地,系统被优选地配置,使得即使用户102与可附接或可穿戴
设备或者外部用户界面(例如是智能手表设备或数字眼镜类型的数字屏幕)交互,也可以采
集相关的测量数据。在这些情况中,系统利用所述附接设备或用户界面104a连接到的在中
间的所谓主设备104来执行如下功能中的一个或多个:

1.跟踪在附接设备104a和主设备104之间发生的通讯、信号或其他事件。

2.被动地(基于例如一些情景事件触发器)或主动地(例如基于预限定的间隔)轮
询附接设备104a的应用程序编程接口(API),以便采集测量数据。

3.在主设备中暂时地或在预定?#20013;?#26102;间内存储采集的测量数据。

4.将数据发送到系统的基于网络的数据采集服务器108,以用于分析的目的。

优选地,主设备被配置成跟踪、存储和发送数据,使?#31859;?#21021;涉及特定设备(或者主
设备本身或者任何附接设备)的数据可?#36816;?#21518;被跟踪返回到同一设备。在一种可行的实现
方式中,虽然用户可具有指定给他/她的某个用户识别编码或号码(身份标识),设备中的每
个(?#36824;?#20182;们是否是主设备104或附接(从)设备104a)也具有它们自?#20309;?#19968;的设备标识号,
尽管它们中的一些可能相互连接。

除了在分析阶段期间的潜在利益外,这种实?#32440;?#20351;得能够将获得的使用数据分解
到不同设备和用户界面中。此外,在某些实现方式中,除了指定例如用户身份标识号码和/
或设?#24178;?#20221;标识号码(对应于主设备)以外,可能存在于主设备中或远程服务器中的处理跟
踪/测量的引擎可以被配置成为连接到主设备104的用户界面/附接设备指定或注册用户界
面身份标识。

实际上,在很大程度上由主设备104执行并领导测量(例如该设备被用作数据存储
?#32479;?#21521;网络的网关,并且处理使用的不同用户界面的身份识别/注册),但可能例如通过附
接的、?#38469;?#30340;从设备104a发生接合和用户动作的实现方式中,例如可以执行如下技术步骤:

1.在连接到主设备时由主设备或者通过对新连接的动态监听、或者替代地例如通
过定期地轮询关于成对的或连接的设备的信息注册新的或现有的用户界面;

2.对于每个设备,跟踪状态信息,优选地包括心跳(设备处于打开状态,即使没有
发生与内容、服务、应用程序的活动接合))。

在此处描述的跟踪多设备或多用户界面行为的系统中,主设备104应当有利地记
录事件和其他测量数据(潜在地主要包括屏幕快照),而不用这些活动为附接设备104a增加
负担。主设备104可以被配置成使用可用的广泛使用的应用程序编程接口或者其他功能呼
叫来采集该数据,或者替代地/额外地在一些实现中,主设备可以跟踪更多基础信令通讯通
道、HTTP数据(超文本传输协议数据)(由于主设备被用作一种网络网关)或者其他栈或?#31995;?br />层次的应用程序编程接口。

参考图4,在该图中从功能/逻辑401A和?#24067;?#35282;度401B示出了根据本发明的系统
400的一个实施方案的内部。

项目412指的是主控制逻辑,其负责从各种源获取数据、在不同实体之间的数据传
输、配置管理?#21462;?br />

项目410指的是若干数据存储库,诸如用于存储采集和处理的数据的数据库。

项目414指的是用于将数据组织和分类到多义数据集中的本体元数据方案。

项目416指的是用于输出包含结合的、归类的多级数据的交付物的用户界面,该多
级数据是通过处理和分析采集的用户级数据和统计级数据获得的。

项目408指的是在系统或服务器端的用户级数据采集逻辑,而项目402指的是研究
计量器217或(研究软件开发工具包),即在用户设?#24178;?#24182;且例如与在线/移动服务结合负责
数据计量、记录、潜在地处理并?#26131;?#21457;的逻辑。优选地,准备该逻辑,使得可以将该逻辑容易
地插入到任何在线或移动服务或者应用程序中,并?#19994;?#20154;们使用这些特定的服务或应用程
序时,则该逻辑在后台被激活,运行测量并且能够向建议的系统的服务器发送测量数据。所
有这些可以发生,而不必须向“主应用程序”提供任?#35859;?#38754;或配置可能性影响逻辑如何工
作。然而,在一些实现中,可以有在逻辑模块中建立的若干选择的“反馈回路?#20445;?#20351;得它可以
提供信号、数据或其他某些东西返回主应用程序。

为了监督/管理的目的,将优选地随时保持与逻辑402集成的应用程序的列表。可
以给予安装集成的应用程序的每个(移动)用户机会以参加(选择参加)第二研究小组218。
由此,该已经安装集成的应用程序的用户群体可以为第二小组218建立样本框架。

项目404相应地指的是统计级数据采集逻辑。尽管在图中没有明确表明,在该情况
下在远程实体处(例如在运行和/或管理在线服务的服务器处)安装的研究软件开发工具包
或相应的数据采集实体也可以被用于数据采集的目的。

项目406指的是数据分析逻辑,其被配置成利用例如方案414验证、结合、校准、处
理和组织采集的数据,以获得所期望类型的交付物用于经由用户界面416输出。

?#24067;?#26041;面401B,应用设备诸如服务器和用户设备(主设备和附接设备二者)中的每
个可以包括若干处理设备420,诸如用于处理指令和数据的微处理器、微控制器、信号处理
器?#21462;?#36827;一步地,它们可以包括用于存储程序指令和其他数据(诸如采集的用户级和/或统
计级数据、经处理的数据、本体方案、交付物等)的存储器(芯片)422。

数据接口426可能指的是例如可以为有线或无线的对等接口或网络接口。服务器
型设备通常包括具有例如以太网或其他局域网型连接手段的(有线)网络适配器,而移动用
户设备通常可以包括用于访问互联网和/或与附近的其他设备通信的若干无线收发器,例
如蜂窝收发器(例如3G)和/或WLAN(无线局域网)或蓝牙收发器。还可以包括标签阅读器(例
如,RFID(射频识别)或NFC(近场通信))。用户界面可以包括显示器424和数据输入设备430
(诸如键区、键盘、触摸界面(例如触摸屏)等)。此外,设备通常包括各种其他元件428,诸如
一个或多个传感器、电源部件、外壳?#21462;?br />

用于通过若干计算机设备执行本文所述的方法步骤和总体的程序的程序代码(软
件)可?#28304;?#20307;上设置在载体介质(诸如存储卡或光盘)上或者通过有线或无线通信介质被传
输。

参考图5,在500处示出了经由统计数据211测量的不同潜在群体之间的联系。即,
在统计数据211中包括的数据可以被划分为独立的?#20063;?#30456;关的数据集,数据集中的每个报
告关于整个用户群体(或者“计算机用户”510、“移动网络用户”512或者“移动非网络用户”
508)的特定子集的数据。

前述三个群体有可能重叠:个人可以同时是计算机用户、移动设备用户以及移动
设备应用程序用户。然而,不同统计数据提供者通常将具有在这三个子群体中的每个中的
不同范围。

为了为统计数据211提供可靠的数据以用于在校准中使用,优先选择统计数据供
应者,使得同时最大化(优选地接近100%)这三个群体中的每个中的范围,并?#26131;?#23567;化(优
选地接近0%)在统计数据供应者之间特定用户被两次计数的可能性。

实际上,在全部三个测量子群体之间可靠地接近100%范围的一种方法是结合多
个统计数据源。然而,由于必须最小化特定唯一用户已经被两次计数的可能性,在这些统计
数据源之间重叠的受众必须先验地被最小化。推荐的是实施本发明的系统的人员仔细选择
统计数据供应者,以精确地确定他们在测量的每个子群体中和每个子群体之间的范围和重
叠。

为了校准的目的,优选地相对其他数据源在及时的基础上(例如每月)处理和比较
统计数据,并?#19994;?#25972;校正运算使得例如关于使用中的设备数目或激活的新设备的公布估计
值尽可能地接近真实数目。

统计数据可以以原始级?#38382;交?#24471;,包括例如对于关于用户或设备类型相关的每个
领域,公开在某个时间期间所看到的唯一用户的名义或相对数量和/或例如对于某个国家
在某个时间期间观察到的动作的名义或相对数量的表。

在一些实施方案中,系统可以被配置成利用在提供的原始级信息中的原始级?#22336;?br />串来自动地或半自动地(例如,用人力管理)识别用户类型、设备类型以及使用的应用程序。
原始级?#22336;?#20018;可以包括,例如用作标识符的数据的字母数?#21046;?#27573;。类似地,基于例如任何设
备相关的身份标识(诸如序列号),设备的暂时的或永久的唯一的号码可?#36816;?#26159;统计数据的
任何设备和/或应用程序专用部分。

在本发明的一些实施方案中,可以?#24515;?#23567;组216、218,而不需要控制在小组相应的
样本分层中的行为偏差的技术手段。

虽然结构研究208提供了人口统计控制和校准的一些测量,其声明基础使得其行
为价值对于校准小组216、218的行为代表性没有多大意义。

在一些情况下,统计数据可以包括?#20174;?#29992;户、设备或服务的整个限定的子群体的
行为的特定数据点。可以使用这样的统计数据,以校?#21152;?#21069;述无能引起的任何不经意的行
为偏差,从而将行为特征纳入相应小组216、218的样本分层。可以提供在校准中使用的统计
级行为数据的统计数据的一个实施例是关于在移动应用程序商店(应用程序商店)中可获
得的应用程序的统计级信息,其被表示为应用程序商店数据212。

切换到图6,应用程序商店数据或类似的数据可以被机器人/爬行器巧妙地采集,
所述机器人/爬行器被编程以例如定期扫描公开可用的或专有的接口,在图中600处例示了
其实施方案。

例如每天(每24小?#24065;?#27425;),本发明的系统可以被配置成可选地经由适当的应用程
序编程接口连接到监测的应用程序商店或其他或多或少对应的内容交付/发?#35745;?#21488;,并且
通过在应用程序商店列出的每个应用程序迭代。关于每个应用程序,系统可被配置成记录
例如一个或多个数据点,诸如?#33268;?#20013;的应用程序商店、时间戳、?#33268;?#20013;的应用程序名?#39057;取?br />

关于每个应用程序,系统可以被配置成记录例如以下数据项目的一个或多个:

●应用程序商店。表明从其中采集数据的应用程序商店的唯一标识符。

●时间戳。表明何时从应用程序商店采集数据的世界标准时间(UTC)时间戳。

●应用程序标识。?#33268;?#20013;的应用程序的身份标识编码或名称(或其他唯一标识
符)。

●关于排名列表中应用程序位置的信息。

●应用程序目录。描述如何分类应用程序的数据。

应用程序商店爬行器可以具有主服务器单元608,该主服务器单元能够将数据存
储到原始数据库612中并且访?#35797;?#25968;据存储610,该元数据存储包括关于已经扫描的且分类
的应用程序的信息以及例如应用程序商店爬行器的状态。

然后,应用程序商店爬行器可以被配置成利用多个不同用户账户和/或其他面向
仿真器的特征以“假扮?#34987;?#20223;真例如特定无线设备或特定用户,和/或通过使用代理/VPN(虚
拟专用网络)隧道606或者通过直接访问应用程序商店的应用程序编程接口(有时公开的,
有时私人的),部分地(in patches)或者一个接一个地从例如不同国家中的不同应用程序
商店实例602、604请求信息,并且因?#31169;?#30456;关数据抓取到平台。由此系统可以被设计成使用
面向仿真器的特征和/或其他技术,如选择的隧道和动态IP地址方案,以高效地爬行不同供
应者、国家和本地化的应用程序商店的应用程序编程接口。

因为通常没有或者至少不是全部可用的应用程序商店公布(公开地)每个应用程
序的实际下载数量,可以基于为每个应用程序采集的各种数据点(诸如但不限于特定国家
的应用程序排名、用户评级得分等)来估计下载数量。

图7在700处描述了如下一个实施方案的不同方面,该实施方案关于基于以例如排
名和/或评级(涉及估计的目标实体)形式的可用信息的下载统计(例如,下载数量)的创新
估计技术。通过该解决方案,除了其他用途之外,其能够为各?#25351;?#26679;的应用程序集合产生估
计。

许多应用程序商店(诸如iTunesTM和Google PlayTM)的确会公布智能?#21482;?#24212;用程
序的一些类型的排行榜和例如评级,但是它们不会至少综合地公布不同应用程序的实际下
载数量。然而,对于移动应用程序市场中从应用程序开发者到市场研究人员的许多人员对
下载信息具有很大的兴趣。优选地,在若干源(诸如前述应用程序商店)中仍然有关于应用
程序的公开地可用的排名信息。为了使用关于每个应用程序公开地可用的信息并?#39029;?#20102;其
他因素之外?#35272;?#30001;?#33268;?#20013;的应用程序商店为每个应用程序公布的排名位置来估计列在应
用程序商店中列出的应用程序的例如每日下载数量,接着在下文描述许多种方法。

在介绍进一步的?#38468;?#20043;前,首先假设在给定应用程序商店中的排名位置与由给定
应用程序实际经历的(每日)下载数量之间的良好限定的数学关系的确存在,并且该排名位
置数据可用。此外,在确定若干模型参数时需要一组地面真实(ground truth)数据。

由此,通过例如从应用程序商店为给定的一组应用程序获得的(每日)排名位置数
据以及例如从地面真实数据的独立源得到的若干恰当确定的模型参数,使得能够使用数学
模型来估计每个所期望的时间参考的下载量,诸如在此取作实例的前述每日下载量。

关于模型本身,先前已经建议了一个简单的幂律模型,但是当相对地面真实数据
监测时,存在提供不同精确度的若干其他选项。特别地,阐明以下模型:

指数的:

d(r)=a*exp(b*r)

对数-正态的:

d(r)=a/rb*exp(c*log2(r))

具有指数截断的幂律:

d(r)=a/rb*exp(c*r)

洛马克斯(Lomax):

d(r)=a(1+b*r)c

其中,d(r)指的是(每日)下载量,以及r指的是排名。虽然建议的指数模型仅具有
两个参数,但其余的模型具有?#24066;?#24314;模更复杂的关系的三个参数。例如,对数正态模型包括
如下参数:比例参数a,以及确定模型的坡度和曲度的形状参数b和c。

建议的方法涉及以下步骤:

1.假设模型702。在建议的方法的第一步中,假设应当使用的数学模型。例如,可以
(并且优选地)考虑前述的指数的、对数正态的、具有指数截断的幂律以及洛马克斯模型。

2.拟合参数704。给定假设的模型,使用外部数据712、714(诸如已知的排名位置和
下载数据)来将参数拟合到模型,以获得重申的模型706。可以通过将模型转换到它们的对
数形式来便于该处理。

幂律:

log(d(r))=log(a)+b*log(r)

指数的:log(d(r))=log(a)+b*r

对数正态的:

log(d(r))=log(a)-b*log(r)+c*log2(r)

具有指数截断的幂律:

log(d(r))=log(a)-b*log(r)+c*r

洛马克斯:

log(d(r))=log(a)+c*log(1+b*r)

3.对于每个目标应用程序,利用708重申的模型构建下载估计710。已经将参数拟
合到模型后,根据可用的外部数据716,应用例如以下描述的两个算法中的一个为特定的应
用程序估计下载数量。

算法1指的是其中当前(每日)数据可用的情况。当外部(地面真实)数据对应用程
序的样本是本质上每日的?#19994;?#21069;可用的时,能够使用以上描述的参数化/拟合的模型中的
任?#25105;?#20010;为该样本外的具有给定排名r的应用程序估计下载数量。实现该算法的过程可以
采取以下步骤:

1.对于选择的模型,通过假设如从外部(地面真实)数据获得的r的值并且使用算
法形式的应用程序模型来估计除了r的所有参数的值,以估计其余的参数。

2.重申选择的初始模型,应用来自(1)的估计的参数值代替模型中表明的参数。

3.在给定的一天中假定应用程序排名r,则可以通过计算在(2)中确定的公式来估
计在该给定的一天中该应用程序的下载数量。

算法2指的是其中外部(地面真实)数据具有不连续可用性的情况,使?#31859;?#21021;有可
用的每日数据并且随后仅有可用的每月数据。然后仍然能够使用以上所述的参数化/拟合
的模型中的任?#25105;?#20010;为具有给定排名r的应用程序估计下载数量。

实现算法2的过程包括:

1.通过在每日数据可用时计算基于时间周期内的该每日数据准备的每日模型上
的适当的参数的平均值,估计可适用的形状参数。

2.通过以下估计比例参数a:

(a)取如在先前两个月内的外部数据中看到的最高下载值;

(b)将从(a)得到的每个值除以30以确定先前两个月的每天内每日下载数量的线
性估计,以?#22467;?br />

(c)使用从(b)得到的值,线性推?#31995;?#21069;日期(或?#33268;?#30340;日期)内的下载数量d。基于
d并且如果需要基于从(1)得到的形状参数,估计参数a。

3.重申选择的初始模型公式,将从(1)和(2)得到的参数值应用代替模型中的参
数。

4.在给定的一天中假定应用程序排名r,然后可以通过计算(3)中确定的公式估计
在该给定的一天中该应用程序的下载数量。

参考图8以及在800处描述的情?#22467;?#22312;用户设备处运行的研究计量应用程序逻辑
217被配置成提供数字设备的观察/记录小组成员使用的被动方式。具体地意味着被动地观
察、记录并且上传814小组成员活动的日志812到系统的服务器以用于存储和分析816、818。

计量逻辑217存在于被计量设备的存储器中。当在设?#24178;?#21457;生特定事件808时,计
量器217被触发804并且关于事件的信息被记录806、810。

日志文件管理和传输遵循以下规则?#32479;?#24207;中的一个或多个:

●对于特定的小组成员和具体的计量设备,鉴别每个日志文件,

●在被计量设?#24178;?#26412;地存储日志文件,

●在被计量设?#24178;?#20351;用相关的压缩算法将日志文件本地压缩,

●基于互联网连接的可用性将日志文件异步传输到“等待的”(802)远程服务器,

●为最小化对设备性能的影响,仅当互联网连接可用时发起日志传输,和/或

●在延长时间?#25991;?#27809;有互联网连接可用的情况下,将在被计量设?#24178;?#26412;地存储最
高达预定数量(例如约10MB)的日志文件。

由计量软件217采集的数据将被分成多个(例如,三个)概念类别:

●事件元数据:这是描述事件情景(context)的信息,并且优选地在由研究计量器
登记的每个类型事件之间相同;

●事件数据:这是专用于记录事件的信息,并且事件数据的内容可以根据已经记
录的事件类型可以改变;和/或

●心跳数据:这是通知系统小组成员/设备保持“活动的”并且连接到互联网的信
息。

由计量器217记录的事件数据将优选地主要地由系统的服务器处理,这是为了:

a)清除数据,

b)在需要的地方,将事件元数据连接到底层事件,

c)将标识符?#25104;?#21040;相关实体,和/或

d)从记录的数据计算度量。

由研究计量器217记录的每个事件将优选地记录以下元数据中的至少一些,例如:

●小组成员/设备ID。这是识别特定小组成员和具体计量的设备的唯一标识符(小
组成员/设备的鉴别性特征)。

●时间戳。这是表明事件何时发生的UTC(世界标准时间)时间戳。

●地理位置。这是关于当事件发生时客户端用户的地理位置的技术信息。如果可
以在地理位置坐标的水平上捕获该信息(通过机载全球定位系统或者无线定位软件),则其
将是理想的。该数据点可以接受“未知”值。

计量器217可被配置成利用外部服务器来采集若干选择的数据点,该数据点优选
地还经常与在设备本身中运行的设?#24178;?#30340;计量器相关。这样的实施方式的一个示例性设置
将是VPN(虚拟专用网络)或代理服务器,通过它们可以引?#35760;业?#29420;地记录所有或一些超文
本传输协议数据。

设?#24178;?#30340;计量器217可以发起该类型的概况设置,通过该概况设置外部服务器可
以用于这样的数据记录目的,并且设?#24178;?#30340;计量器217将主动地完成以下?#36739;?#20013;的至少一
个:

1.通过使用定制的概况设置或通讯中隐藏的鉴别性特征,鉴定和识别用户?#28304;?#36827;
识别小组成?#34987;?#35774;备,并且使得其与设?#24178;?#30340;计量器本身正直接采集的数据相当/有关系。

2.通过使用一些同?#20132;?#38544;藏的跟踪或者积极的超文本传输协议数据包传输来匹
配时间?#31890;?#20197;产生一个过程,通过该过程可以完美地匹配设?#24178;?#30340;计量数据的时间戳和在
外部服务器处采集的数据的时间戳(这涉及创建在设?#24178;?#19982;外部服务器的记录之间的所谓
偏移值)。

计量器217的一个另外的特征是所谓的情景数据处理器,该处理器被配置成将情
景信息增加到任何记录的活动,?#36824;?#35760;录的活动发生在研究计量器本身中还是在单独的服
务器中。该情景处理器可以被配置成将位置信息、设备性能信息和/或屏幕状态信息增加到
任何测量。该特征的一个实用目的是将关于用户活动和屏幕状态的信息增加到从外部(许
多是虚拟的)服务器(像虚拟专用网络或代理服务器)采集的数据。因此,在任何设备中,积
极的使用通讯可以与背景通讯活动分离,积极的使用意味着屏幕打开并且用户正在积极用
设备做事情。

为不同事件记录的信息量取决于被记录的事件的性质。采集的事件可以与应用程
序使用、互联网页面请求、发出的语音呼?#26800;?#30456;关。

在其原始形式中,由计量器217采集的数据将是非常细粒度的并且可以包含成千
上万的网站、移动应用程序、操作系统、用户代理和移动设备。在数据产生过程和数据交付
过程中该数据的颗粒性产生了两个独立的问题:

●数据粒度配准。对数据产生过程重要的数据(即,结构研究数据、应用程序商店
数据、超文本传输协议数据)是在与计量器217采集的数据的不同的粒?#20154;?#24179;下采集的。为
了计算和应用从这些部件得到的比例/比率因素,必须对高度颗粒化的数据分类,以使其与
较小粒度的数据源配准。

●客户体验。为了客户交付物可?#24049;?#19988;可读,客户提供有浏览和搜索他们?#34892;?#36259;
的特定实体(即,网站、移动应用程序、操作系统、用户代理、移动设备)的能力是很重要的。
虽然搜索体验可以支持高度颗粒化的数据,但是对交付物等的浏览经验不能经由系统用户
界面支持高度颗粒化的数据:将不可能在颗粒水平下包含的成千上万的实体中发现特定的
实体。

高效地解决全部这些问题的一种可行方法是开发用于管理元数据214的系统。存
在于元数据管理系统内的元数据将在数据生成过程期间被使用并且将对生成最终交付的
数据集至关重要。

前述元数据214被用于分类/组织如下实体,所述实体在例如研究计量日志文件、
应用程序商店数据212、大体上的统计数据211和/或结构研究数据208内可观察到。因为在
此描述的框架包含各种概念实体,该框架应当同时支持多义本体方案。通常,这些方案可以
被分成两个不同的类别:

●单义方案。包含在单义方案下的实体具有一个规范(canonical)分类方法。它们
的层次由例如管理和更新系统和相关逻辑的系统工作人员规范地限定。

●多义方案。指定到多义方案的实体将具有多个规范组织方法。根据他们特定的
商业需求,不同受众的客户?#31169;?#21487;能具有不同的实体分类方法。根据由工作人员限定的编
辑规则,每个多义方案应该是它们自己的组织方法并且应当被视为规范的。

因为由在此描述的框架测量的许多实体本质上是多义的,这意味着将有多个不同
的规范方案,本发明描述的系统根据所述规范方案公?#35745;?#25968;据。

参考图9,这些方案中的每个可以从如图中表明的一个或多个源得到。分类编辑器
902可以包括例如实现整个方法的实体。可以将由系统工作人员使用例如客户建立的元数
据管理系统开发和维护的一个或多个方案假设为“默认”规范方案。此外,考虑到例如在应
用程序商店可用的应用程序通常已经被它们的开发者/应用程序商店本身分类的事实,例
如应用程序商店914和技术供应者920可以提供分类方案。可以建立系统分类906。然而,例
如所提供的报告工具的终端用户可以限定他们自己的分类和类别912,然后通过应用所述
分类和类别将数据呈?#25351;?#20182;们。

通常,在本发明的情况下,提供期望主题的可靠的、客观的交付物进一步需要验证
小组数据并且利用可用的手段校准该数据。

因此,优选地自动地在接收到小组数据时,系统被配置成预处理该数据。特别地,
可以采取以下步骤:

●验证小组成员:使用可用于涉及的小组216、218的验证规则来验证小组成员。验
证之后,已经被标记为?#34892;?#30340;这些小组成员(即,来自小组成员的数据)可以经历进一步的
预处理步骤。

●计算度量和/或数据重组。为了加速计算交付物,来自验证的小组成员的原始日
志被处理,以确定预定的度量和/或将数据组织?#25509;?#21161;于进一步分析的结构中。

●关联元数据。在计算原始数据的必要的度量/重组的同时,记录与相应的元数据
条目关联。

预处理小组数据之后,可以使用数据诸如统计级数据211和/或从样?#38236;?#21040;的分层
数据(可选地结构研究208)来执行校准动作。

校准过程可能是并且通常是半手动或半自动化的过程,潜在地需要例如分析员来
计算各种值、将所述值输入到分析系统中、运行计算过程、分析结果并且在需要的时候重复
该过程。

概念性地,校准过程可以包括以下阶段:数据复查(review)、控制值计算以及应用
一个或多个处理算法诸如搜索算法,以基于建立的控制值为用户级数据确定恰当的校准加
权值。

图10仅通过总体实施例的方式例示?#25628;?#26412;复查程序的一个实施方案,该样本复查
程序用于校准变量和类别选择以使得能够控制值确定。本领域技术人员应理解的是他/她
可以调整例如例示的程序,或利用替代的程序,以更好地实现由本发明的每个真实生活使
用场景所设置的设计目的。

实际上,可以分析可获得的样本数据1002,并且可以确定例如以下标示:

●类别频率1004,用于校准变量的在验证的小组成员之中的个人类别频率(例如,
作为总的未加权的样本?#34892;?#21035;为男的百分比)。

●名义总数/方法1006,名义的校准变量的总数值(即,总的移动应用程序下载)和
名义的校准变量的平均值。

●类别情况计数1008,用于全部校准变量的在验证的小组成员之中的每个类别中
的未加权的实例数(例如,具?#34892;?#21035;?#32791;?#30340;实例数目)。

基于以上计算,选择的类别可能被缩减(在预定阈值下的频率/计数)以增强例如
校准的稳定性。校准变量和类别的优化的集合将被形成1010。

最后,系统被配置成基于这些校准变量和类别通过利用可获得的统计级数据211
和例如由结构研究208提供的数据来计算控制值1012。

校对之后,交付物可以进一步经历一系列选择的质量控制检查。在更新结构研究
校准数据之后,可以例如按月仔细地实施该质量控制过程。在质量控制程序期间,可以使用
如由技术人员理解的任何适合的方法检查数据稳定性和精确度二者。

最终,可以将交付物存储在至少一个数据存储库诸如在系统后端上的数据库,并
且可以授权客户经由系统用户界面访问特定的数据项目。

特别地,可以经由基于网络的界面将数据发送到订阅客户。该基于网络的界面可
以符合以下特征中的一个或多个:

●与主流浏览器(即,MSIE、火狐(Firefox)、Chrome、Safari)兼容。

●通过?#29992;?#22871;接?#20013;?#35758;层(SSL)发送。

●所有客户之间相似的功能/外观和感觉(即,客户组之间的可用的数据/内容可
能不同,但工具保持相同)。

以上,详细地?#33268;?#20102;本发明的各种实施方案。这些实施方案总体上涉及移动设备
和互联网设备以及连接到无线或有线通信网络的其他类似的设备,并且示出了通常可以如
何利用可用的移动和互联网设备以自动地和被动地收集关于终端背景的数据(诸如网络或
设备参数或性能)或者关于与该特定设备或其他环境设备或网络的使用相关的用户行为的
数据,以及最终如何基于采集的数据将所有该数据注入到创建缓存的或实时分析和不同类
型的派生信息的系统中,并且可以将该数据与从其他设备得到的数据或与其他人相关的数
据组合,并?#26131;?#32456;通过各种应用程序将确立的数据呈?#21482;?#29992;户或其他接?#29031;摺?br />

然而,本领域技术人员将认识到范围不限制于明确公开的实施方案,而是还覆盖
落在权利要求措辞下的其他实现方式。

关于本文
本文标题:通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构.pdf
链接地址:http://www.pqiex.tw/p-6091928.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 湖北十一选五前三值选 永利棋牌可以提现吗 零点棋牌手机版本 星空清墩下载大厅 分分彩坑人规律 股票融资是啥 快乐飞艇开奖api 600787股票行情 选号码 五分彩骗局步骤