投稿
广告投放

在推广联盟中虚拟身份用户画像办法研究(上)

作者:admin 2021-10-04 我要评论

前言:(伴随网络技术日新月异,各种网络应用应运而生,通过网络进行交流交流、产品买卖等已经成为大家生活的...

前言:(伴随网络技术日新月异,各种网络应用应运而生,通过网络进行交流交流、产品买卖等已经成为大家生活的一部分;网络应用的便捷性与高效性,使得大家的生活更广泛地融入的网络环境中。然而,这部分应用大部分不需要实认证就可用,一个人可以注册多个同类或不同类型的虚拟账号,这给互联网空间安全管理提出了艰巨难点,怎么样探寻到一种有效的虚拟身份刻画办法,成为解决该问题的要紧突破口。本文基于推广联盟机制,提出一种有效的虚拟身份串并关联办法,达成互联网空间身份的刻画,为互联网空间安全管理提供有力的支撑。)

为了达成准确计费与广告匹配,一般使用页面标签技术通过访客浏览器采集数据,并将这部分数据发送到远程数据接收伏务器,剖析职员可以从远程服务器查询数据报告。图1展示推广联盟原理。这部分信息一般通过放置在网站每一个页面中的 Javascript代码进行采集[1_2]。页面标签技术用 cookie追踪访客,一般会在用户的浏览器端创建唯一 用户ID,用户访问参与推广联盟代理站点时,通过Cokie携带用户ID表明身份信息,用于计费、用户偏 好刻画等。表1为通过账号jackcatlll访问www. cshn. net时抓取的cookie数据,表2为通过账号jack- cat 访问 www. 7k7k. com 时抓取的数据。表中数据显 示,这两次不一样的网站访问,B人工智能DUID却是相同的。 此处B人工智能DUID为百度推广联盟机制中追踪访客的用户ID,该用户ID存储在cookie中。上述的B人工智能DUID 跟设施、浏览器有关,并由这部分原因决定,且在肯定时间内维持不变,而且唯一。从而,大家可以认定账号 jackcatlll和jackcat为关联账号,进而通过有效的关联剖析算法,将其他互联网虚拟信息串并起来,从另一视角刻画互联网用户。



续表1

表2访问7k7k游戏网站cookie数据表

2.1关联绑定

关联绑定即通过推广联盟用户ID将无关联的虚拟身份绑定为关联虚拟身份关联绑定分为推广联盟内虚拟身份关联绑定、推广联盟间虚拟身份关联绑定。

推广联盟内虚拟身份关联绑定规则为来自不同cookie信息中的虚拟身份,若cookie信息中的同一推广联盟用户I相同,则觉得这部分虚拟身份为关联虚拟身份,并称为初始关联组。图3为一初始关联组,是通过百度网盟用户ID 9E304CC9357C1E000 9336A1EB49E0E86:FG= 1进行虚拟身份绑定的。

IMJaccard=⑴

对于初始数据列表:

If第k行与第m行的推广联盟种类与推广联盟值相同(0 km= n)则A[ k] [ m] = 0.5 ;

算法1关联剖析算法

新建一个n*n关联度矩阵A,初始值为0;这里矩阵A为上三角矩阵;

2.3相似度计算

通过研究发现,cookie有肯定的有效期,且可以被清空,如此用户I将重新分配;或者用户在不一样的设施进行上网,这就出现同一个人将分配不一样的用户ID,如此的大家也将构建的多个虚拟身份画像原型。另外,同一个人对用的用户ID所关联的虚拟身份可能不尽相同,为了使得构建的原型的愈加全方位,计算上一节所构建的原型之间的相似系数,计算公式使用的是改进的Jaccard相似系数,如下所示:

以下为关联剖析算法:

[k][in]=1

对于所有些j,k,m,IfA[[][k]=1,A[k][m] =1则A[[] [m]二1;

找出所有用户组集合A1、A2、…、Ak,每一个用户组集合满足:

1)元素由序号组成,且大于0小于n;

2)对于任意x,y是该集合,A[x][y]=1,(假设xy).

2.2关联剖析

通过2.l节的关联绑定后,构建了一张虚拟身份关系网大图4,该大图可能包含重复的信息与不准确的信息,由此大家需要预设一些关联剖析规则,进步健全大图信息,最后对虚拟身份画像进行特点描述。

通过第l节介绍大家知晓,推广联盟用户I跟设施、浏览器有关,并由这部分原因决定;当不一样的用户用同一台设施的相同浏览器时,同一关联组中将出现同一网站的不同账号。如图5所示,csdn网站的不同账号Jackcatlll与tina是同一关联组,这样的情况下,将没办法确定高兴网账号547687927@qq. cm与什么cdn账号关联。另外同一用户用不一样的设施或不一样的浏览器访问网站时,这部分用户I也会不同,这样的情况可能出现某网站账号(如csdn账号tina)出目前不一样的关联组。如图6所示。

图6同一用户不同账号被分到不一样的关联组示意图

为知道决上述问题,第一大家引人关联度的概念。

概念1关联度不同虚拟账号之间的紧密程度称为关联度。关联度的取值范围为[0,l]。不同虚拟账号之间初始的关联度为0;若两个虚拟账号关联度为l则表示这两个虚拟账号是同一用户;关联度为l时具备传递性;即若虚拟竞价推广账户A与虚拟账号B之间关联度为l,虚拟竞价推广账户A与虚拟账号C之间关联度为l,则虚拟账号B与虚拟账号C之间的关联度也为l。

对于所有A[k][m] =0.5,

I初始数据列表中第k行与第m行的时间与IP相同,则A

下面,引人以下规则:

1)初始设置关联组内的虚拟账号之间的关联度记为0.5。

2)关联组中同一时间同一IP获得的虚拟账号之间的关联度记为l所有相互之间关联度为l的虚拟账号组成不同用户组。

3)不同用户组中,存在两个及以上相同虚拟账号的,断定为同一用户组,并合并这部分组。

反复运用规则l)〜3)对大图进更新,直到不满足条件为止。至此可以得到用户组群(虚拟账号之间的关联度为l)和剩下的关联组群(虚拟账号之间的关

联度为0.5)。用户组群中每一个用户组内不同虚拟身份大家可以认定为同一画像,从而构建虚拟身份画像原型以下简称原型)。

图l推广联盟原理图

mm((,,)

这里的X、Y表示为不同虚拟身份画像原型。X=!*1,*2,…,丨,由个虚拟账号组成,表示原型X第^个虚拟账号;Y=丨,由m个虚拟账号组成,^表示原型Y的第A个虚拟账号;当X、Y之间的/Mjaowd相似系数超越某阈值,大家认定X、Y原型为同一原型,将X、Y原型合并,取XUY,组成新原型。

文章部分源于互联网!由(http://www.gglmw.cn)整理编辑!更多关于:在推广联盟中虚拟身份用户画像办法研究(上)!有关文章推荐阅读:

图4合并关联组

2虚拟身份画像模型

通过第l节的介绍,大家可以以推广联盟用户I为突破口,串并出关联的虚拟身份,然后通过设定的关联剖析规则,归整出身份属性(虚拟账号),并通过持续的迭代更新,健全身份特点刻画模型。基于推广联盟的虚拟身份画像模型如图2所示。该模型构建过程分为两个主要过程:关联绑定、关联剖析。

图2基于推广联盟的虚拟身份画像模型

图3初始关联组

推广联盟间虚拟身份绑定打造在推广联盟内虚拟身份关联绑定的基础上,同一时间同一I地址上抓取的cookie信息中包含不同推广联盟用户ID,则可以将这部分推广联盟用户I对应的初始关联组合并,形成合并关联组。图4为一合并关联组,因为凤凰博客网既用百度网盟,也用了淘宝网盟,通过凤凰博客账号jackmanlll访问该网站,抓取的cookie信息中既包含百度网盟用户ID,又包含淘宝网盟用户ID,从而可将这两个用户I对应的初始关联组合并,进而可知淘宝账号Jackman与csdn账号jackcatlll为关联账号。经过关联绑定形成的组统称为关联组。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章