互联网用户身份同一性判定若干关键技术研究
发布时间:2018-04-03 18:47
本文选题:互联网 切入点:用户身份 出处:《国防科学技术大学》2015年博士论文
【摘要】:随着互联网及其应用的快速发展,同一用户通常会在不同的网络应用中注册多个不同账户,且可能提供不同的身份信息。互联网中多个身份信息的同一性判定具有重要的现实意义。从信息安全的角度看,不良用户可能利用多个匿名账户进行恶意行为,而用户身份同一性判定能够关联网络账户,降低安全隐患。在商业领域,此项研究也可以用于客户分析、决策支持等。本文针对同一用户或所有者注册不同账户和提供不同身份信息的多种场景,分别研究互联网用户身份同一性判定的若干关键技术,主要工作包括:1.对于同一用户在不同的网络应用中提供不尽相同的身份信息的同一性判定,提出了互联网账户注册身份信息的同一性匹配方法。本文首先考虑标识属性的一一对应关系,分析了注册身份信息的模式相关匹配方法。考虑到模式相关匹配方法删减非共有标识属性信息的局限性,故本文重点研究了注册身份同一性的二部图匹配方法。忽略标识属性的语义对应关系,根据两个账户注册信息建立完全加权二部图,以标识属性的相似度作为边的权重。进而获取该二部图的扩展最大权匹配,以边权重之和作为两个账户注册身份信息的相似度,即身份同一性的概率,从而实现两个账户注册身份信息的同一性判定。新浪和腾讯上的真实微博数据集的实验验证了本文提出的身份同一性匹配方法的有效性。2.针对账户注册身份信息不可用(不完整或部分虚假)的情况,提出了一种基于账户名多维特征分析的身份同一性验证及检索方法。首先,对账户名数据集按长度、特殊符使用、数字符使用、字符输入模式、字符组合模式和英文字符串独特性等若干维度分别进行统计,得到反映用户命名习惯的命名特征的概率分布。更进一步,考虑到数据集中每一账户名均关联一个电子邮箱名,而邮箱名的前缀也是该用户的账户名,将两个账户名的变化在上述维度上进行同样的统计分析,得到各维度上用户更名特征的概率分布。在分析两账户名的命名特征时,特征出现的概率越低(命名特征越罕见),若两账户在该特征上相似则命名特征同一性的可信度越高;在分析两账户名的更名特征时,特征出现的概率越高则表示多数用户采用此类更改模式变更账户名,因而更名特征同一性的可信度越高。最后,运用可信度理论得到命名和更名特征的综合可信度,通过与阈值对比便可用于验证不同账户是否归属同一用户,也可以用于对指定账户名在候选账户名集合中检索同一用户的其他账户名。在4800万真实账户名及其邮箱名的成对数据集上的实验表明,上述方法能验证和检索账户名的同一性。3.围绕互联网同一所有者操控多个账户而构成傀儡账户群体的情况,提出了一种基于账户评论情感倾向分析及随机游走的疑似傀儡账户群体发现方法。首先,从各账户的评论文本中提取支持、中立、反对的情感词汇,分析它们对话题序列的情感倾向,运用余弦相似度方法度量各个账户之间的情感倾向相似度,并融入评论的时间因素,建立情感倾向相似网络。接着,从该网络中出入度最高的节点出发,按照各边权重概率进行随机游走,不断调整各经过边的权重,找出联系密切的账户;经选择不同出发点的多轮随机游走,使得群体内部边权重显著增强。最后对精化后的网络,应用GN、BGLL和COPRA方法得到疑似傀儡账户及其群体结构,并分析了傀儡账户群体结构的层次性和重叠性。凤凰网评论数据集上的实验表明,本方法较已有BU方法具有更高的准确率和更清晰的疑似傀儡账户群体结构。4.在已知某一账户为傀儡账户的情况下,基于账户序列的频繁二项集挖掘和评论特征的一致性假设检验,提出了一种与已知账户同源的傀儡账户发现方法。首先,从已知傀儡账户出发,对相关话题评论中出现的账户序列进行频繁二项集挖掘,构建出该已知账户的自我网络。接着根据该网络中相邻账户发布的评论在时间窗口中突发共现的频繁程度,对自我网络中连接边权重进行加权调整。进而抽取各账户发布评论的时间段特征、时间间隔特征以及相应文本的分句长度、功能词、标点符号使用等写作特征,通过一致性假设检验方法对自我网络中连接边进行筛选剪枝。最后结合网络中节点连接结构的紧密性,度量了各邻居账户与已知账户的亲密度。亲密度越高,为同源傀儡账户的概率也越高。凤凰论坛数据集上的实验验证了本文方法能够有效查找在线社交网络中的同源傀儡账户。
[Abstract]:......
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP393.08
【相似文献】
相关期刊论文 前9条
1 李毅华;用更改账户名的方法来保障系统安全[J];计算机安全;2004年02期
2 郑宝宝;;Google Talk 群聊照样畅所欲言[J];电脑迷;2006年12期
3 李毅华;用更改账户名的方法来保障系统安全,
本文编号:1706462
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1706462.html