网络空间主体虚拟身份映射算法研究
发布时间:2022-10-17 14:53
随着社交网络的兴起与普及,社交网络与人们的生活联系愈发紧密,与社交网络相关的各类研究也在不断的扩展和深化。社交网络的多样化和差异化使得单一社交网络已无法满足人们需求,为享受不同社交平台提供的个性化服务,越来越多的用户开始在不同平台注册账号,在互联网上拥有多个虚拟身份。但由于不同社交网络间的信息并不互通,虚拟身份之间缺乏有效关联,在单一社交网络中只能获取片面的信息,无法形成数据的汇聚融合,因此亟需要一种能够在不同虚拟身份间建立“沟通桥梁”的科学方法。准确的虚拟身份映射可以为诸多科学研究提供支持,如刻画完整的用户画像、实现精准的好友推荐等。综上所述,虚拟身份映射研究具有广泛的研究价值,是一项十分有意义的课题。目前虚拟身份映射方面的研究主要是针对虚拟身份的属性,即用户在注册账号或完善个人资料时所填写的个人信息。但由于社交平台之间存在差异,不同平台间的用户属性鲜有交叉重叠,基于多用户属性的映射方法往往局限于少数社交平台。另一方面,基于的单一属性的映射方法,由于仅针对多数平台共存的单一属性进行研究,往往具有较好的适用性。但由于单一属性特征对用户的识别能力有限,算法在提升应用扩展性的同时牺牲了识别...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.1.1 课题研究的背景
1.1.2 课题研究的目的和意义
1.2 国内外研究现状
1.2.1 基于用户属性的虚拟身份映射算法
1.2.2 基于用户行为的虚拟身份映射算法
1.2.3 基于社交网络拓扑结构的虚拟身份映射算法
1.2.4 基于多维信息的虚拟身份映射算法
1.3 本文的主要研究内容
1.4 论文组织结构
第2章 相关理论基础
2.1 字符串相似度比较方法
2.1.1 最长公共子串
2.1.2 最长公共子序列
2.1.3 编辑距离
2.1.4 杰卡德系数
2.2 短文本相似度比较方法
2.2.1 余弦相似度
2.2.2 TF-IDF
2.2.3 Word2Vec
2.3 相关分类模型
2.3.1 逻辑回归
2.3.2 SVM
2.3.3 决策树
2.3.4 随机森林
2.4 评价指标
2.5 本章小结
第3章 虚拟身份数据集构建
3.1 数据来源
3.2 数据获取
3.3 数据内容及统计分析
3.3.1 用户属性概述
3.3.2 字符串属性
3.3.3 半结构化属性
3.3.4 文本属性
3.4 数据预处理
3.4.1 缺失值与异常值处理
3.4.2 数据格式处理
3.4.3 匿名化处理
3.5 数据存储
3.6 本章小结
第4章 基于特征分类的属性相似度算法及实验
4.1 虚拟身份属性相似度算法
4.1.1 字符串属性相似度算法
4.1.2 半结构化属性相似度算法
4.1.3 文本属性相似度算法
4.1.4 异构属性相似度算法
4.2 实验及分析
4.2.1 字符串属性相似度计算结果分析
4.2.2 半结构化属性相似度计算结果分析
4.2.3 文本属性相似度计算结果分析
4.2.4 异构属性相似度计算结果分析
4.3 本章小结
第5章 虚拟身份映射生成算法及实验
5.1 虚拟身份映射生成算法
5.2 实验设计
5.3 实验结果分析
5.3.1 分类模型比较
5.3.2 区分效果评估
5.3.3 输入参数比较
5.3.4 分类参数比较
5.3.5 同类算法比较
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
【参考文献】:
期刊论文
[1]一种基于用户轨迹的跨社交网络用户身份识别算法[J]. 陈鸿昶,徐乾,黄瑞阳,程晓涛,吴铮. 电子与信息学报. 2018(11)
[2]基于信息熵的跨社交网络用户身份识别方法[J]. 吴铮,于洪涛,刘树新,朱宇航. 计算机应用. 2017(08)
[3]跨社交网络的实体用户关联技术研究[J]. 罗梁,王文贤,钟杰,王海舟. 信息网络安全. 2017(02)
[4]基于用户名特征的用户身份同一性判定方法[J]. 刘东,吴泉源,韩伟红,周斌. 计算机学报. 2015(10)
[5]基于多属性决策的社交网络用户识别(英文)[J]. 叶娜,张银亮,董丽丽,边根庆,Enjie LIU,Gordon J.Clapworthy. 中国通信. 2013(12)
硕士论文
[1]跨社交网络用户身份链接算法研究[D]. 卢思变.电子科技大学 2018
[2]多社交网络用户身份识别算法研究[D]. 孟波.大连理工大学 2015
本文编号:3692278
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.1.1 课题研究的背景
1.1.2 课题研究的目的和意义
1.2 国内外研究现状
1.2.1 基于用户属性的虚拟身份映射算法
1.2.2 基于用户行为的虚拟身份映射算法
1.2.3 基于社交网络拓扑结构的虚拟身份映射算法
1.2.4 基于多维信息的虚拟身份映射算法
1.3 本文的主要研究内容
1.4 论文组织结构
第2章 相关理论基础
2.1 字符串相似度比较方法
2.1.1 最长公共子串
2.1.2 最长公共子序列
2.1.3 编辑距离
2.1.4 杰卡德系数
2.2 短文本相似度比较方法
2.2.1 余弦相似度
2.2.2 TF-IDF
2.2.3 Word2Vec
2.3 相关分类模型
2.3.1 逻辑回归
2.3.2 SVM
2.3.3 决策树
2.3.4 随机森林
2.4 评价指标
2.5 本章小结
第3章 虚拟身份数据集构建
3.1 数据来源
3.2 数据获取
3.3 数据内容及统计分析
3.3.1 用户属性概述
3.3.2 字符串属性
3.3.3 半结构化属性
3.3.4 文本属性
3.4 数据预处理
3.4.1 缺失值与异常值处理
3.4.2 数据格式处理
3.4.3 匿名化处理
3.5 数据存储
3.6 本章小结
第4章 基于特征分类的属性相似度算法及实验
4.1 虚拟身份属性相似度算法
4.1.1 字符串属性相似度算法
4.1.2 半结构化属性相似度算法
4.1.3 文本属性相似度算法
4.1.4 异构属性相似度算法
4.2 实验及分析
4.2.1 字符串属性相似度计算结果分析
4.2.2 半结构化属性相似度计算结果分析
4.2.3 文本属性相似度计算结果分析
4.2.4 异构属性相似度计算结果分析
4.3 本章小结
第5章 虚拟身份映射生成算法及实验
5.1 虚拟身份映射生成算法
5.2 实验设计
5.3 实验结果分析
5.3.1 分类模型比较
5.3.2 区分效果评估
5.3.3 输入参数比较
5.3.4 分类参数比较
5.3.5 同类算法比较
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
【参考文献】:
期刊论文
[1]一种基于用户轨迹的跨社交网络用户身份识别算法[J]. 陈鸿昶,徐乾,黄瑞阳,程晓涛,吴铮. 电子与信息学报. 2018(11)
[2]基于信息熵的跨社交网络用户身份识别方法[J]. 吴铮,于洪涛,刘树新,朱宇航. 计算机应用. 2017(08)
[3]跨社交网络的实体用户关联技术研究[J]. 罗梁,王文贤,钟杰,王海舟. 信息网络安全. 2017(02)
[4]基于用户名特征的用户身份同一性判定方法[J]. 刘东,吴泉源,韩伟红,周斌. 计算机学报. 2015(10)
[5]基于多属性决策的社交网络用户识别(英文)[J]. 叶娜,张银亮,董丽丽,边根庆,Enjie LIU,Gordon J.Clapworthy. 中国通信. 2013(12)
硕士论文
[1]跨社交网络用户身份链接算法研究[D]. 卢思变.电子科技大学 2018
[2]多社交网络用户身份识别算法研究[D]. 孟波.大连理工大学 2015
本文编号:3692278
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3692278.html