基于人物相似度的互联网络人物关系分析方法研究

发布时间:2023-02-05 11:55
  作为全球最大的职业社交网络平台,领英在人们的职业生涯中扮演着重要的角色,成为了用户之间沟通交流的重要途径之一。在领英上,用户通过完善资料、分享经历以及拓展人脉等方式来进行彼此之间的交互联系,从而使得领英社交平台上蕴含了大量真实的用户信息。利用这些信息对领英用户之间的关系进行分析,挖掘用户数据背后的信息,将有助于掌握社会各领域人才的分布情况,实现有针对性的人才需求信息投放等目的。本文基于领英社交网络平台的用户数据集,提出了基于人物相似度的用户关系分析方法,并运用于人物关系分析的课题中。本文主要的工作以及贡献有以下几个方面:(1)构建了用户的相似性关系网络。领英用户具有各种不同的属性,对于每一种不同的属性,计算用户之间在该属性上的相似度,然后以用户为节点,以用户之间属性上的相似性为边构建了用户相似性关系网络,进而将领英用户关系分析问题转化为复杂网络分析问题,为后续研究打下基础。(2)为了更有效地划分用户群体,提升用户的分类效果,本文提出了基于图嵌入的用户分类方法。该方法选取了用户的词属性和文本属性作为属性特征,在此基础上,引入图嵌入算法在用户的相似性关系网络中挖掘用户的拓扑属性,并以此作为...

【文章页数】:87 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 用户社团发现研究
        1.2.2 用户相似性分析研究
        1.2.3 用户分类研究
        1.2.4 多层关系网络研究
    1.3 论文的主要工作与贡献
    1.4 论文章节安排
第二章 相关理论基础和方法
    2.1 人物属性特征化描述
    2.2 文本特征向量化
        2.2.1 词袋模型
        2.2.2 词向量模型
    2.3 隐含狄利克雷分布
    2.4 主成分分析算法
    2.5 分类方法
        2.5.1 支持向量机算法
        2.5.2 K近邻算法
        2.5.3 决策树算法
        2.5.4 随机森林算法
    2.6 本章小结
第三章 基于图嵌入的用户分类方法研究
    3.1 引言
    3.2 用户相似度关系网络构建
        3.2.1 基于词属性的用户词特征向量化
        3.2.2 基于文本属性的用户文本特征向量化
        3.2.3 基于人物属性相似度的用户关系网络构建
    3.3 基于图嵌入的用户关系挖掘
        3.3.1 基于图嵌入的用户拓扑特征向量构建
        3.3.2 特征向量组合
    3.4 测试与分析
        3.4.1 实验数据
        3.4.2 实验流程
        3.4.3 实验衡量指标
        3.4.4 实验结果和分析
    3.5 本章小结
第四章 基于多层网络的用户关系分析方法研究
    4.1 引言
    4.2 多层用户关系网络系统构建
    4.3 用户多层关系网络聚合方法研究
        4.3.1 基于拓扑结构的用户多层关系网络聚合方法
        4.3.2 基于层次分析的用户多层关系网络聚合方法
        4.3.3 基于层间相似度的用户多层关系网络聚合方法
    4.4 权重关系图的社团划分算法
        4.4.1 基于权重图的Girvan–Newman算法
        4.4.2 基于权重图的Fast-Newman算法
        4.4.3 基于权重图的Louvain算法
    4.5 测试与分析
        4.5.1 实验数据
        4.5.2 实验流程
        4.5.3 实验衡量指标
        4.5.4 实验结果和分析
    4.6 本章小结
第五章 工作总结与展望
    5.1 工作总结
    5.2 工作展望
致谢
参考文献
攻读硕士学位期间取得的研究成果



本文编号:3734927

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3734927.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5fe6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com