一类社交网络的分析及其算法

发布时间:2022-07-12 19:02
  随着互联网时代的来临,计算机计算能力与移动网络技术的不断提高,社交网络在近些年来得到了迅猛发展,如何根据网站的历史数据,统计分析用户的特性特点,抓住用户痛点,不断改进现有推荐系统,向用户推荐更加优质的内容,是各大社交网络的首要任务之一。本文对网络爬虫抓取的社交网站数据进行分析,并结合所爬取数据特点提出了一种混合推荐算法。具体内容如下:1.选取了当今国内发展迅速且规模最大的Q&A社交网站知乎作为研究对象,首先爬取该网站的用户数据,为此设计了基于Python的多线程爬虫策略,利用种子用户进行3层的广度遍历。用户数据包括:用户基本信息,用户的回答数,用户获得的赞同数和感谢数,用户关注的人和关注用户的人的基本信息,用户回答过的问题,以及用户关注的话题。然后设计了专门SQlite数据库用来存储爬虫数据,一共收集了2万名用户的相关信息。2.分析所爬取数据的各类统计指标,根据指标解读该网站的用户特性,整个用户网络的连接紧密度,还有其长尾现象。3.根据第二部分所获取的用户数据特性,为了给用户推荐更加优质的内容,提出了基于协同过滤推荐算法和基于标签的混合推荐算法,并且利用上述爬取的数据对该混合算法进行性... 

【文章页数】:39 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 社交网络研究背景
    1.2 社交网络下的推荐算法的研究现状
    1.3 研究内容
第二章 知乎数据爬取与分析
    2.1 用户信息获取表示及建模
    2.2 知乎的数据采集和和分析
        2.2.1 选取特征数据建立数据库
        2.2.2 数据爬虫
        2.2.3 数据分析
    2.3 本章总结
第三章 基于知乎提出的混合推荐算法
    3.1 传统推荐算法
    3.2 基于协同过滤和标签的混合推荐算法
第四章 算法性能检验
    4.1 常用测评指标
    4.2 实验设计及结果
        4.2.1 数据集
        4.2.2 实验设计
        4.2.3 测评指标
        4.2.4 实验结果
    4.3 实验结果分析
第五章 结论与展望
    5.1 主要结论
    5.2 研究展望
在学期间的研究成果
参考文献
致谢



本文编号:3659672

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3659672.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户240a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com