基于SSD和时序模型的微博好友推荐系统的设计与实现
发布时间:2023-08-29 21:52
随着互联网的持续发展,在社交平台上进行交友聊天逐渐成为人们日常生活的一部分。用户每天都会产生海量数据,对这些数据信息进行爬取、分析,也是各社交平台中常见的商业行为。在社交应用平台中,由于用户产生的数据信息量大、复杂多变,导致商户无法有效、合理利用。因此,如何利用用户信息进行分析处理,优化平台的好友推荐策略是课题研究的主要内容。论文通过对微博用户群研究发现:对用户而言,考虑的推荐因素往往在发表的微博中,而图片能传达出的信息不亚于文字,并且兴趣爱好会随着时间而消逝。结合以上特点,通过使用目标检测技术提取图中信息,结合时序模型对提取结果做进一步时间处理,设计并实现了一个基于用户个人信息和图片信息的微博好友推荐系统。论文的主要工作如下:(1)微博用户数据集的获取:针对新浪微博这一社交平台,本文完成了基于Scrapy框架爬虫系统的实现。该系统采取了模拟登录手段解决微博用户身份认证的问题,使用代理池、Cookies池解决反爬虫的困扰,通过对微博中各页面的Ajax链接进行剖析,组建待爬URL,基于Scrapy框架设计爬虫代码以进行递归爬取,实现对用户个人资料、好友信息、微博数据的收集。(2)提出基于...
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 推荐系统国内外研究现状
1.2.2 好友推荐国内外研究现状
1.3 论文主要研究内容
1.4 论文组织结构
第二章 相关技术研究
2.1 爬虫技术概述
2.1.1 网络爬虫分类
2.1.2 网页搜索策略
2.1.3 网络爬虫架构与运行流程
2.1.4 分布式网络爬虫的工作原理
2.2 推荐系统相关算法
2.2.1 基于人口统计学的推荐
2.2.2 基于内容的推荐
2.2.3 基于协同过滤的推荐
2.2.4 基于混合模型的推荐
2.3 常用目标检测算法
2.3.1 R-CNN目标检测算法
2.3.2 Yolo目标检测算法
2.3.3 SSD目标检测算法
2.4 本章小结
第三章 基于Scrapy的微博用户数据爬取
3.1 概述
3.2 微博数据获取方法
3.3 网络爬虫的实现
3.3.1 模拟登录
3.3.2 源代码获取
3.3.3 好友信息爬取
3.3.4 用户信息爬取
3.3.5 微博信息爬取
3.4 数据处理
3.4.1 用户数据清洗
3.4.2 用户数据持久化
3.5 本章小结
第四章 基于SSD和时序模型的好友推荐算法
4.1 基于SSD和时序模型的好友推荐算法概述
4.2 目标检测SSD算法
4.2.1 目标检测SSD的设计理念
4.2.2 目标检测SSD的模型训练
4.3 训练数据集概述
4.4 基于人口统计学的好友推荐模块的设计
4.5 BSBT-FR模块的设计
4.5.1 构建用户兴趣向量
4.5.2 时序处理
4.5.3 构建用户-兴趣评分矩阵
4.6 实验与测评
4.6.1 实验环境与实验数据
4.6.2 实验评价标准
4.6.3 实验结果与分析
4.7 本章小结
第五章 基于SSD和时序模型算法的推荐系统的设计与实现
5.1 好友推荐系统需求分析
5.2 好友推荐系统设计
5.2.1 系统架构设计
5.2.2 系统运行模型设计
5.2.3 系统功能模块设计
5.2.4 数据库设计
5.3 核心功能模块的实现
5.3.1 图片文件预处理模块实现
5.3.2 好友推荐模块实现
5.4 好友推荐系统的应用案例
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 存在的问题与不足
6.3 未来研究展望
参考文献
致谢
攻读硕士期间发表的学术论文和科研情况
本文编号:3844357
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 推荐系统国内外研究现状
1.2.2 好友推荐国内外研究现状
1.3 论文主要研究内容
1.4 论文组织结构
第二章 相关技术研究
2.1 爬虫技术概述
2.1.1 网络爬虫分类
2.1.2 网页搜索策略
2.1.3 网络爬虫架构与运行流程
2.1.4 分布式网络爬虫的工作原理
2.2 推荐系统相关算法
2.2.1 基于人口统计学的推荐
2.2.2 基于内容的推荐
2.2.3 基于协同过滤的推荐
2.2.4 基于混合模型的推荐
2.3 常用目标检测算法
2.3.1 R-CNN目标检测算法
2.3.2 Yolo目标检测算法
2.3.3 SSD目标检测算法
2.4 本章小结
第三章 基于Scrapy的微博用户数据爬取
3.1 概述
3.2 微博数据获取方法
3.3 网络爬虫的实现
3.3.1 模拟登录
3.3.2 源代码获取
3.3.3 好友信息爬取
3.3.4 用户信息爬取
3.3.5 微博信息爬取
3.4 数据处理
3.4.1 用户数据清洗
3.4.2 用户数据持久化
3.5 本章小结
第四章 基于SSD和时序模型的好友推荐算法
4.1 基于SSD和时序模型的好友推荐算法概述
4.2 目标检测SSD算法
4.2.1 目标检测SSD的设计理念
4.2.2 目标检测SSD的模型训练
4.3 训练数据集概述
4.4 基于人口统计学的好友推荐模块的设计
4.5 BSBT-FR模块的设计
4.5.1 构建用户兴趣向量
4.5.2 时序处理
4.5.3 构建用户-兴趣评分矩阵
4.6 实验与测评
4.6.1 实验环境与实验数据
4.6.2 实验评价标准
4.6.3 实验结果与分析
4.7 本章小结
第五章 基于SSD和时序模型算法的推荐系统的设计与实现
5.1 好友推荐系统需求分析
5.2 好友推荐系统设计
5.2.1 系统架构设计
5.2.2 系统运行模型设计
5.2.3 系统功能模块设计
5.2.4 数据库设计
5.3 核心功能模块的实现
5.3.1 图片文件预处理模块实现
5.3.2 好友推荐模块实现
5.4 好友推荐系统的应用案例
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 存在的问题与不足
6.3 未来研究展望
参考文献
致谢
攻读硕士期间发表的学术论文和科研情况
本文编号:3844357
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3844357.html
最近更新
教材专著