基于推荐算法的微博个人数据可视化
发布时间:2022-03-12 07:08
微博已经成为了人们获取信息、分享观点的重要平台,海量数据背后蕴藏着巨大的学术研究价值。因此,本文以微博为研究对象,围绕微博数据的采集、挖掘、可视化进行研究,设计并实现基于推荐算法的微博个人数据可视化系统。本文中设计并实现了三个主要子系统:数据采集子系统、关系计算子系统、可视化展示子系统。数据采集子系统通过模拟登陆的方法来解决身份认证问题。关系计算子系统对原始数据进行处理转化为可视化数据。系统重点实现了微博用户关系计算模块,我们利用推荐算法来计算关系度用于衡量两个人之间的关系。子系统中还利用TF-IDF算法提取微博关键字。可视化子系统系统,可视化子系统由浏览器呈现数据挖掘结果。本文中采用柱状图、折线图、极坐标、地图、标签云以及关系图来呈现数据分析结果。本文中主要贡献和创新点包括:(1)设计并实现了微博数据采集、关系计算、个人信息可视化系统。搭建的系统实现了用户关系度的计算和微博用户分析的功能,为后续研究提供基础平台。同时在系统中我们使用Redis数据库作为数据处理的缓存,减少系统响应时间。(2)系统实现了利用推荐算法来衡量关系度,利用SVM算法进行模型建立,通过各个分类的概率来进行关系度...
【文章来源】:天津大学天津市211工程院校985工程院校教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 概述
1.1 背景介绍
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 课题简介
1.4 论文主要工作和组织结构
第2章 相关研究工作
2.1 推荐算法
2.1.1 基于内容的推荐算法
2.1.2 协同过滤推荐算法
2.1.3 混合推荐算法
2.1.4 其它推荐算法
2.2 TF-IDF算法
2.3 信息可视化
2.3.1 平行坐标可视化
2.3.2 图表可视化
2.3.3 地图可视化
2.3.4 标签云可视化
2.4 数据采集
2.4.1 通过微博API采集
2.4.2 通过网络爬虫采集
2.5 本章小结
第3章 推荐算法和TF-IDF算法的应用
3.1 基于内容的推荐算法在微博关系中的应用
3.1.1 算法基本原理
3.1.2 目标用户配置模板的建立
3.1.3 关系度计算
3.2 TF-IDF算法的应用
3.3 本章小结
第4章 系统设计与实现
4.1 需求分析
4.1.1 数据采集需求
4.1.2 数据处理与分析需求
4.1.3 可视化展示需求
4.2 系统架构设计
4.3 功能模块详细设计
4.3.1 数据库子系统
4.3.2 数据采集子系统
4.3.3 关系计算子系统
4.3.4 可视化展示子系统
4.4 本章小结
第5章 系统介绍与可视化展示
5.1 使用技术
5.1.1 FlaskWeb框架
5.1.2 MySQL数据库
5.1.3 Redis数据库
5.1.4 Echarts可视化组件
5.2 可视化展示
5.2.1 关系可视化
5.2.2 关系度分数可视化
5.2.3 地域分布可视化
5.2.4 微博发送时间可视化
5.2.5 性别可视化
5.2.6 关键词可视化
5.3 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
发表论文和参加科研情况说明
致谢
【参考文献】:
期刊论文
[1]面向微博主题的可视分析研究[J]. 王臻皇,陈思明,袁晓如. 软件学报. 2018(04)
[2]基于文本挖掘的微博文本情绪分析技术研究[J]. 戴天翔,岑鑫,柳珺文,王帅,欧阳帆. 科技资讯. 2017(07)
[3]基于时序行为的协同过滤推荐算法[J]. 孙光福,吴乐,刘淇,朱琛,陈恩红. 软件学报. 2013(11)
[4]基于项目流行度的协同过滤TopN推荐算法[J]. 郝立燕,王靖. 计算机工程与设计. 2013(10)
[5]国内微博研究综述[J]. 周金元,张莎莎,刘桂锋,王振. 情报杂志. 2013(09)
[6]大数据管理:概念、技术与挑战[J]. 孟小峰,慈祥. 计算机研究与发展. 2013(01)
[7]使用机器学习方法进行新闻的情感自动分类[J]. 徐军,丁宇新,王晓龙. 中文信息学报. 2007(06)
[8]从科学计算可视化到信息可视化[J]. 杨峰. 情报杂志. 2007(01)
[9]基于领域知识的个性化推荐算法研究[J]. 张丙奇. 计算机工程. 2005(21)
[10]个性化推荐算法设计[J]. 赵亮,胡乃静,张守志. 计算机研究与发展. 2002(08)
本文编号:3645840
【文章来源】:天津大学天津市211工程院校985工程院校教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 概述
1.1 背景介绍
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 课题简介
1.4 论文主要工作和组织结构
第2章 相关研究工作
2.1 推荐算法
2.1.1 基于内容的推荐算法
2.1.2 协同过滤推荐算法
2.1.3 混合推荐算法
2.1.4 其它推荐算法
2.2 TF-IDF算法
2.3 信息可视化
2.3.1 平行坐标可视化
2.3.2 图表可视化
2.3.3 地图可视化
2.3.4 标签云可视化
2.4 数据采集
2.4.1 通过微博API采集
2.4.2 通过网络爬虫采集
2.5 本章小结
第3章 推荐算法和TF-IDF算法的应用
3.1 基于内容的推荐算法在微博关系中的应用
3.1.1 算法基本原理
3.1.2 目标用户配置模板的建立
3.1.3 关系度计算
3.2 TF-IDF算法的应用
3.3 本章小结
第4章 系统设计与实现
4.1 需求分析
4.1.1 数据采集需求
4.1.2 数据处理与分析需求
4.1.3 可视化展示需求
4.2 系统架构设计
4.3 功能模块详细设计
4.3.1 数据库子系统
4.3.2 数据采集子系统
4.3.3 关系计算子系统
4.3.4 可视化展示子系统
4.4 本章小结
第5章 系统介绍与可视化展示
5.1 使用技术
5.1.1 FlaskWeb框架
5.1.2 MySQL数据库
5.1.3 Redis数据库
5.1.4 Echarts可视化组件
5.2 可视化展示
5.2.1 关系可视化
5.2.2 关系度分数可视化
5.2.3 地域分布可视化
5.2.4 微博发送时间可视化
5.2.5 性别可视化
5.2.6 关键词可视化
5.3 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
发表论文和参加科研情况说明
致谢
【参考文献】:
期刊论文
[1]面向微博主题的可视分析研究[J]. 王臻皇,陈思明,袁晓如. 软件学报. 2018(04)
[2]基于文本挖掘的微博文本情绪分析技术研究[J]. 戴天翔,岑鑫,柳珺文,王帅,欧阳帆. 科技资讯. 2017(07)
[3]基于时序行为的协同过滤推荐算法[J]. 孙光福,吴乐,刘淇,朱琛,陈恩红. 软件学报. 2013(11)
[4]基于项目流行度的协同过滤TopN推荐算法[J]. 郝立燕,王靖. 计算机工程与设计. 2013(10)
[5]国内微博研究综述[J]. 周金元,张莎莎,刘桂锋,王振. 情报杂志. 2013(09)
[6]大数据管理:概念、技术与挑战[J]. 孟小峰,慈祥. 计算机研究与发展. 2013(01)
[7]使用机器学习方法进行新闻的情感自动分类[J]. 徐军,丁宇新,王晓龙. 中文信息学报. 2007(06)
[8]从科学计算可视化到信息可视化[J]. 杨峰. 情报杂志. 2007(01)
[9]基于领域知识的个性化推荐算法研究[J]. 张丙奇. 计算机工程. 2005(21)
[10]个性化推荐算法设计[J]. 赵亮,胡乃静,张守志. 计算机研究与发展. 2002(08)
本文编号:3645840
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3645840.html