基于标签的模糊匹配微博人脉挖掘算法
发布时间:2021-06-25 21:15
继博客这种社交网络之后微博迅速崛起。近几年来,微博的发展成爆炸式增长,状态信息更新频繁、信息传播迅速。现在微博用户数量之多,微博要在社交网络中发展下去,对微博数据进行分析成为了十分关注的研究方向。高效、快速的获取微博数据对微博的分析有重要的参考价值。标签是一种以用户为中心的Web2.0技术。这些年来越来越多的网站已经开始利用标签信息进行个性化推荐。在新浪微博中,用户可以给自己设定特定的标签来表达自己的兴趣爱好,系统可以根据用户设定的标签为用户推荐其有相同爱好的人,相比于传统的标签推荐,微博中基于标签为用户进行推荐节省了更多的时间和资源。同样我们可以根据用户设定的标签在微博领域的竞争中挖掘同类人,即有着同一兴趣爱好的用户,这不仅有利于微博企业了解特定领域用户的行为,而且能够为这领域的用户提供个性化服务,能够进行精准的广‘告投放,分析信息在这类人群中的传播速度等。本文的主要研究工作有:首先,阐述了论文的研究背景和研究意义,介绍了微博及其发展现状,数据挖掘概述及网络爬虫技术,包括通用网络爬虫和聚焦网络爬虫,新浪微博基于API的数据获取技术。其次,介绍标签系统,并在此基础上提出了基于标签模糊匹...
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 微博及其发展现状
1.3.1 微博发展现状
1.3.2 新浪微博的功能和特点
1.4 本文的研究内容
1.5 论文的主要创新点
第二章 微博数据获取技术
2.1 数据挖掘综述
2.2 网络爬虫技术
2.2.1 通用网络爬虫
2.2.2 聚焦网络爬虫
2.3 基于API的数据获取技术
2.4 本章小结
第三章 基于标签的模糊匹配算法
3.1 标签和标签系统
3.1.1 标签
3.1.2 标签系统
3.2 标准库的建立
3.3 模糊匹配
3.3.1 模糊匹配的思想
3.3.2 模糊匹配方法
3.4 基于标签的模糊匹配人脉挖掘算法
3.5 实验结果
3.6 本章小结
第四章 微博网络结构特性
4.1 复杂网络基本参数
4.1.1 节点度和度分布
4.1.2 平均路径长度和直径
4.1.3 聚类系数
4.1.4 复杂网络基本拓扑模型
4.2 微博网络特性
4.2.1 微博数据采集
4.2.2 微博网络属性
4.3 本章小结
第五章 总结与展望
参考文献
攻读硕士学位期间参与的科研项目
致谢
【参考文献】:
期刊论文
[1]基于特征加权模糊模板匹配的字符识别[J]. 朱颢东,李红婵. 兰州理工大学学报. 2013(01)
[2]国内微博研究的发展与机遇[J]. 孙晓莹,李大展,王水. 情报杂志. 2012(07)
[3]新浪微博中的“权威”与“人气”:以社会网络分析为方法[J]. 宋恩梅,左慧慧. 图书情报知识. 2012(03)
[4]基于微博网络的信息传播模型[J]. 郑蕾,李生红. 通信技术. 2012(02)
[5]字符串模糊匹配算法的探讨[J]. 王婷婷. 现代计算机(专业版). 2012(01)
[6]新浪微博数据挖掘方案[J]. 廉捷,周欣,曹伟,刘云. 清华大学学报(自然科学版). 2011(10)
[7]微博研究综述[J]. 闫幸,常亚平. 情报杂志. 2011(09)
[8]网络爬虫技术研究[J]. 于成龙,于洪波. 东莞理工学院学报. 2011(03)
[9]一种新的基于全拼的模糊匹配算法[J]. 姚佰承,张以成. 通信技术. 2011(06)
[10]基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J]. 平亮,宗利永. 图书情报知识. 2010(06)
硕士论文
[1]确定性小世界网络模型及搜索策略研究[D]. 彭遨员.湖南师范大学 2012
[2]基于内容的社会标签推荐技术研究[D]. 刘志丽.哈尔滨工程大学 2012
[3]新浪微博的网络舆情分析研究[D]. 张岚岚.华东师范大学 2011
[4]基于HNC的汉语句子相似度算法的研究[D]. 史燕.江苏大学 2009
[5]面向主题的网络爬虫设计与实现[D]. 刘喜亮.湖南大学 2009
[6]基于模糊集理论的关联规则数据挖掘研究[D]. 张诚.安徽大学 2007
本文编号:3249961
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 微博及其发展现状
1.3.1 微博发展现状
1.3.2 新浪微博的功能和特点
1.4 本文的研究内容
1.5 论文的主要创新点
第二章 微博数据获取技术
2.1 数据挖掘综述
2.2 网络爬虫技术
2.2.1 通用网络爬虫
2.2.2 聚焦网络爬虫
2.3 基于API的数据获取技术
2.4 本章小结
第三章 基于标签的模糊匹配算法
3.1 标签和标签系统
3.1.1 标签
3.1.2 标签系统
3.2 标准库的建立
3.3 模糊匹配
3.3.1 模糊匹配的思想
3.3.2 模糊匹配方法
3.4 基于标签的模糊匹配人脉挖掘算法
3.5 实验结果
3.6 本章小结
第四章 微博网络结构特性
4.1 复杂网络基本参数
4.1.1 节点度和度分布
4.1.2 平均路径长度和直径
4.1.3 聚类系数
4.1.4 复杂网络基本拓扑模型
4.2 微博网络特性
4.2.1 微博数据采集
4.2.2 微博网络属性
4.3 本章小结
第五章 总结与展望
参考文献
攻读硕士学位期间参与的科研项目
致谢
【参考文献】:
期刊论文
[1]基于特征加权模糊模板匹配的字符识别[J]. 朱颢东,李红婵. 兰州理工大学学报. 2013(01)
[2]国内微博研究的发展与机遇[J]. 孙晓莹,李大展,王水. 情报杂志. 2012(07)
[3]新浪微博中的“权威”与“人气”:以社会网络分析为方法[J]. 宋恩梅,左慧慧. 图书情报知识. 2012(03)
[4]基于微博网络的信息传播模型[J]. 郑蕾,李生红. 通信技术. 2012(02)
[5]字符串模糊匹配算法的探讨[J]. 王婷婷. 现代计算机(专业版). 2012(01)
[6]新浪微博数据挖掘方案[J]. 廉捷,周欣,曹伟,刘云. 清华大学学报(自然科学版). 2011(10)
[7]微博研究综述[J]. 闫幸,常亚平. 情报杂志. 2011(09)
[8]网络爬虫技术研究[J]. 于成龙,于洪波. 东莞理工学院学报. 2011(03)
[9]一种新的基于全拼的模糊匹配算法[J]. 姚佰承,张以成. 通信技术. 2011(06)
[10]基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J]. 平亮,宗利永. 图书情报知识. 2010(06)
硕士论文
[1]确定性小世界网络模型及搜索策略研究[D]. 彭遨员.湖南师范大学 2012
[2]基于内容的社会标签推荐技术研究[D]. 刘志丽.哈尔滨工程大学 2012
[3]新浪微博的网络舆情分析研究[D]. 张岚岚.华东师范大学 2011
[4]基于HNC的汉语句子相似度算法的研究[D]. 史燕.江苏大学 2009
[5]面向主题的网络爬虫设计与实现[D]. 刘喜亮.湖南大学 2009
[6]基于模糊集理论的关联规则数据挖掘研究[D]. 张诚.安徽大学 2007
本文编号:3249961
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3249961.html