微博信息传播技术研究
发布时间:2021-08-06 17:25
随着互联网进入web2.0时代,人们之间的交互性更加紧密,信息的传播也更加便捷。当前Facebook、twitter、新浪微博等社交媒体以爆炸式的发展壮大,冲击了传统的媒体形式,同时也带来了更多的学术问题,开创了新的学术领域,对科技工作者提出了新的要求。本文以新浪微博为实验数据来源,重点研究了在新形式新背景下,社会计算中涉及到的信息传播分析技术。首先介绍了课题的背景意义,网络已经进入信息化、社交化时代。大量的草根民众创造了更丰富精彩的媒体内容,更加扩充着本就海量的网络信息。面对新的形式,亟待需要新的技术与手段解决现实问题。接着介绍了新浪微博的有关数据获取的方法,我们可以通过新浪自身的API获取数据或是模仿web1.0时代编写网页爬虫。该网页爬虫属于―垂直‖爬虫,针对特定领域进行爬取。这里详细给出了模拟登陆、信息抽取的相关实现介绍。然后重点介绍了在新浪微博上信息的传播情况分析。信息在新浪微博上以树形的方式进行传播。本文给出了两种算法对这种树形结构进行还原生成。在该算法的指导下,笔者爬取并分析了大量的新浪微博信息的传播树,并给出相应的统计分析结果。最后介绍了基于上述技术实现的舆情监控系统。...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
抓取浏览器登陆新浪微博流程截图
哈尔滨工业大学工学硕士学位论文图 2-2 抓取浏览器登陆新浪微博流程截图上图 2-2 为通过 httpwatch 插件观察到的通过 IE 浏览器登陆新浪微博,所需要访问的一些 URL 地址等。为了实现模拟登陆,要对立面的每一条 URL 进行分析,分析其具体作用,以及执行流程。需要的参数有哪些等。由于新浪微博是新浪的一个子公司,因此新浪微博的客户信息在与新浪的其他产品的联通性上做了很多工作。包括采用新浪母公司的单点登录等技术。这使得分析工作难度加大,需要更多的执行步骤。
群中的传播也是这种情况,且更直观,覆盖范围更加高效,大大缩小了信息的传播成本。生成算法博转发列表的传播树生成算法的信息传播是以用户间的关注关系达成的。例如用户。经过他的粉丝逐级的转发点评其消息。因此形成了而这种转发的树状结构并没有以树形结构呈现于网页手段将其还原出来。采用解析网页的方式获得一条微博的所有转发微博列处理是,最原始微博的转发列表可以获得全部的转发的转发,都算入其根结点内)。具体如图 3-1 所示,转发列表包括结点<B,C,D,E,F,G,H,I,J>。结点 B 为二括结点<E,F,G,H,I,J>。结点 F 为三级转发结点,其转,我们基于这样的情况,要对转发树的生成进行剪
【参考文献】:
期刊论文
[1]Web2.0环境下企业网络舆情传播过程的研究及实证分析[J]. 李纲,董琦. 情报科学. 2011(12)
[2]微博社区的谣言传播仿真研究[J]. 许晓东,肖银涛,朱士瑞. 计算机工程. 2011(10)
[3]网络舆情突发事件的生命周期原理及集群决策研究[J]. 谢科范,赵湜,陈刚,蔡文静. 武汉理工大学学报(社会科学版). 2010(04)
[4]网络舆情及社会性网络信息传播模式[J]. 顾明毅,周忍伟. 新闻与传播研究. 2009(05)
[5]博客网络中具有突发性的话题传播模型[J]. 赵丽,袁睿翕,管晓宏,贾庆山. 软件学报. 2009(05)
[6]面向网络舆情分析的实用关键技术概述[J]. 戴媛,程学旗. 信息网络安全. 2008(06)
本文编号:3326180
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
抓取浏览器登陆新浪微博流程截图
哈尔滨工业大学工学硕士学位论文图 2-2 抓取浏览器登陆新浪微博流程截图上图 2-2 为通过 httpwatch 插件观察到的通过 IE 浏览器登陆新浪微博,所需要访问的一些 URL 地址等。为了实现模拟登陆,要对立面的每一条 URL 进行分析,分析其具体作用,以及执行流程。需要的参数有哪些等。由于新浪微博是新浪的一个子公司,因此新浪微博的客户信息在与新浪的其他产品的联通性上做了很多工作。包括采用新浪母公司的单点登录等技术。这使得分析工作难度加大,需要更多的执行步骤。
群中的传播也是这种情况,且更直观,覆盖范围更加高效,大大缩小了信息的传播成本。生成算法博转发列表的传播树生成算法的信息传播是以用户间的关注关系达成的。例如用户。经过他的粉丝逐级的转发点评其消息。因此形成了而这种转发的树状结构并没有以树形结构呈现于网页手段将其还原出来。采用解析网页的方式获得一条微博的所有转发微博列处理是,最原始微博的转发列表可以获得全部的转发的转发,都算入其根结点内)。具体如图 3-1 所示,转发列表包括结点<B,C,D,E,F,G,H,I,J>。结点 B 为二括结点<E,F,G,H,I,J>。结点 F 为三级转发结点,其转,我们基于这样的情况,要对转发树的生成进行剪
【参考文献】:
期刊论文
[1]Web2.0环境下企业网络舆情传播过程的研究及实证分析[J]. 李纲,董琦. 情报科学. 2011(12)
[2]微博社区的谣言传播仿真研究[J]. 许晓东,肖银涛,朱士瑞. 计算机工程. 2011(10)
[3]网络舆情突发事件的生命周期原理及集群决策研究[J]. 谢科范,赵湜,陈刚,蔡文静. 武汉理工大学学报(社会科学版). 2010(04)
[4]网络舆情及社会性网络信息传播模式[J]. 顾明毅,周忍伟. 新闻与传播研究. 2009(05)
[5]博客网络中具有突发性的话题传播模型[J]. 赵丽,袁睿翕,管晓宏,贾庆山. 软件学报. 2009(05)
[6]面向网络舆情分析的实用关键技术概述[J]. 戴媛,程学旗. 信息网络安全. 2008(06)
本文编号:3326180
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3326180.html