当前位置:主页 > 社科论文 > 新闻传播论文 >

基于微博平台的社交网络舆情分析方法

发布时间:2020-07-12 06:06
【摘要】:近年来,微博平台快速发展,逐渐形成一个很大的网络媒体。通过微博评论参与各种热门话题,能比传统媒体更早地做出话题检测,以此挖掘舆论观点的反应。针对大众话题互动背后的文本对象主题,分析其内在的语义相关性,不仅具有很高的理论研究价值,也存在着巨大的社会、经济价值。传统的话题检测方法主要适用于传统媒体的文本,对于处理微博短文本稀疏的结构效果不明显,论文提出了基于文本聚类的模型检测方法和主题分析模型。在该方法中,首先根据微博特有的数据结构,进行预处理。并针对数据稀疏的问题,基于词向量利用聚类算法来丰富数据结果信息。最后,在传统的潜在狄利克雷主题分配(LDA)模型基础上进行扩展。与传统算法相比较,论文提出的方法在新浪微博测试语料集上取得了更好的性能,效果优于单一的聚类算法或话题检测模型。在提出基于文本聚类和主题模型进行话题检测的基础上,又提出了基于Pagerank微博信息传播影响力评价模型,该模型可重点关注微博信息传输过程中数据结构的传输质量,从中总结出影响微博用户行为特征的三个方面,也即用户节点活跃度、用户节点受关注度、用户节点质量。最终将三者的加权平均值与微博节点的粉丝数量平衡后引入PageRank算法进行计算,经过比较发现,该方法优于传统PageRank网页排名方法。论文最后,通过对具体实例进行分析研究,设计实现了舆情分析原型系统,验证了论文提出的话题检测方法与影响力评估模型的可行性。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:G206
【图文】:

文本聚类,文本转换,自然语言,分析流程


图2.1文本聚类分析流程逡逑聚类分析的第一步,需要将自然语言文文本中的特征值抽取出来构造出特征要文本专业领域的知识进行参与,从出特征值矩阵。逡逑历了第一步的特征值抽取之后,就可W聚类算法通常考虑的方面不同,因而到不同的聚类结果。聚类算法一般考虑用模型的方法等。目前聚类算法的种小密度和全局参数考虑在内,但却没有均,因而会造成聚类质量的下降;基于达到终止条件形成有层次类别的效果;7逡逑

传播网络,节点图,信息,可视化


本节选取新浪微博社区@人民日报在2014年3月8日发布的有关马航MH370航班失联逡逑的信息为研究对象。该条微博信息的转发数量达到了二十二万,该微博下的评论数量超过了逡逑两万,是一个讨论和转发较为活跃的微博信息,图3.2为此微博信息在传播中的节点网络结逡逑构图:逡逑蠢逡逑.‘╁义希垮危澹悍义希义希В危澹В拷裕拷诼危义掀澹危苠澹檬″义希3?图3.2微博传播网络节点图逡逑W3.2中的每个节点代表一条微博信息,连线间的关系代表转发关系,该图表可视化地逡逑18逡逑

趋势图,变化趋势,实验结果,趋势


10逦20逦30逦40逦50逦60逦70逦80逦90逦100逡逑图3.6邋K值变化趋势逡逑图3.6是实验结果随着K值的改变而变化的趋势。不同实验数据集的大小不同,最合适逡逑的K值的大小也会改变。我们从上图中可W看出,最适宜本文中数据集的K=40。故本文下逡逑面的研究都是基于K=40的基础的。逡逑实验采用3.5.2节中介绍的评测标准作为相应算法的性能指标。对比结果如图3.7所示。逡逑0.7邋—I——WW -i逡逑0.6邋—邋IH逦逦——|H—逡逑0.5^逦■逦:邋^邋■HW逡逑I二=逡逑0邋9—逦\邋:邋....逦逦逦邋WKSm逡逑;M逦I.邋]邋.逦:?■邋I邋I逡逑准确率逦召回率逦f值逡逑图3.7邋LDA与本文算法性能测评对比逡逑W上实验数据可W得到W下结论:首先,相较于单纯的LDA算法,本论文提出的分析模逡逑型在各项性能指标上都有较大的提高。这主要是因为本文的算法考虑了微博数据自身结构化逡逑的信息,采用了基于特征扩展的技术,丰富了原始数据的特征信息。其次,引入微博信息中逡逑涉及的超文本连接中信息,可W较大的提高话题提取性能。在单一的LDA话题检测算法中,逡逑没有引入基于词向量的聚类技术,使得数据矩阵高度稀疏也是使得算法没能达到满意结果的逡逑原因。因此,本文算法中提出的基于引入微博数据结构化信息1^及聚类算法的话题检测方法,逡逑虽然增加了计算的复杂度

【相似文献】

相关期刊论文 前10条

1 梁丽雯;;网络舆情分析师或成就业香饽饽[J];金融科技时代;2014年01期

2 ;做好舆情分析是有效引导的前提[J];中国记者;2001年03期

3 杨玫;;舆情分析:图书馆为领导决策服务的新探索[J];图书馆论坛;2006年05期

4 宋占茹;;图书馆开展网络舆情分析工作初探[J];情报探索;2010年08期

5 何顺兰;王兴起;胡宏宇;姜明;;多媒体舆情分析系统设计与研究[J];杭州电子科技大学学报;2010年05期

6 颜建华;刘岩;傅黎犁;刘亚民;;基于网络的舆情分析系统及其应用研究[J];医学信息学杂志;2011年08期

7 侯文昌;;传媒新角色—舆情分析师的专业素养 “朝阳职业”四年成长史[J];中国记者;2011年09期

8 刘鹏飞;;“寻路”舆情分析师:一些心得,几点忠告[J];中国记者;2011年09期

9 刘岩;傅黎犁;颜建华;;医学情报研究机构开展舆情分析服务的实践[J];中华医学图书情报杂志;2012年01期

10 曹劲松;;政府形象传播的舆情分析[J];江海学刊;2012年03期

相关会议论文 前4条

1 宋占茹;;图书馆网络舆情分析工作新探[A];华北地区高校图协第二十四届学术年会论文(文章)汇编[C];2010年

2 何顺兰;王兴起;胡宏宇;姜明;;多媒体舆情分析系统设计与研究[A];浙江省电子学会2010学术年会论文集[C];2010年

3 孙江;;天津蓟县莱德商厦火灾信息发布、媒体报道及网络舆情分析[A];2013中国消防协会科学技术年会论文集[C];2013年

4 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

相关重要报纸文章 前10条

1 本报记者 降蕴彰;舆情分析师来了[N];经济观察报;2013年

2 福建三明学院 郑祥专;教育舆情分析须坚持“四性”[N];中国教育报;2009年

3 记者 王庆华;克旗全面启动法律援助舆情分析工作[N];赤峰日报;2010年

4 本报记者 傅江平;舆情分析为食品安全监管提供支撑[N];中国质量报;2012年

5 记者 马献忠;“段子文化的舆情分析”课题结项[N];中国社会科学报;2011年

6 本报记者 孙艳敏;网络舆情分析师:不只是替领导看看网[N];检察日报;2013年

7 记者 魏志强 通讯员 杜胜辉;青工的心情 团委的事情[N];中国石油报;2010年

8 杨丽娟 张音;走近网络舆情分析师[N];人民日报;2011年

9 于雅倩 本报记者 王宁;身边烦恼有地儿说[N];丹东日报;2009年

10 赵强;回应舆论关切 怎能语焉不详[N];人民日报;2014年

相关博士学位论文 前1条

1 冯时;面向网络舆情分析的观点挖掘关键技术研究[D];东北大学;2011年

相关硕士学位论文 前10条

1 姜朋;山东大学舆情分析系统的设计与实现[D];山东大学;2015年

2 朱慧;基于舆情分析研判的突发事件预警平台的设计与实现[D];电子科技大学;2011年

3 高卫民;城市公安网络舆情分析系统的设计与开发[D];天津大学;2014年

4 张鹏星;基于文本倾向性分析的网络舆情分析及其趋势预测[D];云南财经大学;2014年

5 许志凯;网络舆情分析关键技术的研究与实现[D];哈尔滨工业大学;2011年

6 张劭捷;基于微博社交网络的舆情分析模型及实现[D];华南理工大学;2011年

7 王涛;微博舆情分析系统信息处理模块的设计与实现[D];东华大学;2014年

8 马梅;基于大数据的网络舆情分析系统模型研究[D];西安电子科技大学;2014年

9 王然;舆情分析系统的设计与实现[D];北京邮电大学;2013年

10 谢宜瑾;网络舆情分析与管理技术的研究与实现[D];广东工业大学;2012年



本文编号:2751540

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2751540.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1c70e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com