基于社交网络的舆情关键技术研究
本文关键词:基于社交网络的舆情关键技术研究 出处:《吉林大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 网络舆情 机器学习 文本倾向性分析 word2vec 微信平台
【摘要】:随着移动互联网的深入发展以及5G时代的到来,各类社交应用持续发展,互联网平台呈现泛社交化。社交网络中的典型代表微信、微博,在舆情监测分析中均扮演着重要的角色。相较于微博平台舆情监测技术的日渐成熟,基于微信平台的相关研究较为匮乏,因此,本文重点研究了基于微信平台的舆情监测分析关键技术。本文根据社交网络的舆情系统需求,设计系统总体架构,解决微信平台公众号数据获取问题,并对网络舆情进行倾向性分析。本文提出word2vec模型与机器学习相结合的微信文本倾向性分析模型,能够有效提高分类准确率、精确度、召回率。本文的主要工作如下:(1)设计了微信平台舆情监测分析系统框架,并对框架内的各功能模块逐一设计实现。阐述了系统任务执行流程,设计并实现数据采集功能、数据存储功能、文本倾向性分析功能、舆情报告展示功能。(2)通过Python爬虫及Hook技术相结合的方式,实现微信平台公众号数据的自动获取,并存储于服务器MySQL数据库中。在数据采集模块中详细说明了各组件工作原理及采集流程,明确移动终端组件、服务器端组件构成及通信方式,利用多个移动终端采集,提高采集速率。信息通过去噪处理后存储,为舆情分析提供数据支持。(3)本文在研究特征选择算法及分类算法的基础上,进一步研究了word2vec模型,提出机器学习方法与word2vec相结合的微信文本倾向性分析模型。并将提出的模型与传统分类模型作对比研究,通过模型调优,使其在微信文本倾向性分类中效果更好。实验结果表明,本文提出的模型,在微信平台文本倾向性分析中表现良好。准确率达到84%,精确度达到86%,召回率达到83%,对比传统分类模型分别提升5%、7%和5%,ROC曲线AUC值达到0.88,总体分类性能得到提升。本文的主要贡献和创新点如下:(1)提出了机器学习与word2vec相结合的微信数据舆情分析模型,利用机器学习调优方法,对模型进行实验训练,使得系统分类性能整体得到提高,并实现微信文本的倾向性分析。(2)设计并实现了微信平台的数据采集功能,利用Python爬虫和Hook技术相结合的方式,解决了传统网页爬虫访问服务器频率受限的问题。通过多个移动终端并行采集,提高了数据采集速率,实现了微信数据的大规模获取,为后续实验研究提供数据支持。
[Abstract]:With the further development of mobile Internet and 5G era, all kinds of social sustainable development, the Internet platform has Pan social. Social networks are the typical representatives of WeChat, micro-blog, in the public opinion monitoring and analysis play an important role. Compared to the micro-blog platform and monitoring technology, based on the related research of WeChat platform is scarce, therefore, this paper focuses on the research of public opinion monitoring WeChat platform. Based on the analysis of key technology based on the needs of the public opinion system of the social network, the overall system architecture design, solve the problem of obtaining WeChat platform public number data, and public opinion on the network orientation analysis. In this paper, WeChat text orientation word2vec model and machine learning the combination analysis model, can effectively improve the classification accuracy, precision and recall. The main work of this paper are as follows: (1) the design of WeChat Taiwan public opinion monitoring and analysis system, and the functional modules of the design and implementation of the framework. One describes the system task execution process, the design and implementation of data acquisition, data storage, text orientation analysis, public opinion reports show. (2) through the combination of Python and Hook crawler technology combination, realize the automatic get the WeChat platform public number data, and stored in the MySQL server database. The data acquisition module in detail the various components and working principle of the acquisition process, clear mobile terminal components, server components and communication mode, using multiple mobile terminal acquisition, increasing the acquisition rate. Through denoising after storage. Provide data support for the analysis of public opinion. (3) the basic algorithm and classification algorithm in the study of characteristics, further study of the word2vec model, a machine learning method WeChat text orientation combined with word2vec analysis model. Compared with the traditional model and proposes the classification model, through the model optimization, the effect is better in the WeChat text orientation classification. The experimental results show that the proposed model performs well in the WeChat platform text orientation analysis. The accuracy rate of reached 84%, precision 86%, recall rate reached 83%, 5% improve the traditional classification and comparison model respectively, 7% and 5%, the ROC curve of AUC value reached 0.88, the overall classification performance has been improved. The main contributions and innovations of this paper are as follows: (1) proposed a model of WeChat data public opinion machine learning combined with word2vec analysis. Using machine learning optimization method, experimental training on the system model, the overall classification performance is improved, and the tendency analysis of WeChat text. (2) the design and implementation of data acquisition of WeChat platform The function, using the combination of Python and Hook crawler technology combination, to solve the traditional web crawler server access frequency is limited. Collected in parallel by the plurality of mobile terminals, improves the data acquisition rate, to achieve a large-scale acquisition of WeChat data, provide data support for subsequent experimental research.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP181
【相似文献】
相关期刊论文 前10条
1 刘毅;;略论网络舆情的概念、特点、表达与传播[J];理论界;2007年01期
2 陶建杰;;网络舆情联动应急机制初探[J];青年记者;2007年15期
3 胡圣方;杨文德;;网络舆情管理的问题及对策[J];甘肃政法成人教育学院学报;2007年04期
4 吴明友;;校园网络舆情的应对策略分析[J];中国教育信息化;2008年24期
5 张丽红;;试论网络舆情传播对文化的影响[J];前沿;2008年04期
6 姜胜洪;;网络舆情热点的形成与发展、现状及舆论引导[J];理论月刊;2008年04期
7 李子德;;论和谐社会视野中不良网络舆情的预警[J];中国石油大学学报(社会科学版);2008年04期
8 刘军;;互联网时代网络舆情的应急处理[J];理论学习;2009年01期
9 周志强;;网络舆情与“口香糖思想”[J];人民论坛;2009年04期
10 许鑫;章成志;李雯静;;国内网络舆情研究的回顾与展望[J];情报理论与实践;2009年03期
相关会议论文 前10条
1 任铭;陈俊鑫;;我国网络舆情及管理策略研究[A];2011年全国通信安全学术会议论文集[C];2011年
2 潘崇霞;;网络舆情演化的阶段分析[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
3 潘庆芳;周萍;;涉路网络舆情的现状及应对建议[A];中国公路学会高速公路运营管理分会2011年度年会暨第十八次全国高速公路运营管理工作研讨会论文集[C];2011年
4 李大鹏;;加强新形势下检察机关网络舆情体系建设[A];第27次全国计算机安全学术交流会论文集[C];2012年
5 曹俊喜;刘云;徐希源;;电力行业网络舆情监测分析技术研究与系统设计[A];2012年电力通信管理暨智能电网通信技术论坛论文集[C];2013年
6 冉治平;;提高网络舆情应对能力的几点思考[A];浙江烟草(2012年第3期总第122期)[C];2012年
7 疏学明;郑魁;张辉;袁宏永;;突发事件中网络舆情信息管理方式探讨[A];中国突发事件防范与快速处置优秀成果选编[C];2009年
8 耿骞;刘颖;;网络舆情的形成、传播及监测方法[A];科学发展:文化软实力与民族复兴——纪念中华人民共和国成立60周年论文集(下卷)[C];2009年
9 韩伟;张洪涛;;网络舆情与青少年媒介认知能力构建[A];网络时代的青少年和青少年工作研究报告——第六届中国青少年发展论坛暨中国青少年研究会优秀论文集(2010)[C];2010年
10 曾华艺;;网络舆情危机事件指标体系探讨[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
相关重要报纸文章 前10条
1 记者 刘自贤 通讯员 吴涛;网络舆情助推汉江中院司法为民[N];湖北日报;2010年
2 通讯员 王宏杰;注重网络舆情监督 网上网下良性互动[N];检察日报;2010年
3 四川省地税局直属分局 韦一新 胡晓驰;正确应对征纳纠纷引发的网络舆情危机[N];中国税务报;2010年
4 唐莉 记者 郭树仁;梅河口检察院加强涉检网络舆情研判与应对工作[N];北方法制报;2010年
5 记者 卢志坚 通讯员 胡连芳;江苏大丰:征聘百名“网络舆情监督员”[N];检察日报;2009年
6 见习记者 施燕燕;应对网络舆情与三项重点工作息息相关[N];检察日报;2010年
7 记者 吴汉松;提升引导网络舆情能力[N];石狮日报;2010年
8 四川省内江市工商局 吴明显 杨晓彬;建议加强网络舆情收集分析及引导工作(下)[N];中国工商报;2010年
9 吴明显;内江积极加强网络舆情监测[N];中国工商报;2010年
10 本报记者 白真智;探秘网络舆情市场[N];人民日报;2010年
相关博士学位论文 前10条
1 张玉强;网络舆情危机的政府适度反应研究[D];中央民族大学;2011年
2 何健;高校大学生网络舆情特征与管理对策研究[D];西南大学;2015年
3 石新宇;当代大学生网络舆情分析及对策研究[D];辽宁大学;2015年
4 曹学艳;突发事件动态网络舆情挖掘与应对研究[D];电子科技大学;2013年
5 刘泉;基于个体社会属性的网络舆情演化模型研究[D];大连理工大学;2016年
6 方付建;突发事件网络舆情演变研究[D];华中科技大学;2011年
7 张伟;基于复杂社会网络的网络舆情演化模型研究[D];哈尔滨工业大学;2014年
8 陈t熀,
本文编号:1414507
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1414507.html