当前位置:主页 > 社科论文 > 社会学论文 >

基于R语言的网络新闻的流行度预测研究

发布时间:2017-06-13 23:02

  本文关键词:基于R语言的网络新闻的流行度预测研究,由笔耕文化传播整理发布。


【摘要】:互联网时代已经来临,信息数量呈井喷式增长,网络新闻成为了主要的网络信息载体。民众通过网络新闻了解国计民生、时事动态,越来越多的人对喜欢的新闻文章进行分享传播,新闻文章的分享次数显示了该新闻的流行度。本文主要应用部分分类算法对网络新闻的流行度进行预测,来探讨对网络新闻流行度进行预测的最佳模型,以期帮助网络新闻服务商在出版前预测新闻流行度。本文按照数据分析的流程对网络新闻的流行度进行预测研究:一、对数据集进行预处理;二、对数据集进行特征选择,我们主要采用的是递归特征消除算法,这是一种基于模型的特征选择方法;三、进行建模分析,我们用多种不同的学习算法拟合数据集,如自适应增强算法、随机森林算法、支持向量机算法,对建立的三种不同模型结果分别进行具体详细的分析;四、模型评估,通过混淆矩阵、风险图和ROC图等性能评估方式对模型的性能进行比较分析。最后我们发现随机森林是预测的最佳模型。在整个文章结构中,本文第一部分主要介绍了论文的背景意义及目前对网络新闻研究的现状。第二部分对论文中使用的模型及方法从理论上进行了综述。第三部分根据UCI的数据集,该数据集来自Mashable,一个众所周知的网络新闻网站,按照数据分析的流程对其进行具体的数据分析,第四部分得出有参考性的结论,然后对本文的不足之处简要的分析,并且根据本文的不足之处对未来的研究工作进行展望。
【关键词】:网络新闻 特征选择 分类算法 模型评估
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:C913.4
【目录】:
  • 摘要5-6
  • ABSTRACT6-9
  • 1 绪论9-14
  • 1.1 研究背景与意义9-10
  • 1.2 网络新闻国内研究现状10-11
  • 1.3 网络新闻国外研究现状11
  • 1.4 研究方法11-14
  • 1.4.1 取材11-13
  • 1.4.2 使用工具13-14
  • 2 理论基础14-29
  • 2.1 特征选择14-19
  • 2.2 几种高级算法介绍19-25
  • 2.2.1 AdaBoost算法19-20
  • 2.2.2 随机森林算法20-23
  • 2.2.3 支持向量机算法23-25
  • 2.3 模型评估与选择25-29
  • 3 实例分析29-50
  • 3.1 数据预处理29-33
  • 3.1.1 数据集加载29-30
  • 3.1.2 数据清理30-32
  • 3.1.3 数据变换32
  • 3.1.4 冗余分析32-33
  • 3.2 特征选择33-34
  • 3.3 建立模型34-43
  • 3.3.1 数据探究分析34-36
  • 3.3.2 自适应增强算法分析36-38
  • 3.3.3 随机森林算法分析38-42
  • 3.3.4 支持向量机算法分析42-43
  • 3.4 模型评估43-50
  • 3.4.1 不同模型之间的混淆矩阵对比情况43-45
  • 3.4.2 不同模型之间的风险图分析45-48
  • 3.4.3 不同模型之间的ROC图及相关图表48-50
  • 4 总结与展望50-52
  • 4.1 总结50
  • 4.2 展望50-52
  • 参考文献52-55
  • 致谢55

【相似文献】

中国期刊全文数据库 前10条

1 薛萍;从传播方式看网络新闻的定位[J];彭城职业大学学报;2002年06期

2 李明德;对网络新闻的认识[J];西安交通大学学报(社会科学版);2002年04期

3 李烨;网络新闻探析[J];河北科技大学学报(社会科学版);2004年02期

4 王瑾,李发波;网络新闻的个性化发展之路[J];写作;2005年13期

5 申凡,陈奕奕;聚合新闻:由“e化”到“易化”的跨越——试析网络新闻发展的新趋势[J];南京邮电学院学报(社会科学版);2005年02期

6 于建华;加强网络新闻宣传与管理的对策和评价研究[J];河南社会科学;2005年04期

7 郑坚;;中国网络新闻的困境与发展路径问题[J];求索;2005年12期

8 何蕊;沈立赛;;网络新闻中扭曲的女大学生形象——以新浪网为例[J];今传媒;2006年06期

9 文永红;梁喜书;;对校园网络新闻工作的思考和建议[J];石油教育;2006年04期

10 汪洋;;浅析网络新闻的舆论作用[J];时代教育;2013年13期

中国重要会议论文全文数据库 前5条

1 石宇;;网络新闻跟帖评论中的科普信息分析——以三组网络新闻跟帖评论为例[A];安徽首届科普产业博士科技论坛——暨社区科技传播体系与平台建构学术交流会论文集[C];2012年

2 宋克明;;信息革命新形势和网络新闻新思考[A];中国科技新闻学会第八次学术年会论文集[C];2005年

3 王鑫方;;网络新闻谁在读?[A];2006中国传播学论坛论文集(Ⅱ)[C];2006年

4 孙志刚;;探析媒介依赖在美国公众使用地方纸媒与网络新闻中的作用(英文)[A];数字未来与媒介社会1[C];2010年

5 马宁;杨少龙;;网络新闻对当代大学生德育影响研究[A];社会主义核心价值体系与教育——德育论丛(第二辑)[C];2012年

中国重要报纸全文数据库 前10条

1 李东生;网络新闻“全”为先[N];新闻出版报;2000年

2 郝文全 刘云鹏;天津总队三支队网络新闻有兵味鼓士气[N];人民武警报;2011年

3 孙佳暄 东胜区新闻中心;网络新闻的平民化[N];鄂尔多斯日报;2012年

4 吴玲;“网络新闻”岂能开玩笑[N];中国新闻出版报;2013年

5 太原日报政文采访中心 白伟;当前网络新闻存在的问题及对策[N];山西经济日报;2013年

6 刘景鹏;网络新闻的可读性分析[N];中国保险报;2002年

7 杨保军;辩证看待网络新闻的真实性[N];中华新闻报;2001年

8 高钢;提升影响力:网络新闻的时代命题(上)[N];中华新闻报;2004年

9 王永康;打造诚信平台 提升网络新闻公信力[N];中华新闻报;2004年

10 杨谷;网络新闻的责任与使命[N];光明日报;2007年

中国博士学位论文全文数据库 前1条

1 刘琼;中国网络新闻可信度研究[D];华中科技大学;2011年

中国硕士学位论文全文数据库 前10条

1 白洪谭;论网络新闻跟帖的隐疾[D];辽宁大学;2010年

2 周雯;网络新闻的公共管理问题研究[D];江西财经大学;2009年

3 董卿;网络新闻的现状及未来的前瞻性研究[D];山东大学;2006年

4 刘畅;优秀运动员伤病问题的社会学分析[D];上海体育学院;2015年

5 张楠;女性主义视野下网络新闻报道中的女性形象传播研究[D];成都理工大学;2015年

6 宁芹;网络新闻侵犯隐私权法律责任研究[D];安徽大学;2016年

7 谷玉;新媒体时代我国网络新闻的正能量传播研究[D];河北经贸大学;2016年

8 陈晨;社会道德争议议题的网络新闻报道框架研究[D];新疆大学;2016年

9 付倩;关联翻译理论指导下的日常科技网络新闻英汉翻译报告[D];电子科技大学;2016年

10 宋士方;网络新闻中的不良暗示现象探究[D];广西大学;2016年


  本文关键词:基于R语言的网络新闻的流行度预测研究,,由笔耕文化传播整理发布。



本文编号:447795

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/447795.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1bf6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com