当前位置:主页 > 社科论文 > 新闻传播论文 >

新闻评估系统的设计与实现

发布时间:2020-04-24 07:03
【摘要】:资讯阅读类终端给用户的获取知识和信息以及传播观点提供了很大的便利,通过这种方式阅读资讯不仅方便快捷而且不受时间地点的限制。这类资讯阅读类客户端的发展的同时,也带动了各种形式的媒体的发展,从而极大程度上拓展了客户端文章的来源。文章来源的丰富,一方面带来了信息量的增加,另一方面也给文章质量的把控增加了难度。所以很容易会出现“标题党”、“低俗”、“虚假内容”等情况影响用户的体验的情况。用户每天花费在阅读资讯内容上的时间比较有限,所以在面对海量新闻文章时更好的做法是优先推荐相对热门、内容相对比较好能够吸引用户的新闻文章。因此,本文从热点话题挖掘和文章评估的两个角度展开研究,并且在研究研究过程中搭建新闻评估系统。本文将系统的介绍新闻评估系统的构建过程。首先,通过对热点话题挖掘和文章评估的研究意义和研究现状的分析,引出了新闻评估系统中的研究内容。随后,对新闻评估系统展开业务分析,明确系统的功能与性能需求,即针对每日新增的海量文章数据,能够收集、处理、整合好不同的特征数据,支持相关算法模型的使用,并且可以根据需求更新、恢复算法模型,最终通过服务的方式将评估的结果提供,为用户提供从数据收集整理、热点新闻挖掘、新闻评估以及评估结果展现服务的一站式服务。接下来,围绕需求分析的结果阐述新闻评估系统的详细设计与实现过程,其中热点话题挖掘和新闻评估是本文中研究重点。热点文章挖掘主要是采用了主题模型,但是在实际应用过程中主题模型对某些文章的挖掘效果不如人意。本文基于实际的应用场景,从业务的角度出发,结合生产环境中可以利用到的文章特征属性优化主题模型的挖掘效果。对于新闻评估,系统主要把评估设定为一个多分类问题,文中主要采取GBDT和XGBoost算法做为评估模型,通过实验对比优化和相关测试,把新闻评估系统的效果进行提升。系统将新闻评估的结果通过Thrift服务的形式进行提供,并且为了能够更好的提供服务,设计了多层Thrift服务,包括:数据服务、调度服务、调度监控服务。
【图文】:

模型图,主题,模型,词汇


简介let Allocation)是一种文档生成模型。主题又对应着不同的词。一篇文章的主题,然后再在这个主题下以一定的的第一个词。不断重复这个过程,就 所示。当然这里假定词与词之间是没是这样的:汇的分布题的分布章的词汇个数 N的词汇个数小于 N 执行第 5 步,否则分布随机生成一个主题,通过该主题执行第 4 步

业务逻辑,工程硕士学位,大型系统,读写操作


哈尔滨工业大学工程硕士学位论文式(TProtocol)和采用什么方式进行数据传输(TTran输数据的数据结构(struct) 和传输数据的业务逻辑境快速的构建相应的代码,并且通过自己内部的序简化和压缩提高高并发、大型系统中数据交互的成 的整体架构,,分为 6 个部分:(1)业务逻辑实现;的 Service ;(3)执行读写操作的计算结果;(4据传输方式;(6)底层 I/O 通信。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G210.7;TP391.1

【参考文献】

相关期刊论文 前3条

1 陆伟;张晓娟;;基于主题与用户偏好分析的查询推荐研究[J];情报学报;2012年12期

2 邢东山,沈钧毅,宋擒豹;从Web日志中挖掘用户浏览偏爱路径[J];计算机学报;2003年11期

3 刘洪涛;肖开洲;吴渝;黄智兴;;带舆论评价的引文网络构建与主题发现[J];情报学报;2011年04期

相关硕士学位论文 前3条

1 王博远;基于用户交互关系的用户创作内容质量评估[D];北京邮电大学;2014年

2 罗乐;基于潜在语义分析的文本分类算法研究[D];西南大学;2013年

3 袁堂朋;基于用户行为模式的Web日志挖掘模型的研究与实现[D];南京邮电大学;2013年



本文编号:2638666

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2638666.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户38aee***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com