新闻线索采集分析推送系统的设计与开发
发布时间:2021-03-20 21:37
随着互联网技术的高速发展,电视、广播、报纸等传统媒体行业受到巨大的冲击。电脑、手机逐渐代替了电视机、收音机、报纸、杂志。差不多十年前开始,传统媒体纷纷转型求变,从开始的“三网融合”,到“互联网+”,再到“媒体融合”。出现了“统筹策划、一次采集、多种生成、多元传播、科学评价、有效应用”的全新业务模式。更推动了内容、平台、渠道、数据、技术、人才、机制、管理等方面深度融合。随着各地媒体纷纷建设自己的融媒体中心,在这个“内容为王”的时期,开发一套媒体融合平台便成了最重要的工作之一。而作为媒体融合平台中最核心的数据中心更是保障着其它系统正常运作。经过研究媒体融合过程中的最迫切的需求和关键业务,结合比较成熟的互联网和自然语言处理技术,设计并且实现了新闻线索采集分析推送系统。首先,本文在讨论新闻线索采集分析推送系统的背景和开发设计上所面对的问题的基础上,分析了系统的功能需求和非功能性需求。并且在需求分析基础上,我们对系统进行了技术架构和功能架构的设计。技术架构主要考虑系统的稳定性,可扩展性,可维护性以及性能问题,采用了 Linux系统下Nginx+MySQL+PHP(LNMP)的网站服务器架构[24...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2-3新闻线索采集分析推送系统功能模块??2.?3.?2功能性需求??
?山东大学硕士学位论文???_?_?^^inckide??include?一??O??_?^^Jnckide??????£!S3??include??一?-一---??图2*4采集模块用例??(1)内部数据整合。主要包括台内几个主要平台。新闻网站的新闻发布平??台、视频发布平台、媒资管理平台、新闻热线平台。我们需要通过api接口,直??接把数据库数据导入我们系统的数据库中。??(2)全网数据采集。新闻采编部门会提供给我们他们平时工作中素材的重??要来源。通过不同的采集方法进行数据。其中按模式分,我们主要抓取了七类:??天气预报、网站、报纸、微信、微博、论坛、APP。按技术分,我们将使用客户??端采集工具,Python爬虫框架,移动端模拟抓包的技术采集数据。然后采集的??数据会存入数据库中,并且会进行分词,进入搜索引擎建立全文索引。??3.数据分析模块需求分析??数据分析用例如图2-5所示。??11??
?山东大学硕士学位论文???jT?mmi?)??\?\w?mmmrnmi?j??N,?^??图2-5数据分析用例??数据入库后,在基础数据结构化的基础上,对数据按照不同维度的语义??分析和数据统计,所有数据按照不同的应用场景存储至对应的服务器,在个后台??系统上呈现给用户。??(1)热词排行。??热词对采访、写稿、大屏展示等工作能够起到突出重点,让内容以关键词??为中心展开,使新闻报道表达更准确。??(2)热门新闻。??每天的新闻数据量庞大。记者和编辑们不能全部拿来进行深入报道。所以,??热门新闻可以提供给他们哪些新闻大家比较关注,可以进行深入报道。??(3)各类新闻排行。??各类新闻排行可以提供近期每个分类新闻中浏览量最多的新闻。可以进行绩??效考核。后续,可以按浏览最多的新闻制作专题。??(4)微信、微博排行。??12??
【参考文献】:
期刊论文
[1]基于机器学习算法的引文情感自动识别研究——以自然语言处理领域为例[J]. 徐琳宏,丁堃,林原,杨阳. 现代情报. 2020(01)
[2]媒体融合的现状及发展趋势[J]. 胡占凡. 浙江传媒学院学报. 2016(02)
硕士论文
[1]基于微信的企业营销平台[D]. 尹鹏吉.山东大学 2015
本文编号:3091710
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2-3新闻线索采集分析推送系统功能模块??2.?3.?2功能性需求??
?山东大学硕士学位论文???_?_?^^inckide??include?一??O??_?^^Jnckide??????£!S3??include??一?-一---??图2*4采集模块用例??(1)内部数据整合。主要包括台内几个主要平台。新闻网站的新闻发布平??台、视频发布平台、媒资管理平台、新闻热线平台。我们需要通过api接口,直??接把数据库数据导入我们系统的数据库中。??(2)全网数据采集。新闻采编部门会提供给我们他们平时工作中素材的重??要来源。通过不同的采集方法进行数据。其中按模式分,我们主要抓取了七类:??天气预报、网站、报纸、微信、微博、论坛、APP。按技术分,我们将使用客户??端采集工具,Python爬虫框架,移动端模拟抓包的技术采集数据。然后采集的??数据会存入数据库中,并且会进行分词,进入搜索引擎建立全文索引。??3.数据分析模块需求分析??数据分析用例如图2-5所示。??11??
?山东大学硕士学位论文???jT?mmi?)??\?\w?mmmrnmi?j??N,?^??图2-5数据分析用例??数据入库后,在基础数据结构化的基础上,对数据按照不同维度的语义??分析和数据统计,所有数据按照不同的应用场景存储至对应的服务器,在个后台??系统上呈现给用户。??(1)热词排行。??热词对采访、写稿、大屏展示等工作能够起到突出重点,让内容以关键词??为中心展开,使新闻报道表达更准确。??(2)热门新闻。??每天的新闻数据量庞大。记者和编辑们不能全部拿来进行深入报道。所以,??热门新闻可以提供给他们哪些新闻大家比较关注,可以进行深入报道。??(3)各类新闻排行。??各类新闻排行可以提供近期每个分类新闻中浏览量最多的新闻。可以进行绩??效考核。后续,可以按浏览最多的新闻制作专题。??(4)微信、微博排行。??12??
【参考文献】:
期刊论文
[1]基于机器学习算法的引文情感自动识别研究——以自然语言处理领域为例[J]. 徐琳宏,丁堃,林原,杨阳. 现代情报. 2020(01)
[2]媒体融合的现状及发展趋势[J]. 胡占凡. 浙江传媒学院学报. 2016(02)
硕士论文
[1]基于微信的企业营销平台[D]. 尹鹏吉.山东大学 2015
本文编号:3091710
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3091710.html