在线新闻子话题发现方法及其在金融舆情中的应用研究
发布时间:2024-01-25 14:28
互联网的高速发展使得人们获取新闻信息更加快捷方便,因此产生的在线新闻数据呈爆炸式增长。其中蕴含了大量丰富有效的舆情事件相关信息,从中挖掘描述事件各侧面内容的子话题可以从多角度了解掌握舆情事件全貌,获取公众关注侧重点,把握事件走向,以及为后续事件的演化分析、管理决策等提供基础。然而,传统的话题发现方法无法满足当前在线新闻子话题发现的细粒度分析要求,如无法从海量信息中找出准确有效的子话题类别、子话题之间区分度低和子话题表达语义不清晰等。因此,展开在线新闻子话题发现研究具有重要意义。本文在阅读现有的国内外相关文献基础上,分析话题发现领域各类较常使用的技术优缺点,结合在线新闻数据特点,对在线新闻子话题发现方法展开研究,主要工作如下:(1)论文首先对LDA主题模型进行分析,针对其易向高频词倾斜而忽略具有话题代表性的低频特征词缺点,提出了基于特征加权的LDA模型——LDA-FW,并将该模型与其他传统方法在搜狗新闻语料上进行实验对比,证明了该方法的有效性。(2)针对同一事件在线新闻子话题之间区分度不高、子话题关键词语义不连贯等问题,提出了基于LDA-FW和关键词优化的子话题发现方法。该方法在LDA-...
【文章页数】:77 页
【学位级别】:硕士
本文编号:3884985
【文章页数】:77 页
【学位级别】:硕士
图1.1网民规模与互联网普及率[1]
图1.2网络新闻用户规模及使用率图[1]
图3.1LDA生成文档过程图
图3.3搜狗新闻语料示例图
本文编号:3884985
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3884985.html