当前位置:主页 > 科技论文 > 软件论文 >

基于语义关系图的新闻事件聚类算法研究与应用

发布时间:2021-11-14 16:44
  随着移动通信技术的发展,手机应用市场呈现日益繁荣的景象,其中新闻类应用程序为用户接收新闻信息提供了极大的便利。但是,实时更新的新闻推送使用户端获取的新闻过于冗杂,事件主题分布散乱,使用户难以在短时间内浏览自己所关注的新闻事件。因此,把新闻按照事件归类后再进行推送,将使用户端的新闻组织更加简洁有效,可以提高用户的浏览效率,所以对新闻进行事件粒度的聚类研究具有重要的现实意义。本文主要工作如下:(1)介绍本文的课题背景和研究意义,调研并总结国内外关于新闻事件聚类的研究现状;介绍新闻事件聚类的基本过程和相关技术;分析当前新闻事件聚类的不足之处。(2)针对目前的新闻事件表示方法只能有效提取给定类型的事件以及难以有效构建语义环境的不足,本文提出一种句子级的无监督事件信息提取算法,并设计一种基于语义关系图的事件表示算法。首先,从各新闻中提取与新闻事件直接相关的语义单元;然后,构建与新闻语料对应的语义环境,即根据语义单元中词项之间的关联构建与新闻对应的局部语义关系图;最后,将多个新闻对应的语义关系图进行合并,得到全局语义关系图,语义关系图表示各新闻之间的关联。实验结果表明,本文提出的事件表示算法具有较... 

【文章来源】:南京邮电大学江苏省

【文章页数】:85 页

【学位级别】:硕士

【部分图文】:

基于语义关系图的新闻事件聚类算法研究与应用


语义关系图的构建结果

语义关系,均聚,事件语义,模块度


图 3.2 语义关系图的删减结果添加实验,在初始新闻数量的基础上增加 418 篇新 篇以及 4 个新的事件,共得到 2114 个结点和 4057 3.3 所示。由图可知,结点间的分布与事件数量相符其中红圈中的两个事件语义相关,对应结点簇之间块度 Q 和平均聚类系数 ACC 的值分别为 16、0.7相同,模块度 Q 和平均聚类系数 ACC 较原始语义对应的簇分布。

条图,语义关系,模块度,均聚


图 3.2 语义关系图的删减结果的添加实验,在初始新闻数量的基础上增加 418 篇新闻05 篇以及 4 个新的事件,共得到 2114 个结点和 4057 条图 3.3 所示。由图可知,结点间的分布与事件数量相符,其中红圈中的两个事件语义相关,对应结点簇之间的模块度 Q 和平均聚类系数 ACC 的值分别为 16、0.733量相同,模块度 Q 和平均聚类系数 ACC 较原始语义关到对应的簇分布。

【参考文献】:
期刊论文
[1]一种改进的基于知网的词语语义相似度算法[J]. 张小川,于旭庭,张宜浩.  计算机应用研究. 2018(08)
[2]基于图的新闻事件主题句抽取方法[J]. 王雍凯,毛存礼,余正涛,郭剑毅,洪旭东,罗林.  南京理工大学学报. 2016(04)
[3]一种基于事件本体的文本事件要素提取方法[J]. 刘炜,刘菲京,王东,刘宗田.  中文信息学报. 2016(04)
[4]基于词共现的文档表示模型[J]. 常鹏,冯楠.  中文信息学报. 2012(01)
[5]一种基于主题的文本聚类方法[J]. 赵世奇,刘挺,李生.  中文信息学报. 2007(02)

硕士论文
[1]基于事件网络的话题跟踪研究[D]. 王东.上海大学 2013



本文编号:3494990

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3494990.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e76b0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com