微博事件自动摘要研究
发布时间:2020-12-22 07:20
在Web2.0时代,微博已成为流行的社交网络平台。微博互动性强、用户数量大,社会上的流行热点事件能够在微博平台上迅速传播,其实时性和现场感远超传统媒体。通过微博浏览热点事件已经成为现代社会获取最新资讯的重要途径。然而,作为一个主打社交的平台,微博并没有专门对新闻事件数据进行优化。人们在微博平台上只能通过关键词检索事件相关微博。这些微博一方面内容冗余度高,另一方面由于微博字数限制很难给出事件的整体描述以及用户观点。再者,搜索引擎的结果一般通过微博发布时间或者热门程度等基本属性进行排序,并没有针对微博文本内容或者主题进行排序的机制。这些不足致使呈现在用户面前的事件信息只是一个局部,缺乏完整性。同时,对于一个事件,特别是发展过程中重点发生转移的事件,用户不仅需要了解事件的概况,还希望进一步掌握事件发展的脉络和前因后果。针对这些问题,本文提出了一种面向微博事件的自动摘要生成方法。它包含两部分内容。对于微博事件数据如何进行表示的问题,我们设计了一种微博短文本自动摘要算法。它可以克服传统的长文本自动摘要方法应用于短文本摘要效果不佳的缺点,从事件的整体入手为微博生成摘要。对于事件演化阶段的摘要生成问...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 自动文档摘要技术
1.2.2 事件检测与跟踪技术
1.2.3 事件演化技术
1.3 论文研究内容
1.4 论文组织结构
第2章 相关工作
2.1 自动文档摘要
2.1.1 自动文档摘要定义
2.1.2 自动文档摘要评价
2.2 事件检测、跟踪与表示
2.2.1 事件监测与跟踪技术
2.2.2 事件表示
2.2.3 事件演化分析
2.3 本章小结
第3章 微博事件自动摘要算法
3.1 引言
3.2 微博事件摘要自动生成算法框架
3.3 微博事件摘要目动生成算法
3.3.1 句子重要性打分
3.3.2 事件描述摘要生成
3.3.3 情感摘要生成
3.4 实验结果及分析
3.4.1 数据集
3.4.2 事件描述摘要评价指标
3.4.3 事件描述摘要对比方法
3.4.4 事件描述摘要评测及讨论
3.4.5 事件情感摘要评价
3.5 本章小结
第4章 微博事件演化摘要算法
4.1 引言
4.2 基于层次聚类的微博事件演化摘要算法
4.2.1 算法框架
4.2.2 微博文本时间戳的统一处理
4.2.3 演化特征抽取
4.2.4 基于层次聚类的演化阶段识别
4.2.5 事件阶段摘要生成
4.3 实验结果
4.3.1 数据集
4.3.2 评价方式
4.3.3 事件演化摘要评测及讨论
4.4 本章小结
第5章 总结与展望
5.1 本文工作总结
5.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果
【参考文献】:
期刊论文
[1]互联网话题识别与跟踪系统设计及实现[J]. 闵可锐,赵迎宾,刘昕,赵泽宇,闫华. 计算机工程. 2008(19)
[2]基于特征选择的轻量级入侵检测系统[J]. 陈友,程学旗,李洋,戴磊. 软件学报. 2007(07)
[3]话题识别与跟踪中的层次化话题识别技术研究[J]. 于满泉,骆卫华,许洪波,白硕. 计算机研究与发展. 2006(03)
[4]基于多策略优化的分治多层聚类算法的话题发现研究[J]. 骆卫华,于满泉,许洪波,王斌,程学旗. 中文信息学报. 2006(01)
[5]多文档自动文摘综述[J]. 秦兵,刘挺,李生. 中文信息学报. 2005(06)
博士论文
[1]演进式动态新闻文档摘要生成方法研究[D]. 严睿.北京大学 2013
[2]中文新闻话题动态演化及其关键技术研究[D]. 赵旭剑.中国科学技术大学 2012
硕士论文
[1]基于时间线的事件组织与摘要技术的研究与应用[D]. 李辉.浙江大学 2012
[2]针对微博数据的事件检测、跟踪及摘要生成[D]. 龙睿.上海交通大学 2012
本文编号:2931370
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 自动文档摘要技术
1.2.2 事件检测与跟踪技术
1.2.3 事件演化技术
1.3 论文研究内容
1.4 论文组织结构
第2章 相关工作
2.1 自动文档摘要
2.1.1 自动文档摘要定义
2.1.2 自动文档摘要评价
2.2 事件检测、跟踪与表示
2.2.1 事件监测与跟踪技术
2.2.2 事件表示
2.2.3 事件演化分析
2.3 本章小结
第3章 微博事件自动摘要算法
3.1 引言
3.2 微博事件摘要自动生成算法框架
3.3 微博事件摘要目动生成算法
3.3.1 句子重要性打分
3.3.2 事件描述摘要生成
3.3.3 情感摘要生成
3.4 实验结果及分析
3.4.1 数据集
3.4.2 事件描述摘要评价指标
3.4.3 事件描述摘要对比方法
3.4.4 事件描述摘要评测及讨论
3.4.5 事件情感摘要评价
3.5 本章小结
第4章 微博事件演化摘要算法
4.1 引言
4.2 基于层次聚类的微博事件演化摘要算法
4.2.1 算法框架
4.2.2 微博文本时间戳的统一处理
4.2.3 演化特征抽取
4.2.4 基于层次聚类的演化阶段识别
4.2.5 事件阶段摘要生成
4.3 实验结果
4.3.1 数据集
4.3.2 评价方式
4.3.3 事件演化摘要评测及讨论
4.4 本章小结
第5章 总结与展望
5.1 本文工作总结
5.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果
【参考文献】:
期刊论文
[1]互联网话题识别与跟踪系统设计及实现[J]. 闵可锐,赵迎宾,刘昕,赵泽宇,闫华. 计算机工程. 2008(19)
[2]基于特征选择的轻量级入侵检测系统[J]. 陈友,程学旗,李洋,戴磊. 软件学报. 2007(07)
[3]话题识别与跟踪中的层次化话题识别技术研究[J]. 于满泉,骆卫华,许洪波,白硕. 计算机研究与发展. 2006(03)
[4]基于多策略优化的分治多层聚类算法的话题发现研究[J]. 骆卫华,于满泉,许洪波,王斌,程学旗. 中文信息学报. 2006(01)
[5]多文档自动文摘综述[J]. 秦兵,刘挺,李生. 中文信息学报. 2005(06)
博士论文
[1]演进式动态新闻文档摘要生成方法研究[D]. 严睿.北京大学 2013
[2]中文新闻话题动态演化及其关键技术研究[D]. 赵旭剑.中国科学技术大学 2012
硕士论文
[1]基于时间线的事件组织与摘要技术的研究与应用[D]. 李辉.浙江大学 2012
[2]针对微博数据的事件检测、跟踪及摘要生成[D]. 龙睿.上海交通大学 2012
本文编号:2931370
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2931370.html