基于事件指导的多文档生成式摘要方法
发布时间:2019-03-23 16:58
【摘要】:建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。
[Abstract]:Generative abstracts, which are based on understanding text semantics, are more rational in thought than abstract abstracts, but they face problems such as semantic understanding, natural language generation and so on. This paper presents a method of generating abstracts based on event as the basic semantic unit, which reflects the topic distribution of the text by clustering events, and uses event-directed multi-sentence compression to generate natural sentences to construct abstracts. Through the evaluation on the DUC standard dataset, the final ROUGE score is comparable to the current mainstream generation method, which shows that events can carry the backbone information of the text very well. At the same time, it can effectively guide the removal of redundant information and the generation of natural language in the process of multi-sentence compression.
【作者单位】: 武汉大学计算机学院;
【基金】:国家社科重大招标计划资助项目(11&ZD189) 国家自然科学基金面上项目(61373108)
【分类号】:TP391.1
本文编号:2446047
[Abstract]:Generative abstracts, which are based on understanding text semantics, are more rational in thought than abstract abstracts, but they face problems such as semantic understanding, natural language generation and so on. This paper presents a method of generating abstracts based on event as the basic semantic unit, which reflects the topic distribution of the text by clustering events, and uses event-directed multi-sentence compression to generate natural sentences to construct abstracts. Through the evaluation on the DUC standard dataset, the final ROUGE score is comparable to the current mainstream generation method, which shows that events can carry the backbone information of the text very well. At the same time, it can effectively guide the removal of redundant information and the generation of natural language in the process of multi-sentence compression.
【作者单位】: 武汉大学计算机学院;
【基金】:国家社科重大招标计划资助项目(11&ZD189) 国家自然科学基金面上项目(61373108)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前3条
1 滕兰花;;浅析生成式教学法在《中国历史文献学》课程教学当中的运用研究[J];大学教育;2013年21期
2 刘晓平,石慧,毛峥强;模板研究发展与展望[J];合肥工业大学学报(自然科学版);2005年09期
3 ;[J];;年期
相关会议论文 前1条
1 钱正玉;;浅谈数学课堂中的动态生成式教学[A];江苏省教育学会2005年小学数学优秀论文集[C];2005年
相关重要报纸文章 前2条
1 溧阳市南渡中心小学 陆伟明;追求互动生成式的校长挂职培训[N];江苏教育报;2011年
2 四川省华蓥市华蓥中学副校长 郭子其;教师听课应趋向“生成式”[N];中国教育报;2005年
相关硕士学位论文 前4条
1 姜敏;构建以学定教的小学数学生成式课堂的实践研究[D];苏州大学;2015年
2 郑治国;生成式笔记模型的构建及其比较研究[D];江西师范大学;2004年
3 唐青才;生成式教学设计研究[D];西南大学;2008年
4 吴小兵;初中数学课堂动态生成式教学的研究[D];鲁东大学;2013年
,本文编号:2446047
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2446047.html