当前位置:主页 > 科技论文 > 软件论文 >

基于词向量包的自动文摘方法

发布时间:2018-04-04 03:56

  本文选题:词向量 切入点:词包向量 出处:《现代情报》2017年02期


【摘要】:[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。
[Abstract]:[objective] to describe the semantic information in vector space and study the automatic abstract method based on word vector packet. [methods] Abstract is an accurate expression of shortened document content, and word vector packet can represent words, phrases and sentences in the same vector space.The spatial distance of paragraphs and texts is used to reflect semantic similarity.An automatic summarization method based on word vector packet is proposed. The representation distance of the lexical vector packet measures the semantic similarity between the sentence and the whole document, and the sentence similar to the document semantic is extracted to form the abstract. [results] on the DUC01 data set,The experimental results show that this method can produce high quality abstracts, and the results are obviously superior to those of other methods. [conclusion] experiments show that this method can improve the performance of automatic abstracts obviously.
【作者单位】: 内蒙古大学图书馆;内蒙古大学计算机学院;
【基金】:国家自然基金项目“基于领域本体的蒙古文数字资源整合机制研究”(项目编号:71163029)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 金博,史彦军,滕弘飞,艾景波;自动文摘技术及应用[J];计算机应用研究;2004年12期

2 陆和健;李祝启;;网络信息自动文摘研究[J];情报科学;2008年10期

3 林莉;;自动文摘的生成方法与评价研究[J];图书馆学刊;2009年05期

4 王建波,王开铸;自然语言篇章理解及基于理解的自动文摘研究[J];中文信息学报;1992年02期

5 王开铸,李俊杰,李秀坤,吴岩,张军;自动文摘系统的历史和现状[J];电脑学习;1995年04期

6 王开铸,吴岩,刘挺,张军;自动文摘设计模型[J];电脑学习;1995年05期

7 王开铸,吴岩,刘挺;基于理解的自动文摘系统设计[J];电脑学习;1996年02期

8 李蕾,钟义信,郭祥昊;面向特定领域的理解型中文自动文摘系统[J];计算机研究与发展;2000年04期

9 胡舜耕,钟义信,魏超成;基于多Agent技术的自动文摘研究[J];计算机工程与应用;2000年09期

10 宋今,赵东岩;基于语料库与层次词典的自动文摘研究(英文)[J];软件学报;2000年03期

相关会议论文 前10条

1 桂卓民;何婷婷;陈劲光;李芳;;一种面向查询的多文档自动文摘系统实现方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

2 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 耿崇;宋丹;薛德军;张灿;;基于词位置与同现特征的中文自动文摘研究[A];第五届全国信息检索学术会议论文集[C];2009年

4 刘海涛;老松杨;吴玲达;;基于段落自适应聚类的自动文摘系统研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

5 李成城;;基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

6 吕静;昝红英;;基于语义统计的中文自动文摘研究[A];第三届学生计算语言学研讨会论文集[C];2006年

7 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

8 卢冶;林鸿飞;赵晶;;中文自动文摘系统的综合评价模式[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

9 邵伟;何婷婷;胡珀;肖华松;;一种面向查询的多文档文摘句选择策略[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

10 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

相关重要报纸文章 前1条

1 教育部语言文字应用研究所副所长 靳光瑾 中国社会科学院语言文字应用系研究生 易江燕;话题发现技术:决策参考的“探测器”[N];中国社会科学报;2014年

相关博士学位论文 前10条

1 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年

2 李鹏;面向主题的多文档自动文摘关键技术研究[D];上海交通大学;2013年

3 胡珀;融合上下文信息的自动文摘研究[D];武汉大学;2013年

4 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年

5 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年

6 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年

7 张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;2013年

8 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年

9 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年

10 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年

相关硕士学位论文 前10条

1 陈奕辰;基于句子权重和篇章结构的自动文摘算法的研究与实现[D];湖南师范大学;2015年

2 苏彬;基于Word2Vec的自动文摘系统的设计与实现[D];河北科技大学;2015年

3 孙佩佩;面向事件的自动文摘研究[D];安徽理工大学;2016年

4 曹洋;基于TextRank算法的单文档自动文摘研究[D];南京大学;2016年

5 刘俊斐;自动文摘后处理算法的研究和实现[D];湖南师范大学;2016年

6 李方馨;基于中文微博的自动文摘研究[D];内蒙古师范大学;2016年

7 李杰;汉语句群自动划分方法及其在自动文摘中的应用[D];杭州电子科技大学;2015年

8 朱荷香;中文自动文摘系统的研究与实现[D];南京师范大学;2008年

9 石子言;用户驱动的特定领域自动文摘系统设计与实现[D];东北师范大学;2009年

10 孟庆富;生物医学多文档自动文摘系统设计与实现[D];哈尔滨工业大学;2010年



本文编号:1708258

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1708258.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47ace***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com