基于滑动窗口的动态摘要算法
本文选题:动态摘要 + 文本摘要 ; 参考:《计算机工程》2007年06期
【摘要】:动态摘要是根据查询检索词从文章中动态提取的摘要。用户仅仅浏览动态摘要之后就能了解文章中与查询相关的部分,进而判断是否值得详细阅读整篇文章。该文根据搜索引擎对摘要速度和质量的要求,提出了一种使用滑动窗口抽取片断的算法,接着构造了摘要评测模型,使用同一个测试集对新动态摘要算法和Google、百度作对比实验。结果证明使用新方法生成的摘要能够言简意赅地概括文章的相关内容,在摘要指标的分项测试中取得了和Google基本相同的效果,但明显要比百度好,综合评价分别提高了5%和11%。
[Abstract]:Dynamic summary is a summary that is extracted dynamically from the article according to the query key word. After browsing the dynamic summary, the user can understand the query-related part of the article, and then determine whether it is worth reading the whole article. According to the requirements of search engines for the speed and quality of abstracts, this paper proposes an algorithm for extracting segments by sliding windows, and then constructs a model of summary evaluation, and uses the same test set to compare the new dynamic summary algorithm with Google and Baidu. The results show that the abstracts generated by the new method can generalize the relevant contents of the article concisely, and the results are basically the same as those obtained by Google in the itemized test of the summary index, but obviously better than that of Baidu, and the comprehensive evaluation increases by 5% and 11% respectively.
【作者单位】: 鞍山科技大学计算机科学与技术学院 鞍山科技大学计算机科学与技术学院 鞍山科技大学计算机科学与技术学院 鞍山科技大学计算机科学与技术学院
【基金】:辽宁省自然科学基金资助项目(2004D110)
【分类号】:TP301.6
【参考文献】
相关期刊论文 前2条
1 孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;2000年07期
2 刘挺,吴岩,王开铸;自动文摘综述[J];情报科学;1998年01期
【共引文献】
相关期刊论文 前7条
1 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
2 晋耀红,苗传江;一个基于语境框架的文本特征提取算法[J];计算机研究与发展;2004年04期
3 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
4 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期
5 刘功申,王永成,许一震;小标题识别的意义和方法[J];计算机工程;2002年06期
6 徐晓丹;;中文网页自动摘要系统的研究[J];计算机与现代化;2006年09期
7 王萌,何婷婷,姬东鸿,王晓荣;基于HowNet概念获取的中文自动文摘系统[J];中文信息学报;2005年03期
相关博士学位论文 前4条
1 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
2 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
3 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
4 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
相关硕士学位论文 前10条
1 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
2 马长林;中文自动文摘技术若干问题的研究[D];华中师范大学;2002年
3 管冬根;Web文档中信息的获取与表示研究[D];重庆大学;2003年
4 陈策;基于WEB技术的竞争情报系统的开发与研究[D];华北电力大学(河北);2004年
5 李辉;基于语义关系的摘要提取[D];南京理工大学;2004年
6 关真珍;基于半督导机器学习的分词算法的设计与实现[D];华中科技大学;2004年
7 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
8 陈志敏;基于主题划分的Web文档自动摘要研究[D];扬州大学;2006年
9 李康;自然语言理解中的语义形式化研究[D];西北工业大学;2007年
10 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
【二级参考文献】
相关期刊论文 前1条
1 姜贤塔,陈根才;利用字频统计及机器学习的自动文摘方法[J];浙江大学学报(理学版);1997年03期
【相似文献】
相关期刊论文 前10条
1 孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;2000年07期
2 王文欣,黄萱菁,吴立德;基于统计方法的汉语自动文摘系统研究[J];计算机应用与软件;2000年09期
3 邹剑章;周经野;陈益强;胡明清;;基于事件框架的移动摘要方法研究[J];微计算机信息;2010年12期
4 李建锋;陈佳良;张美华;;一种基于聚类-遗传算法的文摘提取方法研究[J];计算技术与自动化;2007年03期
5 张培颖;;基于句子特征和语义距离的文本摘要技术[J];微计算机应用;2009年07期
6 赵晶;林鸿飞;卢冶;;可视化文本分类树浏览机制[J];小型微型计算机系统;2006年03期
7 树柏涵;闫宏飞;;搜索引擎动态摘要算法[J];郑州大学学报(理学版);2009年02期
8 刘茵;李弼程;;基于模糊决策的主旨句生成算法[J];计算机工程与设计;2007年04期
9 宋人杰;曹振丽;顾宁;;站内搜索系统动态摘要算法的研究[J];计算机工程与设计;2008年05期
10 周强;施水才;李渝勤;吕学强;;句子重述技术在中文文本摘要中的应用[J];情报学报;2008年06期
相关会议论文 前10条
1 伊力亚尔·加尔木哈买提;尼亚子别克·阿不都加勒力;;哈萨克文自动文本摘要方法浅谈[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 王慧芳;张勇;邢春晓;张文珂;杨吉江;;文本摘要算法集成与实现[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
3 张龙凯;王厚峰;;文本摘要中的句子抽取方法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 赵国荣;杨尔弘;;事件类时间短语识别[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
10 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关博士学位论文 前4条
1 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 徐昊;基于跨媒体信息和高效图像编码算法的图像搜索关键技术[D];中国科学技术大学;2011年
4 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
相关硕士学位论文 前10条
1 尹显贵;基于Web的企业竞争情报服务平台中多文本摘要技术研究[D];昆明理工大学;2012年
2 丛艳;自动文本摘要方法的研究及应用[D];华北电力大学(北京);2004年
3 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
4 苗家;Blog文档的自动文摘方法研究[D];山东大学;2011年
5 刘霞;基于潜在语义分析的单文本自动摘要方法研究[D];南京邮电大学;2011年
6 王舟;面向论坛信息文本的有效数据抽取研究[D];华中科技大学;2011年
7 梁旭;评论文本的对立观点摘要的研究[D];北京交通大学;2013年
8 王丫;网络新闻流中热点事件识别与跟踪算法的改进与验证[D];燕山大学;2007年
9 薛静;中文信息检索中相关算法的研究[D];辽宁科技大学;2007年
10 闫英杰;偏重摘要技术及其应用研究[D];大连理工大学;2007年
,本文编号:2079220
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2079220.html