基于布谷鸟搜索优化算法的多文档摘要方法
发布时间:2021-11-09 11:29
为最大化生成摘要的信息量,提出一种基于布谷鸟搜索(CS)算法与多目标函数的多文档摘要方法。对多文档数据进行预处理,通过句子分割、分词、移除停用词和词干化将文档转化为词语的基本处理形式,计算经数据预处理后的句子信息量得分并将其作为CS算法的输入,再基于多目标函数生成包含原始文档重要信息的句子以组成最终的摘要。实验结果表明,与基于粒子群优化算法和双层K最近邻算法的多文档摘要方法相比,该方法在最大化生成摘要信息量的前提下,保证了高可读性和低冗余性,并且在DUC基准数据集上的摘要平均准确度高达0.99。
【文章来源】:计算机工程. 2020,46(07)北大核心CSCD
【文章页数】:8 页
【部分图文】:
多文档摘要处理流程
预处理流程
在输入表示阶段,使用预处理后的数据计算每个句子的权重(术语频率之和),即句子信息量得分,将句子信息量得分作为算法输入,其流程如图3所示。1.3 摘要表示
【参考文献】:
期刊论文
[1]一种话题敏感的抽取式多文档摘要方法[J]. 应文豪,李素建,穗志方. 中文信息学报. 2017(06)
[2]基于LexRank的中文单文档摘要方法[J]. 刘海燕,张钰. 兵器装备工程学报. 2017(06)
[3]融合句义特征的多文档自动摘要算法研究[J]. 罗森林,白建敏,潘丽敏,韩磊,孟强. 北京理工大学学报. 2016(10)
[4]基于增量图聚类的动态多文档摘要算法[J]. 郭海蓉,张晖,赵旭剑,李波,杨春明. 计算机应用研究. 2016(07)
[5]基于文本挖掘的漏洞信息聚类分析[J]. 高岭,申元,高妮,雷艳婷,孙骞. 东南大学学报(自然科学版). 2015(05)
[6]基于LDA重要主题的多文档自动摘要算法[J]. 刘娜,路莹,唐晓君,李明霞. 计算机科学与探索. 2015(02)
[7]动态适应布谷鸟搜索算法[J]. 张永韡,汪镭,吴启迪. 控制与决策. 2014(04)
[8]逐维改进的布谷鸟搜索算法[J]. 王李进,尹义龙,钟一文. 软件学报. 2013(11)
硕士论文
[1]基于word2vec的中文自动摘要方法研究[D]. 王雪霏.哈尔滨工业大学 2017
[2]基于主题句语义融合的多文档摘要算法研究[D]. 刘子平.重庆大学 2016
本文编号:3485246
【文章来源】:计算机工程. 2020,46(07)北大核心CSCD
【文章页数】:8 页
【部分图文】:
多文档摘要处理流程
预处理流程
在输入表示阶段,使用预处理后的数据计算每个句子的权重(术语频率之和),即句子信息量得分,将句子信息量得分作为算法输入,其流程如图3所示。1.3 摘要表示
【参考文献】:
期刊论文
[1]一种话题敏感的抽取式多文档摘要方法[J]. 应文豪,李素建,穗志方. 中文信息学报. 2017(06)
[2]基于LexRank的中文单文档摘要方法[J]. 刘海燕,张钰. 兵器装备工程学报. 2017(06)
[3]融合句义特征的多文档自动摘要算法研究[J]. 罗森林,白建敏,潘丽敏,韩磊,孟强. 北京理工大学学报. 2016(10)
[4]基于增量图聚类的动态多文档摘要算法[J]. 郭海蓉,张晖,赵旭剑,李波,杨春明. 计算机应用研究. 2016(07)
[5]基于文本挖掘的漏洞信息聚类分析[J]. 高岭,申元,高妮,雷艳婷,孙骞. 东南大学学报(自然科学版). 2015(05)
[6]基于LDA重要主题的多文档自动摘要算法[J]. 刘娜,路莹,唐晓君,李明霞. 计算机科学与探索. 2015(02)
[7]动态适应布谷鸟搜索算法[J]. 张永韡,汪镭,吴启迪. 控制与决策. 2014(04)
[8]逐维改进的布谷鸟搜索算法[J]. 王李进,尹义龙,钟一文. 软件学报. 2013(11)
硕士论文
[1]基于word2vec的中文自动摘要方法研究[D]. 王雪霏.哈尔滨工业大学 2017
[2]基于主题句语义融合的多文档摘要算法研究[D]. 刘子平.重庆大学 2016
本文编号:3485246
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3485246.html