当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于重要句群检索性能比较研究

发布时间:2019-07-01 13:53
【摘要】:重要句群是指最能表达文献主题的若干句子的集合,客观性强、生成效率高,可在利用自动文摘成果的基础上基于重要句群进行检索。在对句子进行预处理、文献语词权重计算以及句子权重计算后生成重要句群。利用基于向量模型的方法以及构建检索式和检索提问分别对基于文摘、重要句群和全文的检索性能进行对比分析。实验结果表明,基于重要句群的检索性能总体优于作者文摘,但是低于全文,可以将重要句群作为后台数据或搜索引擎的摘要等。句子级别的文本处理对提升文本检索效果的作用不大,而把文本处理提升至上下文的语义级别是可能的有效方法。图1。表4。参考文献9。
[Abstract]:Important sentence group refers to the collection of some sentences that can best express the subject of literature, which has strong objectivity and high efficiency of generation. It can be searched based on important sentence group on the basis of automatic abstract results. After preprocessing the sentences, calculating the weight of words in the literature and calculating the weights of sentences, important sentence groups are generated. The retrieval performance based on abstracts, important sentence groups and full texts is compared and analyzed by using the method based on vector model and the construction of retrieval form and retrieval questions, respectively. The experimental results show that the retrieval performance based on important sentence groups is better than that of author abstracts, but lower than that of the full text, and important sentence groups can be used as background data or abstracts of search engines. Sentence-level text processing has little effect on improving the effect of text retrieval, but raising text processing to the semantic level of context is a possible and effective method. Figure 1. Table 4. Ref. 9.
【作者单位】: 南京农业大学信息管理系;
【分类号】:G354.2

【参考文献】

相关期刊论文 前2条

1 王建波,杜春玲,,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期

2 杨建林;一种使用自动聚类思想的自动文摘方法[J];情报学报;2001年05期

相关硕士学位论文 前1条

1 黄丽琼;中文自动文摘及评价方法的研究[D];重庆大学;2007年

【共引文献】

相关期刊论文 前10条

1 罗长寿;张峻峰;孙素芬;魏清凤;;基于改进VSM的农业实用技术自动问答系统研究[J];安徽农业科学;2009年28期

2 高影繁;马润波;刘玉树;;一种快速文本归类算法的设计与实现[J];北京理工大学学报;2006年12期

3 王青林;;法学文摘编辑选稿初探[J];中国编辑;2010年02期

4 黄水清;李志燕;梁刚;;面向计算机类文献的自动摘要系统的研究与实现[J];图书与情报;2006年03期

5 王青林;;从文摘发展史看文摘出版物的功能[J];出版史料;2010年04期

6 吕先竞;;企业信息资源的内涵特征与构成体系[J];西华大学学报(哲学社会科学版);2008年05期

7 张林曼;吴升;;地理编码系统中地址匹配引擎的设计与实现[J];测绘信息与工程;2008年06期

8 金博,滕弘飞,史彦军,王丹虹;机辅写作:样本库中写作材料检索方法[J];大连理工大学学报;2002年05期

9 金益;;基于“网络蜘蛛原理”的搜索引擎技术剖析[J];电脑学习;2007年05期

10 周光明;马文萍;;中国早期文摘报的发展及其特点研究[J];东南传播;2011年03期

相关会议论文 前1条

1 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

相关博士学位论文 前10条

1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年

2 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年

3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年

4 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

5 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年

6 宋今;面向网络实时翻译的双语信息管理系统BLIMS设计[D];中国科学院研究生院(计算技术研究所);1998年

7 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年

8 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年

9 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年

10 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年

相关硕士学位论文 前10条

1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

2 万长征;图书馆资源数字化整合与设计[D];南昌大学;2010年

3 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年

4 李欢;基于多Agent及元搜索技术的中文问答系统的研究和应用[D];石家庄铁道学院;2009年

5 乔小斐;中文自动文摘关键技术的研究与实现[D];西安电子科技大学;2010年

6 陈静;基于多Agent的高校数字图书馆个性化信息服务系统模型研究[D];西安电子科技大学;2011年

7 宋晓旭;基于语义网的文本分类研究[D];沈阳工业大学;2011年

8 王芳芳;基于Agent的网络信息检索[D];沈阳工业大学;2011年

9 孙华昱;Lucene在医学影像资源检索平台中的应用[D];沈阳工业大学;2011年

10 许成文;基于B/S模式的网络考试系统[D];河北科技大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期

2 黄丽琼;何中市;;基于统计语义和结构特征的自动文摘[J];广西师范大学学报(自然科学版);2006年04期

3 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期

4 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期

5 傅间莲;陈群秀;;一种新的自动文摘系统评价方法[J];计算机工程与应用;2006年18期

6 胡珀;何婷婷;姬东鸿;;基于主题区域发现的中文自动文摘研究[J];计算机科学;2005年01期

7 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期

8 王文欣,黄萱菁,吴立德;基于统计方法的汉语自动文摘系统研究[J];计算机应用与软件;2000年09期

9 季Y

本文编号:2508535


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2508535.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6dff8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com