基于Web的Lucene全文搜索排序算法优化
本文关键词:基于Web的Lucene全文搜索排序算法优化
更多相关文章: lucene向量空间模型 相似度 排序算法
【摘要】:基于Lucene向量空间模型搜索的排序算法缺乏对自然语言语义理解的能力,直接有效的方法是根据用户个体对搜索文档的喜好,对选中的文档得分加权,由此提出Download-through Rank算法,对原有的排序算法进行了改进,设计并实现了个性化搜索引擎。实验证明,改进后的搜索排序算法能够有效提高信息检索的准确度。
【作者单位】: 安徽工程大学计算机与信息学院;安徽工程大学计算机应用技术重点实验室;
【关键词】: lucene向量空间模型 相似度 排序算法
【基金】:安徽工程大学青年基金项目(2013YQ29)
【分类号】:TP391.3
【正文快照】: 中小企业网络服务器分布着数量庞大的文档资源,管理这些不同格式的文档变得越来越复杂,并随着文档数量的日益增加,搜索效率变低;而且,只是通过文件名进行搜索的方式,很多时候无法满足用户需求。由此,构建基于全文搜索的Web搜索引擎系统能够很好地解决文档管理和搜索问题。基于
【参考文献】
中国期刊全文数据库 前2条
1 陈建峡;黄日;马忠宝;;基于PageRank的Lucene排序算法优化与实现[J];计算机工程与科学;2012年10期
2 李庆华 ,赵彦斌 ,赵峰 ,彭进劲;基于向量空间模型的并行信息检索算法[J];小型微型计算机系统;2005年09期
【共引文献】
中国期刊全文数据库 前10条
1 刘全飞;周相兵;;基于lucene的站群全文检索系统设计与实现[J];电脑与信息技术;2015年01期
2 李臣龙;杨磊;鲍广喜;;基于WEB的全文搜索引擎系统设计与实现[J];安徽科技学院学报;2014年06期
3 郭承坤;陈国松;阮怀军;陈英义;屠星月;;基于Heritrix+Solr的农业信息垂直搜索引擎研究与设计[J];广东农业科学;2015年05期
4 宁柏锋;许冠中;;供电企业安全生产管理系统平台的设计与应用[J];电力信息与通信技术;2015年03期
5 卜玉敏;侯聪聪;高国帅;高阿坤;;基于学术合作关系的学科专家导航实现算法研究[J];科技创新与应用;2015年22期
6 胡章荣;王朝斌;;基于词典的中文分词算法及其性能评估[J];电子技术与软件工程;2015年15期
7 周朴雄;;用于WEB文档分类的并行KNN算法[J];计算机工程与应用;2008年25期
8 谷萌萌;高茂庭;;搜索引擎研究与发展[J];计算机与数字工程;2008年07期
9 胡恒文;高智勇;王辉;;基于Clucene的电子病历全文检索系统研究与设计[J];计算机与数字工程;2014年03期
10 罗学礼;徐树振;王森;杨莉;段嘉杰;;电力企业的非结构化数据检索研究[J];计算机与数字工程;2014年04期
中国硕士学位论文全文数据库 前10条
1 曾欢;数据库全文检索方法研究及其应用[D];大连理工大学;2011年
2 徐璐;基于Lucene和文本图像的全文检索系统的研究与应用[D];北京邮电大学;2012年
3 张路;基于云计算平台的海量图片存储系统设计与实现[D];北京邮电大学;2012年
4 丁新村;基于树匹配和遗传算法的构件检索算法研究[D];西安理工大学;2008年
5 皮靖;主题搜索引擎的研究与实现[D];湖北工业大学;2013年
6 张俊;基于Lucene的产品比价搜索系统的研究与设计[D];上海师范大学;2013年
7 丁文雯;面向水路基础数据库平台的Lucene全文检索技术研究[D];大连海事大学;2013年
8 林伟业;基于爬虫的Sohu新闻搜索引擎设计与实现[D];中山大学;2012年
9 孙强;舆情监控系统的设计与实现[D];大连海事大学;2013年
10 黄翠平;基于自然语言理解的全文搜索研究[D];湖北大学;2013年
【二级参考文献】
中国期刊全文数据库 前3条
1 吴伟;陈建峡;;基于Heritrix的web信息抽取优化与实现[J];湖北工业大学学报;2012年02期
2 曹军;Google的PageRank技术剖析[J];情报杂志;2002年10期
3 黄知义,周宁;Google搜索引擎的PageRank技术及其优化研究[J];图书馆学研究;2005年08期
中国硕士学位论文全文数据库 前3条
1 史鹏辉;专业服务网站搜索引擎的设计与实现[D];大连理工大学;2004年
2 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
3 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 朱建莉,刘宏强;常用排序算法综述[J];胜利油田师范专科学校学报;2002年04期
2 周海岩,郝保树;一种新的桶分配链接排序算法[J];太原师范专科学校学报;2002年01期
3 赵忠孝;基于概率分布的排序算法(1)[J];计算机工程与应用;2002年11期
4 赵忠孝;基于概率分布的排序算法(2)[J];计算机工程与应用;2002年12期
5 何文明;针对任意分布数据的高效分档混合排序算法[J];计算机工程与应用;2003年22期
6 尤志强,张大方;数据等概率分档排序算法有效性的定量研究[J];计算机学报;2003年01期
7 穆炯,蒲海波;对按位分段排序算法的研究[J];四川农业大学学报;2004年01期
8 李井润;一种基于统计的分段排序算法[J];微计算机应用;2004年03期
9 曹清录,王念平,张斌;合并排序算法的平均情形复杂性分析及其应用[J];计算机工程;2004年21期
10 余炳惠,王克刚;排序算法的选择及一些改进[J];安康师专学报;2004年04期
中国重要会议论文全文数据库 前10条
1 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年
2 张艳秋;李建中;;一种基于蛇型磁带的排序算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 刘春阳;叶君峰;母海龙;陆秋霞;陈沧;高莺;;一种商品标题主题词的重要性排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
4 王少帅;汤庆新;姚路;;并行独立集排序算法的改进与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
5 于芳;王大玲;于戈;陈冬玲;鲍玉斌;;面向用户的排序算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 闫泼;马军;陈竹敏;;面向主题的网页排序算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 吴志彬;陈义华;;ANP中超矩阵排序算法研究[A];2006中国控制与决策学术年会论文集[C];2006年
9 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年
10 齐曼;张珩;;实时视觉仿真中帧连贯性应用[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
中国重要报纸全文数据库 前1条
1 广东 黄陀;基本算法简介(三)[N];电脑报;2001年
中国博士学位论文全文数据库 前3条
1 赵立军;基于归并的高效排序算法的研究[D];中国科学院研究生院(计算技术研究所);1998年
2 崔筠;无向基因组的移位排序算法[D];山东大学;2006年
3 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 王靖;数据库管理系统中高能效排序算法[D];浙江工业大学;2012年
2 尹晓;基因组移位排序算法的改进和评测[D];山东大学;2006年
3 黄兴;比特位拆分索引排序算法研究[D];清华大学;2007年
4 Mushtaq AbdulMutalib Hasson;一种论文时间与引用兼顾的科研论文排序算法[D];华中科技大学;2012年
5 刘声田;基于第一降序小队翻转排序算法的设计与实现[D];山东大学;2006年
6 曹臻;基于粗糙集的粒度排序算法[D];上海海事大学;2007年
7 侯红梅;图像搜索重排序算法研究[D];山东大学;2014年
8 徐艳霞;面向数学搜索的排序算法研究[D];兰州大学;2012年
9 张建英;稀疏正则化最小二乘排序算法[D];湖北大学;2011年
10 廉洁;改进的内容分析排序算法在搜索引擎中的研究与应用[D];大连交通大学;2013年
,本文编号:1116829
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1116829.html