LUCENE搜索算法剖析及优化研究
本文关键词:LUCENE搜索算法剖析及优化研究
更多相关文章: Lucene 搜索算法 向量空间模型 TF-IDF 离散随机最优化
【摘要】:介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径。并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能。
【作者单位】: 上海外国语大学图书馆;
【基金】:国家社科基金“泛在知识环境下图书馆知识发现技术与应用研究”项目(编号:12CTQ006) 上海市教育委员会科研创新项目(编号:14ZS073)的资助
【分类号】:TP391.3
【正文快照】: 0引言快速搜索技术一直是信息搜索和知识发现领域研究的热点。如何根据用户兴趣模型及搜索请求从数据库海量文档中快速返回相关文档,并按照用户兴趣相关度进行高效排序,如何选用高效的开发工具来构建性能优良的全文搜索引擎,均是本项目研究的重要内容。当前,在众多开源搜索引
【参考文献】
中国期刊全文数据库 前3条
1 王欢;孙瑞志;;基于领域本体和Lucene的语义检索系统研究[J];计算机应用;2010年06期
2 窦天芳;姜爱蓉;;资源发现系统功能分析及应用前景[J];图书情报工作;2012年07期
3 黄承慧;印鉴;陆寄远;;一种改进的Lucene语义相似度检索算法[J];中山大学学报(自然科学版);2011年02期
【共引文献】
中国期刊全文数据库 前10条
1 毛布;谢汶;;一种基于博弈论的死锁检测机制研究[J];成都电子机械高等专科学校学报;2010年04期
2 李从东;高杨;赵映红;;突发事件应急管理中的情景适应度研究[J];电子科技大学学报(社科版);2012年04期
3 秦鸿;钱国富;钟远薪;;三种发现服务系统的比较研究[J];大学图书馆学报;2012年05期
4 杨东波;邢军;;国家图书馆“文津搜索”的设计与实现[J];国家图书馆学刊;2014年03期
5 朱玲;崔海媛;聂华;;网络级发现服务的实施:实践与思考——以北大图书馆“未名学术搜索”为例[J];大学图书馆学报;2014年04期
6 葛慧丽;叶志飞;;一种基于迭代运算引文排序的科技文献检索系统[J];计算机时代;2011年09期
7 姜鑫;余平;;基于Lucene的音视频资源检索系统的研究与实现[J];计算机应用与软件;2011年11期
8 马晓丹;邓晓晴;彭文娟;阎红灿;;基于领域本体的知识库架构和实现[J];河北联合大学学报(自然科学版);2012年04期
9 李自辉;;基于B/S架构的图书馆管理系统的设计与实现[J];科技信息;2013年14期
10 杨鲁捷;;搜递、e读、primo三大资源发现系统中文图书覆盖情况比较[J];河南图书馆学刊;2013年08期
中国博士学位论文全文数据库 前1条
1 王芳;基于本体的广域农业信息服务系统关键技术研究[D];河北农业大学;2012年
中国硕士学位论文全文数据库 前10条
1 董锦霞;基于菱形思维的概念检索模型研究[D];大连理工大学;2011年
2 李大鹏;基于本体的学科知识地图构建研究[D];华中师范大学;2011年
3 桂许军;基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现[D];西南交通大学;2011年
4 叶继平;基于Lucene的全文信息检索技术的研究与应用[D];江南大学;2012年
5 樊皓;粗糙本体支持的信息语义检索研究[D];大连海事大学;2012年
6 姜鑫;教学视频信息文本化检索平台的构建与应用[D];华东师范大学;2012年
7 王敏;个性化搜索中隐私保护的问题研究[D];河北工程大学;2012年
8 谢剑芳;Web主题信息检索中的语义检索技术研究及应用[D];重庆交通大学;2012年
9 徐晓文;基于本体的农业数据语义关联发现技术[D];华侨大学;2012年
10 张琦玉;基于Lucene的应用系统内部搜索的研究与设计[D];南京理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
2 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
3 宋佳;诸云强;刘润达;;一种基于Lucene改进的全文检索工具包[J];计算机工程与应用;2008年04期
4 周登朋;谢康林;;Lucene搜索引擎[J];计算机工程;2007年18期
5 郑廷;郑诚;;基于Lucene的语义检索系统[J];计算机工程;2008年16期
6 黄果;周竹荣;周亭;;基于领域本体的语义相似度计算研究[J];计算机工程与科学;2007年05期
7 郑世明;任在安;宋自林;邵荣明;戴荣荣;潘明聪;;基于Ontology的语义查询分析研究[J];南京师范大学学报(工程技术版);2008年04期
8 李鹏;陶兰;王弼佐;;一种改进的本体语义相似度计算及其应用[J];计算机工程与设计;2007年01期
9 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
10 蒋一峰;王华;张玉红;黄少林;;基于Lucene的语义检索系统的设计和实现[J];计算机工程与设计;2008年20期
【相似文献】
中国期刊全文数据库 前10条
1 许中卫;李炜;宋杰;吴建国;;束搜索算法的精度优化研究[J];计算机工程与应用;2006年09期
2 周日贵;谢强;姜楠;丁秋林;;多模式高概率量子搜索算法[J];南京航空航天大学学报;2007年02期
3 张怀;许林英;;空间有限条件下博弈搜索算法的优化[J];电子测量技术;2007年08期
4 孙吉贵;张居阳;陈尚伟;;多元约束混合搜索算法研究[J];自动化学报;2007年09期
5 冯远静;俞立;冯祖仁;;蚁群协同模式搜索算法及其收敛性分析[J];控制理论与应用;2007年06期
6 刘跃军;苏静;;一种改进三步搜索算法的设计与实现[J];河南科技大学学报(自然科学版);2008年04期
7 钟普查;鲍皖苏;;多目标元素的量子搜索算法[J];计算机工程与应用;2008年24期
8 张超;刘蕊洁;;大型交通网络最优路径的随机深度搜索算法[J];铁路计算机应用;2009年02期
9 刘勇;马良;;非线性极大极小问题的混沌万有引力搜索算法求解[J];计算机应用研究;2012年01期
10 金文梁;陈向东;;相位不匹配的量子搜索算法[J];电子学报;2012年01期
中国重要会议论文全文数据库 前10条
1 罗家祥;唐立新;李小林;刘建荣;邬成新;;分散搜索算法在板坯匹配优化问题中的应用研究[A];全国冶金自动化信息网2009年会论文集[C];2009年
2 张玲;姜立志;;能量抵消测量相位中的相位搜索算法[A];2009年全国水声学学术交流暨水声学分会换届改选会议论文集[C];2009年
3 李金;蒋国平;;一种改进的复杂网络搜索算法[A];2007中国控制与决策学术年会论文集[C];2007年
4 李潇磊;伍瑞卿;朱维乐;;运动搜索算法的比较与改进[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 程振波;邓志东;;优化策略模型下的匹配律算法[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
6 彭明侨;罗先觉;邹晓松;;基于改进概率搜索算法的模拟电路故障诊断[A];第四届中国测试学术会议论文集[C];2006年
7 常新杰;李言俊;;搜索算法的研究进展[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
8 糜玉林;左斌;;基于协同控制的极值搜索算法与控制器一体化设计[A];2007年中国智能自动化会议论文集[C];2007年
9 钟普查;鲍皖苏;;基于相位变换的量子搜索算法研究[A];第十三届全国量子光学学术报告会论文摘要集[C];2008年
10 罗春华;张继勇;郑方;徐明星;;一种基于HTK的词图搜索算法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前8条
1 孙杰;基于绝热演化的量子搜索算法研究[D];华中科技大学;2013年
2 张映玉;绝热量子搜索算法研究[D];华中科技大学;2011年
3 阎兴,
本文编号:1263725
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1263725.html