基于Lucene的数字作品搜索引擎的研究与设计
本文关键词:基于Lucene的数字作品搜索引擎的研究与设计
更多相关文章: Lucene 分词算法 索引 相关度排序算法 分布式
【摘要】:在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的搜索引擎,为用户提供对海量数字作品信息的快速、准确的搜索服务。实验分析比较了分词速度和分词效果,还比较了关键词搜索结果的响应时间、命中数量、准确率和召回率。实验结果表明,本系统在很大程度上提高了搜索速度,保证了搜索结果的准确性。
【作者单位】: 北方工业大学信息工程学院;
【基金】:国家科技部支撑计划课题基金资助项目(2012BAH04f03) 科研基地—科研创新平台资助项目(PXM2013_014212_000011)
【分类号】:TP391.3
【正文快照】: 1引言中国版权保护中心在深入研究国际现有的版权保护技术、相关的法规和标准后,认为从根本上解决数字作品产业链中各个参与者的利益分享和技术创新,实现快速高效的维权机制,是互联网版权保护的核心命题[1]。中国版权保护中心结合数字资源出版服务领域的发展趋势,对数字资源
【参考文献】
中国期刊全文数据库 前2条
1 李振龙;;Web信息检索的技术分析与发展策略研究[J];计算机科学;2006年04期
2 赵珂;逯鹏;李永强;;基于Lucene的搜索引擎设计与实现[J];计算机工程;2011年16期
【共引文献】
中国期刊全文数据库 前10条
1 马福晶;;基于网络信息检索技术的数据包捕获[J];重庆科技学院学报(自然科学版);2008年05期
2 杨元峰;赵敏涯;廖黎莉;;基于Lucene的客服知识库系统结构设计[J];福建电脑;2012年01期
3 谌超;强保华;石龙;;基于Hadoop MapReduce的大规模数据索引构建与集群性能分析[J];桂林电子科技大学学报;2012年04期
4 许昊;王跃胜;;基于Lucene的FTP搜索引擎的设计与实现[J];福建电脑;2012年07期
5 洪颖;;基于Lucene的服装领域专业搜索引擎研究[J];北京服装学院学报(自然科学版);2012年03期
6 许璐蕾;周莉;汤可金;姜艳萍;;基于Lucene的垂直搜索引擎的设计和实现[J];电脑与电信;2013年03期
7 马福晶;;浅议数据包捕获技术[J];黑龙江科技信息;2008年32期
8 郭喜平;蒙应杰;;模糊查询中的策略优化[J];计算机工程与应用;2008年34期
9 蔡海尼;朱晓飞;;基于Z39.50协议的分布式检索在复合型图书馆系统中的应用[J];计算机科学;2008年08期
10 葛彦强;汪向征;栗青生;宋世桢;;基于Lucene的甲骨文全文检索系统构建[J];科技通报;2012年04期
中国博士学位论文全文数据库 前2条
1 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
2 程明智;电子商务环境中信息快速加密及内容安全管理相关技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 向丹;专业搜索引擎中的多Agent协调研究[D];西华大学;2008年
2 郭浩军;基于本体的Web跨语言信息检索研究[D];华北电力大学(河北);2009年
3 张宇;WEB中文文本聚类分类系统的设计与实现[D];西南交通大学;2009年
4 闫晓妍;Web2.0环境下网络信息检索模式研究[D];郑州大学;2009年
5 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年
6 张珍;主题搜索引擎中的多Agent爬行策略研究[D];西华大学;2010年
7 姜鑫;教学视频信息文本化检索平台的构建与应用[D];华东师范大学;2012年
8 王伟;基于HGML的目标信息地理位置检索机制研究[D];成都理工大学;2012年
9 陈忱;DBFS技术及其在远洋运输业务邮件管理中的应用研究[D];南京航空航天大学;2012年
10 张琦玉;基于Lucene的应用系统内部搜索的研究与设计[D];南京理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前2条
1 郭立力;赵春江;;高效FTP搜索引擎的设计与实现[J];华南理工大学学报(自然科学版);2009年01期
2 张宇;王映辉;张翔南;;基于Spring的MVC框架设计与实现[J];计算机工程;2010年04期
【相似文献】
中国期刊全文数据库 前10条
1 蒋一峰;王华;张玉红;黄少林;;基于Lucene的语义检索系统的设计和实现[J];计算机工程与设计;2008年20期
2 赵旭;王庆桦;;向LUCENE搜索引擎中加入中文同义词查询[J];科技信息;2011年07期
3 蓝永健;;基于Lucene的校园网垂直搜索引擎的设计与实现[J];广东教育学院学报;2009年03期
4 张香梅;徐立;;lucene中文切词算法的改进[J];科技信息;2009年28期
5 葛振国;李建;何林糠;吴军;;基于Lucene的Oracle数据库全文检索[J];信息技术;2010年03期
6 向晖;郭一平;王亮;;基于Lucene的中文字典分词模块的设计与实现[J];现代图书情报技术;2006年08期
7 王继明;杨国林;;基于Lucene的中文文本分词[J];内蒙古工业大学学报(自然科学版);2007年03期
8 陈艳春;李双平;;基于Lucene的企业级搜索引擎的设计与实现[J];现代图书情报技术;2007年08期
9 蔡小艳;寇应展;沈巍;郑伟;;Nutch-0.9中JE中文分词的实现[J];科学技术与工程;2008年17期
10 李颖;李志蜀;邓欢;;基于Lucene的中文分词方法设计与实现[J];四川大学学报(自然科学版);2008年05期
中国重要会议论文全文数据库 前10条
1 韩希先;李建中;;分布式有序表中一种有效的在线计划批量插入方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
3 郭柯;代璐;周林;;分布式并网发电系统孤岛检测方法综述[A];重庆市电机工程学会2010年学术会议论文集[C];2010年
4 吴成海;张克芳;;跨平台分布式自动测试系统设计[A];全国第二届总线技术与测控系统工程学术报告会论文集[C];2001年
5 张德明;;构建分布式声纳信号处理系统[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
6 李其莹;张洪霞;;配电网中实现小电流接地选线一种方案[A];华东六省一市电机工程(电力)学会输配电技术研讨会2002年年会山东电机工程学会交流论文集[C];2002年
7 周详;王龙明;;建立分布式防护的安全体系[A];中国烟草行业信息化研讨会论文集[C];2004年
8 申排伟;陆锋;;一种基于视图的分布式几何对象类型空间数据库更新技术[A];中国地理信息系统协会第八届年会论文集[C];2004年
9 魏德荣;赵花城;秦一涛;张弘;;分布式光纤监测技术在我国的发展[A];2004年全国碾压混凝土坝筑坝技术交流会论文集[C];2004年
10 祝保英;滕光辉;;智能温室分布式环境控制系统[A];中国农业工程学会第七次会员代表大会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 张磊;分布式能源技术研讨会在京召开[N];中国电力报;2004年
2 盖俊飞 林楠;分布式ISA防火墙与服务器的配置[N];电脑报;2003年
3 刘轶轩;IONA:分布式SOA四两拨千斤[N];通信产业报;2007年
4 晓京;做分布式呼叫中心[N];中国计算机报;2003年
5 ;中兴通讯分布式“3G”服务[N];中国计算机报;2002年
6 章文;分布式能源技术市场前景广阔[N];中国建材报;2005年
7 ;整理SQL Server的索引碎片[N];电脑报;2004年
8 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统的历史与现状[N];中国计算机报;2005年
9 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统趋向成熟[N];中国计算机报;2005年
10 国防科学技术大学计算机学院软件所 董勇 周恩强;构建分布式文件系统[N];中国计算机报;2005年
中国博士学位论文全文数据库 前10条
1 王宇翔;分布式网络地理信息系统研究[D];中国科学院研究生院(遥感应用研究所);2002年
2 董红军;基于多Agent的分布式CAPP及工艺信息管理研究[D];西北工业大学;2000年
3 娄渊胜;基于构件的分布式防汛信息系统框架研究[D];河海大学;2002年
4 刘峰;仪用主从耦合分布式并行处理容错系统体系结构研究[D];浙江大学;2003年
5 唐秋华;分布式虚拟环境建模研究[D];武汉理工大学;2005年
6 王加虎;分布式水文模型理论与方法研究[D];河海大学;2006年
7 傅涛;基于数据挖掘的分布式网络入侵协同检测系统研究及实现[D];南京理工大学;2008年
8 侯梅毅;分布式同步发电机的孤岛检测原理与实现[D];山东大学;2010年
9 杨峰;分布式并行索引研究[D];电子科技大学;2003年
10 陈荦;分布式地理空间数据服务集成技术研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
2 刘天元;基于Lucene的海量生殖健康数据集成系统的研究与实现[D];北京邮电大学;2011年
3 付敏;一个改进的中文分词算法及其在Lucene中的应用[D];华中科技大学;2010年
4 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年
5 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年
6 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年
7 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
8 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年
9 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
10 姜华;基于Lucene面向主题搜索引擎的研究与设计[D];华东师范大学;2007年
,本文编号:1226811
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1226811.html