一种基于Lucene的影片搜索引擎的研究和应用
本文选题:Lucene 切入点:搜索引擎 出处:《计算机工程与应用》2008年29期
【摘要】:Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它不仅支持中文检索,还具有搜索速度快、易于扩展等优点。仿真实验证明提出的基于Lucene的影片搜索引擎具有良好的性能。
[Abstract]:Lucene is an excellent open source search engine framework, which has been widely used in the field of information search. A fast search engine for video-on-demand video is designed and implemented with the help of the word segmentation device and Lucene toolkit. It not only supports Chinese retrieval, but also has a fast search speed. The simulation results show that the video search engine based on Lucene has good performance.
【作者单位】: 中国科学院研究生院;中国科学院声学研究所国家网络新媒体工程技术研究中心;
【基金】:国家科技支撑计划项目(No.2008BAH28B04) 中科院声学研究所创新前瞻项目(No.GS12CXJ01)
【分类号】:TP391.3
【参考文献】
相关期刊论文 前2条
1 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期
2 张校乾,金玉玲,侯丽波;一种基于Lucene检索引擎的全文数据库的研究与实现[J];现代图书情报技术;2005年02期
相关硕士学位论文 前1条
1 黄杰;基于Lucene的全文检索系统模型的研究[D];暨南大学;2007年
【共引文献】
相关期刊论文 前10条
1 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期
2 潘以锋;;基于Lucene的网站全文检索系统的开发[J];广西教育学院学报;2006年05期
3 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
4 马哲,姚敏;一种改进的基于PATRICIA树的汉语自动分词词典机制[J];华南理工大学学报(自然科学版);2004年S1期
5 翟凤文;赫枫龄;左万利;;基于统计规则的交集型歧义处理方法[J];吉林大学学报(理学版);2006年02期
6 费洪晓;胡海苗;巩燕玲;;基于Hash结构的机械统计分词系统研究[J];计算机工程与应用;2006年05期
7 肖红;许少华;李欣;;具有三级索引词库结构的中文分词方法研究[J];计算机应用研究;2006年08期
8 王思力;张华平;王斌;;双数组Trie树算法优化及其应用研究[J];中文信息学报;2006年05期
9 李江波;周强;陈祖舜;;汉语词典的快速查询算法研究[J];中文信息学报;2006年05期
10 蒋国瑞;孙明;;基于Lucene的TBT文档管理Agent系统研究[J];情报杂志;2006年05期
相关博士学位论文 前2条
1 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
2 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
相关硕士学位论文 前10条
1 马哲;垃圾邮件过滤系统的研究与实现[D];浙江大学;2005年
2 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
3 李遂;通用电视节目管理平台[D];湖南大学;2005年
4 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
5 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年
6 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年
7 姜鹏;基于双数组的分词词典研究与实现[D];大连理工大学;2006年
8 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
9 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年
10 潘照明;智能中文搜索引擎若干关键技术的研究与实现[D];浙江大学;2006年
【二级参考文献】
相关期刊论文 前10条
1 郑延斌;书面汉语自动分词及歧义分析[J];河南师范大学学报(自然科学版);1997年04期
2 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
3 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
4 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期
5 吴栋,滕育平;中文信息检索引擎中的分词与检索技术[J];计算机应用;2004年07期
6 杨广翔,俞宁,谌莉;搜索引擎结果的重排序方法[J];计算机应用;2005年02期
7 付东来;李元;;Web多媒体数据实时索引的设计与实现[J];计算机与数字工程;2006年03期
8 韩客松,王永成,陈桂林;汉语语言的无词典分词模型系统[J];计算机应用研究;1999年10期
9 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
10 肖创柏,李玉鉴,郑广顺,向和平;基于全文检索技术的商业信函处理系统的设计与实现[J];计算机应用研究;2004年01期
【相似文献】
相关期刊论文 前10条
1 陶镇威;周雨程;;基于Compass框架的高级搜索系统的设计与实现[J];重庆理工大学学报(自然科学);2011年08期
2 周拴龙;;Lucene.net中文分词算法分析[J];郑州大学学报(理学版);2011年03期
3 魏蕾如;;基于搜索引擎的网络中文信息检索工具评价[J];数字技术与应用;2011年06期
4 ;创新工业搜索引擎[J];中国制造业信息化;2011年12期
5 胡风华;王磊;;基于知识库系统的智能搜索引擎研究[J];中国新技术新产品;2011年18期
6 方亚会;;Google失败后快速切换搜索引擎[J];电脑迷;2011年11期
7 李国锋;李春伟;;网络搜索引擎技术探析[J];廊坊师范学院学报;2005年04期
8 冷国华;;网页快照帮我快速获取资料[J];电脑爱好者;2011年10期
9 闫淑红;;基于搜索引擎的信息查询技术研究[J];电脑开发与应用;2011年07期
10 康亚娟;;浅谈站内信息搜索系统[J];硅谷;2011年13期
相关会议论文 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
4 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
5 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
6 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
7 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 申琪君;;电子地图搜索引擎比较[A];中国地理学会2007年学术年会论文摘要集[C];2007年
9 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 萨晓静;;网络化生存下的图书馆改革之路[A];福建省图书馆学会2008年学术年会论文集[C];2008年
相关重要报纸文章 前10条
1 本报记者 朱杰;搜索引擎应用性能分析报告[N];中国计算机报;2009年
2 记者 李建伟;第4代搜索引擎在郑州问世[N];中国知识产权报;2009年
3 记者 赵志鹏;媒体称俄拟建国家搜索引擎[N];新华每日电讯;2010年
4 吴前;搜索引擎“碳排量”惊人[N];中国文化报;2010年
5 记者 李大庆;新型搜索引擎能向用户直接提供所需内容[N];科技日报;2010年
6 深圳大学传播学院、传媒与文化发展研究中心 周裕琼;谁动了我的大脑[N];社会科学报;2010年
7 李大庆;新型搜索引擎直接为用户提供所需内容[N];中国技术市场报;2010年
8 余建斌;搜索引擎市场“烽烟四起”[N];中国高新技术产业导报;2010年
9 迈巴赫 编译;搜索引擎20年[N];计算机世界;2010年
10 记者 秦羽 通讯员 施银峰;全球搜索引擎营销大会在甬举行[N];宁波日报;2010年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
2 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 杨晓丹;基于Lucene的主题搜索引擎模板的设计与实现[D];浙江工商大学;2011年
5 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年
6 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
7 潘亭沥;基于Lucene的面向商业应用的搜索引擎研究与实现[D];电子科技大学;2007年
8 何世林;基于Java技术的搜索引擎研究与实现[D];西南交通大学;2006年
9 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年
10 冯斌;基于Lucene小型搜索引擎的研究与实现[D];武汉理工大学;2008年
,本文编号:1668736
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1668736.html