改进搜索引擎及其数据结构的设计
本文关键词: 搜索引擎 Web检索 索引词 中文分词 出处:《情报科学》2012年02期 论文类型:期刊论文
【摘要】:针对传统搜索引擎在搜索过程中产生的临时文件多、占用磁盘空间大的问题,本文改进了搜索引擎的数据结构,采用索引压缩技术减少了临时文件,提高了检索效率。
[Abstract]:In order to solve the problem that the traditional search engine produces more temporary files and occupies large disk space, this paper improves the data structure of the search engine, reduces the temporary files by using index compression technology, and improves the retrieval efficiency.
【作者单位】: 吉林化工学院理学院;吉林大学通信工程学院;湖北大学商学院;北京大学软件与微电子学院;
【分类号】:G353
【参考文献】
相关期刊论文 前5条
1 焦丽;路波;;基于五大因素的搜索引擎优化研究[J];中国管理信息化;2009年17期
2 丁岳伟;郭辉;;利用蚁群算法对PageRank算法的改进[J];计算机应用;2009年10期
3 郑志宏;郑志高;王玉婷;;模糊查找算法的设计实现[J];情报科学;2010年06期
4 吕学强,苏祺,孙斌,俞士汶;搜索引擎用短语词典建设[J];清华大学学报(自然科学版);2005年S1期
5 陈丽君;林怀忠;;搜索引擎页面刷新策略研究综述[J];计算机系统应用;2009年07期
【共引文献】
相关期刊论文 前10条
1 官连军;丁光耀;张燕妮;;支持多种模糊处理的英文智能预提示输入引擎[J];成都信息工程学院学报;2012年02期
2 张晓民;刘凯;;PowerPoint动画技术在数据结构教学中的应用实践[J];电脑知识与技术;2009年23期
3 李婧;;浅谈提高数据结构教学质量的方式方法[J];电脑知识与技术;2010年17期
4 周巍巍;;网络爬虫网页库智能更新策略分析与研究[J];电脑知识与技术;2010年31期
5 李观金;;基于搜索引擎自然检索的搜索引擎优化[J];硅谷;2011年07期
6 肖诗斌;赵红改;王洪俊;吕学强;;搜索引擎日志中“N_1+N_2+V”型名词短语研究[J];广西师范大学学报(自然科学版);2011年01期
7 罗婷;吕歆;;现代网站SEO的方法与技巧[J];信息通信;2011年06期
8 许宪成;张凌;;基于HASH表的二叉树结构在网络处理器系统中的应用[J];河南大学学报(自然科学版);2011年01期
9 孙秀婷;;大规模图数据路径查询分析[J];黑龙江科技信息;2011年01期
10 许世峰;高军;杨冬青;王腾蛟;;基于穿行次数的大规模图数据路径查询[J];计算机研究与发展;2010年01期
相关会议论文 前4条
1 詹海生;王启户;;一种自适应字长的中文词库的构建方法[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
2 穆飞;李维佳;薛巍;舒继武;;一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
3 王启户;詹海生;周水生;;一种自适应字长的中文词库的构建方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 许世峰;高军;杨冬青;王腾蛟;;基于穿行次数的大规模图数据路径查询[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
相关博士学位论文 前1条
1 许宪成;基于网络处理器的入侵检测系统设计与性能优化研究[D];华南理工大学;2010年
相关硕士学位论文 前10条
1 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
2 曹成龙;基于文件过滤驱动的移动存储控制系统的研究与实现[D];南京信息工程大学;2011年
3 吴娱;网络舆情分析关键技术研究与实现[D];电子科技大学;2011年
4 桂许军;基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现[D];西南交通大学;2011年
5 冯波;企业网站实施搜索引擎优化的基本策略研究[D];哈尔滨工业大学;2011年
6 罗会红;基于SSH和Lucene垂直搜索引擎研究[D];长沙理工大学;2011年
7 叶继平;基于Lucene的全文信息检索技术的研究与应用[D];江南大学;2012年
8 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年
9 戴运桃;动态可配置综合导航显控台系统软件设计[D];哈尔滨工程大学;2006年
10 马志强;校园网搜索引擎核心技术—中文自动分词[D];北京机械工业学院;2006年
【二级参考文献】
相关期刊论文 前8条
1 鲁宏伟;魏凯;孔华锋;;一种改进的KMP高效模式匹配算法[J];华中科技大学学报(自然科学版);2006年10期
2 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期
3 刘务华;罗铁坚;王文杰;;一个Web社区搜索引擎系统[J];计算机应用研究;2007年02期
4 吕学强,苏祺,孙斌,俞士汶;搜索引擎用短语词典建设[J];清华大学学报(自然科学版);2005年S1期
5 孟涛;王继民;闫宏飞;;网页变化与增量搜集技术[J];软件学报;2006年05期
6 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
7 黄德才;戚华春;钱能;;基于主题相似度模型的TS-PageRank算法[J];小型微型计算机系统;2007年03期
8 戚华春,黄德才,郑月锋;具有时间反馈的PageRank改进算法[J];浙江工业大学学报;2005年03期
【相似文献】
相关期刊论文 前10条
1 蓝海洋,周杰韩,张和明;文本索引词项相对权重计算方法与应用[J];计算机工程与应用;2003年15期
2 陈莉;浅谈古籍书目索引的编纂[J];图书情报知识;2005年03期
3 陈莉;韩锡铎;;浅谈古籍书目索引的编纂[J];中国索引;2004年04期
4 张新凤;;SciFinder Scholar数据库医院图书馆学研究文献内容分析[J];医学信息学杂志;2009年11期
5 胡小菁;情报检索语言语法手段分析[J];上海第二工业大学学报;1991年01期
6 刘丹;利用《CA on CD》光盘数据库查找信息资源[J];大学化学;2001年04期
7 刘树安,于大鹏;基于推理网络的文本检索模型[J];控制与决策;2001年S1期
8 王彤宇,李兴福;应用于学生知识拓展的智能Web检索系统[J];济南职业学院学报;2005年02期
9 Jeff prosise ,姚萍;用Web检索[J];个人电脑;1996年10期
10 钟晓班;Web检索接口的一种结构[J];管理科学文摘;1999年06期
相关会议论文 前10条
1 王彦祥;王广林;;“索引之星”的研制和索引编制[A];2004年辞书与数字化研讨会论文集[C];2004年
2 孙琦;牛军钰;;基于倒排文件的索引模型综述[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 陈莉;;浅谈古籍书目索引的编纂[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年
4 喻宏勇;赵铁军;郑德权;王月颖;;一种面向文件的高效检索方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
5 张惠荣;;美国《化学文摘》光盘数据库的检索与利用[A];图书馆改革与发展——陕西省社会科学信息学会第六次学术讨论会论文集[C];2003年
6 王梅;;索引语义扩展的探讨[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
7 刘华;邢海鹰;;Word在书稿加工中的应用[A];多出精品 多出人才——中国编辑学会第八届年会论文集[C];2003年
8 王培嵩;王淑珍;万金娥;吕秋宁;刘学玲;;椎间盘炎与高压氧治疗[A];中华医学会第十五次全国高压氧医学学术会议论文汇编[C];2006年
9 沈志宏;;科技文献主题索引准确性探讨[A];外向型文献库的数据质量控制——首届CUJA系统学术讨论会论文集[C];1990年
10 胡凤国;;基于Web检索的语料库资源共享—现状和展望[A];第二届全国学生计算语言学研讨会论文集[C];2004年
相关重要报纸文章 前7条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 裘宗燕;轻松做索引[N];中华读书报;2002年
3 本报记者 张欣;万兆“花”开“果”未熟[N];计算机世界;2003年
4 本报记者 李敏;微软研究院:领导、员工一流技术才能领先[N];国际商报;2004年
5 辛风;培养人才就是积累资本[N];中国审计报;2002年
6 希安;微软试水信息检索[N];经济日报;2004年
7 河南省审计科研所 胡友良;论文写作格式指导[N];中国审计报;2009年
相关博士学位论文 前6条
1 王斌;面向关系数据库的关键字近似搜索技术研究[D];东北大学;2008年
2 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
3 刘康苗;自适应网络信息获取服务技术研究[D];浙江大学;2008年
4 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
5 骆传伟;专名的涵义与指称[D];上海外国语大学;2011年
6 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 李春丰;面向动态文本的在线索引若干问题研究[D];广东工业大学;2011年
2 燕昆;分布式搜索引擎索引安全及缓存策略研究[D];华中科技大学;2011年
3 武庆荣;索引词研究述评[D];西南大学;2009年
4 张虹;基于集成词表和对照索引的文献分类法兼容互换研究[D];南京农业大学;2008年
5 李树成;WEB主题检索系统的性能优化设计[D];河北大学;2006年
6 柴变芳;基于贝叶斯网络的XML文档检索[D];河北大学;2006年
7 郑莉霞;基于文本的Web图像检索技术研究[D];广西大学;2007年
8 林洁;基于综合倒排索引的个性化搜索技术研究[D];贵州大学;2008年
9 姜洪强;基于语义Web文档的索引技术研究[D];北京工业大学;2010年
10 何水霞;基于B-Tree索引和BerkeleyDB的中文词库的设计和实现[D];华中科技大学;2009年
,本文编号:1512289
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1512289.html