当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于互联网的元搜索引擎中领域搜索模型的设计

发布时间:2018-07-02 10:46

  本文选题:信息检索 + 元搜索引擎 ; 参考:《系统仿真学报》2008年05期


【摘要】:网络信息庞大而繁杂,给用户查询带来了很多困难,领域相关的信息检索能有效地减少这些困难。基于互联网的元搜索引擎技术,提出了一种领域搜索模型。首先,采用"几率比"方法选择领域词,利用基于领域词的"判定树"构造能够反映领域文献特征的领域查询式。再将用户查询词与领域查询式相结合,作为通用搜索引擎的输入。最后,采用"扩展布尔模型"方法对返回文献进行排序,筛选出领域相关性强的检索文献。实验证明,该模型在检索领域文献时取得了很好的效果,可以用于互联网环境下各种领域相关信息的检索。
[Abstract]:Network information is huge and complicated, which brings a lot of difficulties to users. Domain related information retrieval can effectively reduce these difficulties. Based on the meta search engine technology of Internet, a domain search model is proposed. Firstly, the "probability ratio" method is used to select the domain words, and the "decision tree" based on the domain words is used to construct the domain query formula which can reflect the characteristics of the domain literature. Then the user query words and domain query are combined as the input of the general search engine. Finally, the method of "extended Boolean model" is used to sort the returned documents, and search documents with strong domain correlation are selected. The experimental results show that the model can be used in the retrieval of related information in various fields in the Internet environment.
【基金】:国家自然科学基金重点项目(70431003) 国家创新研究群体科学基金项目(60521003) 国家支撑计划项目(2006BAH02A09)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前2条

1 岳文;陈治平;林亚平;;基于查询扩展和分类的信息检索算法[J];系统仿真学报;2006年07期

2 钟敏娟,林亚平,陈治平;基于分类和关键词组抽取的信息检索算法[J];系统仿真学报;2004年05期

【共引文献】

相关期刊论文 前10条

1 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期

2 王晓红,高洪深;数据挖掘技术在大型超市中的应用研究[J];北方工业大学学报;2003年03期

3 朱宏武,蔡勇,刘自伟;数据库中基于粗糙集的分类和约简[J];兵工自动化;2003年05期

4 刘光远;董立岩;苑森淼;李永丽;孙涛;关伟洲;;多策略数据挖掘系统的分析与设计[J];吉林大学学报(信息科学版);2006年06期

5 董立岩;刘光远;苑森淼;李永丽;孙铭会;;混合式朴素贝叶斯分类模型[J];吉林大学学报(信息科学版);2007年01期

6 郭彦伟;电信行业客户流失分析的决策树技术[J];科技和产业;2005年11期

7 王大玲,于戈,鲍玉斌,王国仁;一个分类规则的存储结构及查询策略[J];东北大学学报(自然科学版);2002年09期

8 路应金,徐谡,周宗放;应用数据挖掘技术分析技术MBA培养模式[J];电子科技大学学报(社科版);2002年03期

9 赵卫东,盛昭瀚,何建敏;粗糙集在决策树生成中的应用[J];东南大学学报(自然科学版);2000年04期

10 朱红;基于Rough Set的一种决策树的确定算法[J];电脑与信息技术;2002年04期

相关会议论文 前6条

1 Longjun Huang, Caiying Zhou, Minghe Huang, Zhiming Zhuang (College of Software, Jiangxi Normal University, Nanchang 330000, China; Faculty of Science Jiangxi University of Science and Technology, Ganzhou 341000,China);A New Method for Constructing Decision Tree Based on Rough Sets Theory[A];Rough集前景——粒计算理论国际论坛(2006)论文集[C];2006年

2 YANG Jian-wei a , CAI Guo-qiang b aSchool of Machine-electricity Engineering, Taiyuan Heavy Machinery Institute, Taiyuan 030024, China bInstitute of Computing Technologies, China Academy of Railway Science, Beijing 100081, China;Analysis Method of Relative Error Rate among the Remote-distributed Testing Devices[A];第三届国际仪器科学技术学术研讨会论文集[C];2004年

3 Xi-Zhao Wang, Jin-Feng Wang Faculty of Mathematics and Computer Science, Hebei University, Baoding, 071002, China;A COMPARATIVE STUDY ON HEURISTIC ALGORITHMS ABOUT ROBUSTNESS[A];Proceedings of the Eleventh International Fuzzy Systems Association World Congress(Volume Ⅲ)[C];2005年

4 孙学刚;陈群秀;马亮;;一种自适应的网页分类策略[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年

5 Tao-Hsing Chang;Chia-Hoang Lee;;Enhancing Automatic Chinese Essay Scoring System from Figures-of-Speech[A];第20届亚太地区语言、信息和计算国际会议论文集[C];2006年

6 LIU Peng (Department of Information Systems, Shanghai University of Finance and Economics, Shanghai 200433,China);R-C4.5:A Robust Decision Tree Improved Model[A];智能计算及其应用国际会议论文集[C];2005年

相关博士学位论文 前10条

1 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年

2 王寅;化工过程混合建模问题研究[D];浙江大学;2001年

3 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年

4 杨兵;人—机交互中手绘图形的联机识别方法研究[D];西安电子科技大学;2001年

5 姚俊峰;人工智能与混沌理论在铜锍吹炼炉实时仿真与优化决策中的应用研究[D];中南大学;2001年

6 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年

7 李杰;基于模糊技术的制造单元构建方法及其在变压器企业中的应用[D];河北工业大学;2002年

8 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年

9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年

10 张国江;软计算方法和数据挖掘理论在电力系统负荷预测中的应用[D];浙江大学;2002年

相关硕士学位论文 前10条

1 潘春华;中文农林信息资源主动推送服务研究[D];北京林业大学;2005年

2 马磊;面向工作流的数据挖掘系统[D];河北工业大学;2000年

3 蒋运承;Rough集和Rough关系数据库中熵的研究[D];广西师范大学;2000年

4 田容;人工神经网络在数据挖掘中的应用研究[D];华北工学院;2001年

5 金涛;基于遗传算法的组卷系统的研究[D];燕山大学;2001年

6 李艳;基于模糊示例学习的模糊控制器[D];河北大学;2001年

7 熊伟;不完整关系数据库中关联规则挖掘问题的研究[D];华中师范大学;2001年

8 张伟钢;数据挖掘技术在市场调研中的应用研究[D];西北工业大学;2001年

9 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年

10 苏毅娟;数据挖掘中若干问题的研究[D];广西师范大学;2001年

【二级参考文献】

相关期刊论文 前2条

1 韩立新,陈贵海,谢立;一个面向Internet的个性化信息检索系统模型[J];电子学报;2002年02期

2 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期

【相似文献】

相关期刊论文 前10条

1 熊晶;王爱民;徐建良;;基于领域本体的信息检索优化策略[J];计算机工程与设计;2011年08期

2 ;第七届全国信息检索学术会议(CCIR 2011)征文通知[J];模式识别与人工智能;2011年03期

3 余肖生;司新霞;;基于聚类分析的元搜索引擎模型[J];重庆理工大学学报(自然科学);2011年06期

4 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期

5 杨永健;;浅议图书馆新型OPAC系统发展趋势——以汇文OPAC系统为例[J];四川图书馆学报;2011年03期

6 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期

7 吴谋硕;;基于用户信息的信息检索效果提高策略[J];电脑知识与技术;2011年21期

8 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期

9 吴庆涛;芮跃峰;张卫星;;个性化搜索引擎中的用户兴趣模型分析与研究[J];现代计算机;2011年08期

10 艾丹祥;左晖;杨君;;网络信息检索中相关反馈技术的Java实现[J];电脑知识与技术;2011年16期

相关会议论文 前10条

1 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

2 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

3 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

4 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

6 吴立德;黄萱菁;;前言[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

7 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年

9 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年

10 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

相关重要报纸文章 前10条

1 希安;微软试水信息检索[N];经济日报;2004年

2 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年

3 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年

4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年

5 于振海;Microsoft Office 2003的翻译服务你用了吗?[N];中国电脑教育报;2004年

6 高丽华;信息化遭遇新雷区[N];计算机世界;2007年

7 李茂 编译;创新是技术素养的第一要求[N];中国教师报;2007年

8 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年

9 西安 张树忠 时剑;如何使用Word 2003翻译功能[N];电子报;2004年

10 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年

相关博士学位论文 前10条

1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年

2 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年

3 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年

4 董道国;高维数据索引结构研究[D];复旦大学;2005年

5 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年

6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年

7 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年

8 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年

9 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年

10 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年

相关硕士学位论文 前10条

1 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年

2 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年

3 陈琳;基于搜索引擎的问答系统若干关键技术研究与实现[D];天津大学;2008年

4 陈默;基于神经网络的元搜索引擎[D];浙江大学;2006年

5 种梅;元搜索引擎中的关键技术研究[D];山东师范大学;2008年

6 张帆;新闻信息采集系统的设计与实现[D];国防科学技术大学;2008年

7 胡升泽;个性化元搜索引擎若干关键技术研究[D];国防科学技术大学;2008年

8 李信利;基于信息类别的元搜索引擎研究[D];山东大学;2006年

9 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年

10 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年



本文编号:2089870

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2089870.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户437bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com