基于遗传算法的专业元搜索引擎技术研究
本文关键词:基于遗传算法的专业元搜索引擎技术研究,,由笔耕文化传播整理发布。
【摘要】:当今互联网技术蓬勃发展,网络普及率直线上升,网民的数量以指数量级增长,由于网络使用人数的增多,网络信息量也是每天都在大量增加,目前网络的信息量非常庞大,现在的网民使用网络去查找信息的意识不断增强,但是由于不同的网民对专业信息需求面各不相同再加上现在网络信息爆炸式的增长,单单依靠独立的搜索引擎去查找真正自己需要的信息是非常困难的,那么怎么解决针对不同领域的用户搜索引擎能够返回用户相关领域的结果,使搜索引擎返回的结果更能人性的接近用户对某一专业领域的需求,成为各大搜索引擎运营商的首要任务。 本文深层次的分析和研究了各个独立搜索引擎的相关理论信息和元搜索引擎的相关理论信息,结合各自的优点改进彼此的缺点,建立起了一个面向培训领域的专业元搜索引擎。由于本文的搜索引擎是面向专业领域的,所以就要分析网页结果集的各个网页的专业相关度,网页相关度的计算就要建立一个网页相关度模型,用模型来预测计算网页的专业相关的值并且利用这个值对网页进行排序,把结果返回给查询用户,本文就是利用改进的遗传算法在专业词汇表里筛选出对专业网页排序影响较高的关键词然后建网页相关度模型,最后对模型进行检测验证了模型的可靠性。 本文根据改进的遗传算法建立的网页相关度模型作为网页排序的结果优化算法,并且建立起了面向教育培训领域的专业元搜索引擎,介绍了相关模块的设计与实现,最后对这个搜索引擎的搜索结果进行了评价和分析。
【关键词】:专业搜索引擎 元搜索引擎 遗传算法 专业相关度
【学位授予单位】:大连交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
- 摘要5-6
- Abstract6-7
- 目录7-9
- 绪论9-11
- 一、课题研究背景9
- 二、论文的意义以及主要研究内容9-11
- 第一章 专业元搜索引擎相关理论技术研究11-26
- 1.1 引言11
- 1.2 搜索引擎概述11-17
- 1.2.1 搜索引擎的发展历史11-12
- 1.2.2 搜索引擎的研究现状12-13
- 1.2.3 搜索引擎发展趋势13-14
- 1.2.4 搜索引擎的分类14-15
- 1.2.5 搜索引擎的原理和结构15-17
- 1.3 专业搜索引擎概述17-23
- 1.3.1 专业搜索引擎的研究现状17-19
- 1.3.2 专业搜索引擎的研究意义19-21
- 1.3.3 专业搜索引擎特点及优势21-22
- 1.3.4 专业搜索引擎的结构和原理22-23
- 1.4 元搜索引擎概述23-25
- 1.4.1 元搜索引擎的特点及优势23
- 1.4.2 元搜索引擎分类23-24
- 1.4.3 元搜索引擎原理和结构24-25
- 本章小结25-26
- 第二章 遗传算法理论研究26-35
- 2.1 引言26
- 2.2 遗传算法发展历史及现状26-29
- 2.2.1 发展历史26-28
- 2.2.2 发展现状28-29
- 2.3 遗传算法基本思想及特点29-31
- 2.4 遗传算法基本操作步骤31
- 2.5 遗传算法流程31-34
- 本章小结34-35
- 第三章 遗传算法改进研究35-42
- 3.1 引言35
- 3.2 选择算子的改进35-38
- 3.3 交叉算子的改进38-39
- 3.4 变异算子的改进39-40
- 3.5 改进遗传算法的流程40-41
- 本章小结41-42
- 第四章 基于改进的遗传算法的网页相关度模型建立42-52
- 4.1 引言42
- 4.2 最小二乘法研究42-43
- 4.2.1 多元线性回归最小二乘解法42-43
- 4.2.2 求解正规方程组的算法43
- 4.3 网页相关度模型建立43-51
- 4.3.1 编码43-46
- 4.3.2 适应度函数46-50
- 4.3.3 模型建立50-51
- 4.4 模型检测51
- 本章小结51-52
- 第五章 面向培训领域的专业元搜索引擎的设计与实现52-70
- 5.1 引言52
- 5.2 专业元搜索引擎系统的设计52-62
- 5.2.1 专业元搜索引擎系统结构52-53
- 5.2.2 查询代理模块的设计与实现53-60
- 5.2.3 URL管理器60-61
- 5.2.4 分词系统61-62
- 5.3 专业元搜索引擎的实现62-68
- 5.3.1 系统实现62-63
- 5.3.2 结果实验与分析63-68
- 本章小结68-70
- 第六章 总结70-71
- 参考文献71-74
- 攻读硕士学位期间发表的学术论文74-75
- 致谢75
【相似文献】
中国期刊全文数据库 前10条
1 刘丽,孙燕唐;智能型元搜索引擎的设计与实现[J];计算机工程;2003年06期
2 谢树龙,张杰,刘洪,仪熊晓;元搜索引擎技术分析[J];天津通信技术;2004年02期
3 何晓聪;元搜索引擎的理论与实践[J];现代情报;2004年08期
4 曾伟忠,徐昕;搜索引擎及元搜索引擎工作原理及存在的不足[J];图书馆学刊;2004年05期
5 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机(专业版);2004年05期
6 刘畅,林剑锋,王雁杰;元搜索引擎的调查分析[J];现代图书情报技术;2004年09期
7 徐戈;一个文件元搜索引擎的设计与实现[J];情报探索;2004年04期
8 吴国文,乐嘉锦,陈国梁;源搜索可定制的元搜索引擎设计技术[J];计算机应用与软件;2004年12期
9 黄素珍,陈宁江,苏德富;并发多元搜索引擎的研究与应用[J];广西大学学报(自然科学版);2005年02期
10 原福永;梁顺攀;;元搜索引擎的现状与发展[J];计算机工程与设计;2005年12期
中国重要会议论文全文数据库 前9条
1 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
2 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 诸葛建伟;袁春阳;;基于元搜索引擎实现被篡改网站发现与攻击者调查剖析[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
6 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前1条
1 喻芸;管理和科研:如何利用网络资源[N];学习时报;2007年
中国博士学位论文全文数据库 前3条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
2 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
3 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
4 李炎茗;元搜索引擎的现状研究与改进设计[D];华中师范大学;2002年
5 洪颖;面向化工领域的智能元搜索引擎系统的研究与设计[D];北京化工大学;2004年
6 蔡春勇;元搜索引擎的智能化及其设计与实验[D];福州大学;2006年
7 王小朋;基于代理的元搜索引擎的研究[D];辽宁工程技术大学;2005年
8 魏振达;基于服务的元搜索引擎研究[D];南华大学;2006年
9 李信利;基于信息类别的元搜索引擎研究[D];山东大学;2006年
10 谢江标;最优搜索理论在元搜索引擎中的应用研究[D];电子科技大学;2007年
本文关键词:基于遗传算法的专业元搜索引擎技术研究,由笔耕文化传播整理发布。
本文编号:263677
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/263677.html