当前位置:主页 > 科技论文 > 搜索引擎论文 >

网络搜索引擎与专家检索系统框架和模型研究

发布时间:2016-08-24 06:27

  本文关键词:网络搜索引擎与专家检索系统框架和模型研究,由笔耕文化传播整理发布。


《北京邮电大学》 2009年

网络搜索引擎与专家检索系统框架和模型研究

李晨  

【摘要】: 伴随着网络的不断发展,搜索引擎的发展也在不断的前进之中,并且日趋的成为了网络中的最重要的信息检索工具和一种至关重要的网络应用。搜索引擎的框架和检索模型是搜索引擎中的最核心技术,本文主要是对搜索引擎的框架和检索模型进行研究和改进,然后将其应用到专家检索系统中,最终为基于对象的规则化搜索引擎的设计做铺垫。 本文的主要工作体现在一下几个方面: 第一,本文介绍了应用最广泛的基于全文检索的搜索引擎的框架和检索模型。然后对最经典和最常用的检索模型进行了评价实验,在此基础上研究了统计语言模型在不同平滑方法下的不同表现。 第二,针对专家检索任务的要求和特点,使用两阶段检索模型和专家窗口模型作为解决方案来完成专家检索任务。两阶段检索模型是在针对新检索任务时采用的一种新的检索方法,它是在利用一般的检索模型的基础上对检索的过程进行了一种新的改进尝试。当然这种尝试继承了一般的检索模型,这里作者将之前提及的检索模型根据具体的情况以优化的形式融入到两阶段模型中,在专家检索中获得了较好的检索效果。 第三,对专家检索的的第二个方法——专家窗口,本文也进行了多模型的实验,并与两阶段的检索方法进行对比,选择出较好的检索解决方案作为校园对象搜索引擎的检索模型。 第四,利用专家检索系统的检索模型来实现基于校园网内容的对象搜索引擎。该引擎不仅可以和普通搜索引擎一样返回文档的检索结果,还能返回和查询词相关的从语料中处理出来的相关对象,即以一种结构化的信息作为返回结果。 在论文的最后总结全文,指出课题中有待进一步深入研究的问题。

【关键词】:
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.3
【目录】:

  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 绪论10-16
  • 1.1 研究背景10-12
  • 1.2 研究现状12-13
  • 1.3 论文课题来源13
  • 1.4 论文的贡献和主要创新点13-14
  • 1.5 论文组织14-16
  • 第二章 基于全文检索技术的网络搜索引擎框架介绍16-23
  • 2.1 网络搜索引擎的分类16-17
  • 2.2 基于全文检索的网络搜索引擎的框架17-22
  • 2.2.1 简单化的搜索引擎结构18-20
  • 2.2.2 细化的搜索引擎的结构20-22
  • 2.3 本章小结22-23
  • 第三章 网络搜索引擎的检索模型介绍23-40
  • 3.1 基于集合的检索模型23-24
  • 3.2 基于代数集的检索模型24-27
  • 3.2.1 向量空间模型24-25
  • 3.2.2 融入tf-idf因子的向量空间模型25-27
  • 3.3 基于概率统计的检索模型27-30
  • 3.3.1 经典概率模型——二元独立模型和经典的BM25公式27-30
  • 3.3.2 其他的常用概率模型——双Poisson分布模型30
  • 3.4 基于统计语言的检索模型30-39
  • 3.4.1 查询似然模型31-35
  • 3.4.2 查询似然模型中的平滑技术35-38
  • 3.4.2.1 Jelinek-Mercer平滑35-37
  • 3.4.2.2 Absolute-Discounting平滑37-38
  • 3.4.2.3 Bayesian-Dirichlet平滑38
  • 3.4.3 其他的统计语言模型38-39
  • 3.5 其他检索模型39
  • 3.6 本章小结39-40
  • 第四章 检索结果的评价和模型实验比较40-48
  • 4.1 检索结果的评判标准40-41
  • 4.2 模型的比较实验41-43
  • 4.2.1 实验数据介绍和相关的预处理工作41-42
  • 4.2.2 不同模型的实验和结果对比42-43
  • 4.3 平滑方法参数变化对语言模型检索结果的影响43-47
  • 4.3.1 Byesian-Dirichlet平滑43-44
  • 4.3.2 Jelinek-Mercer平滑44-46
  • 4.3.3 Absolute—Discount平滑46-47
  • 4.4 本章工作总结47-48
  • 第五章 专家检索系统48-64
  • 5.1 专家检索任务介绍48-50
  • 5.1.1 专家检索的任务48
  • 5.1.2 专家检索问题的研究48-50
  • 5.1.2.1 文档中专家的确定48-49
  • 5.1.2.2 专家和检索词相关度的确定49-50
  • 5.2 专家检索系统50-58
  • 5.2.1 基于两阶段检索的专家检索系统50-56
  • 5.2.1.1 两阶段检索框架——两索引的检索方法51-54
  • 5.2.1.2 两阶段检索核心——第二阶段检索模型的选择54-56
  • 5.2.2 基于专家窗口的专家检索系统56-58
  • 5.3 专家检索系统的实验对比58-63
  • 5.3.1 基于两阶段检索的专家检索系统实验58-61
  • 5.3.2 基于专家窗口的专家检索系统实验61-62
  • 5.3.3 综合比较两种方法的专家检索系统62-63
  • 5.4 本章工作总结63-64
  • 第六章 校园对象搜索引擎64-68
  • 6.1 校园对象搜索引擎介绍64-65
  • 6.2 校园对象搜索引擎框架65-66
  • 6.3 校园对象搜索引擎运行效果66-68
  • 第七章 结束语68-69
  • 参考文献69-71
  • 致谢71-72
  • 作者攻读学位期间发表的学术论文目录72
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 顾小林;卞艺杰;浦徐进;;基于改进KS方法的食品安全追溯信息检索模型[J];软科学;2011年08期

    2 杨为民;李龙澍;;基于场论的高精度信息检索研究[J];计算机工程;2011年15期

    3 江潇俊;李善平;刘思屹;;基于本体的关联知识可视化检索模型[J];计算机工程;2011年16期

    4 涂俊翔;朱晓林;;协同企业产品生命周期管理系统信息的检索[J];中国工程机械学报;2011年02期

    5 杨艳;朱戈;范文彬;;一种基于文档拓扑的相似性搜索算法[J];计算机工程与应用;2011年26期

    6 李广原;雷鸿;;一种新的CAI设计与开发平台SnPCAIP[J];计算机时代;2011年07期

    7 李琦;;本体用于信息检索的研究浅析[J];情报探索;2011年07期

    8 王宏生;张敏;;一种基于语义网的相似度计算模型[J];微计算机信息;2011年07期

    9 程慧平;陈永超;;国内知识检索研究进展[J];图书情报工作;2011年10期

    10 李刚;钱省三;叶春明;;基于Jena的知识检索系统的优化研究[J];微计算机信息;2011年08期

    中国重要会议论文全文数据库 前10条

    1 杨小锐;林磊;孙承杰;刘秉权;;基于结构挖掘的论坛检索模型[A];第六届全国信息检索学术会议论文集[C];2010年

    2 沈水荣;;建立计算机知识点检索模型探索语义自动识别的相关问题——关于“人民金典”语义自动识别系列产品研发的理论思考[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年

    3 申展;王建会;吴爱华;胡运发;;互关联后继树模型——一种新颖的全文检索模型[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

    4 朱治国;孙长嵩;;一个异构构件库群联合检索模型[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

    5 孙斌;吕学强;苏祺;;义项矩阵模型SMM简介[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

    6 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[A];广西计算机学会2005年学术年会论文集[C];2005年

    7 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年

    8 李勇;邵世煌;;利用神经网络建立产品零件功能设计的分类检索模型[A];1995年中国控制会议论文集(下)[C];1995年

    9 汪明;熊璋;吴晶;;基于LDAP的多语言概念检索模型的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

    10 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年

    中国重要报纸全文数据库 前4条

    1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;[N];计算机世界;2003年

    2 中国科学院计算技术研究所 王 斌;[N];计算机世界;2004年

    3 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;[N];计算机世界;2003年

    4 本报驻昆山首席记者 姚喜新;[N];苏州日报;2010年

    中国博士学位论文全文数据库 前10条

    1 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年

    2 胡熠;面向信息检索的文本内容分析[D];上海交通大学;2007年

    3 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年

    4 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年

    5 茹昭;企业信息检索中的对象检索方法研究[D];北京邮电大学;2008年

    6 王珂;支持快速设计的CBR技术及其应用研究[D];南京航空航天大学;2007年

    7 刘念;DAS模型中的数据库加密与密文检索研究[D];北京邮电大学;2010年

    8 张静;视频信息检索研究[D];复旦大学;2006年

    9 乔林;基于多关键词检索的企业竞争情报搜集方法研究[D];中国科学技术大学;2006年

    10 唐彬;基于本体的构件检索研究[D];复旦大学;2007年

    中国硕士学位论文全文数据库 前10条

    1 李晨;网络搜索引擎与专家检索系统框架和模型研究[D];北京邮电大学;2009年

    2 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年

    3 田晋坤;基于本体术语关系的SBN检索模型扩展[D];河北大学;2011年

    4 王立政;基于本体的知识检索模型优化研究[D];吉林大学;2011年

    5 纪明奎;基于语义网的个性化信息检索模型研究[D];黑龙江大学;2007年

    6 袁亮;一个基于WEB的信息组织与检索模型(WIORS)研究[D];武汉大学;2005年

    7 徐坤;基于关系数据库搜索引擎的研究[D];长春理工大学;2008年

    8 曹立勇;基于本体的检索模型的研究[D];安徽大学;2010年

    9 孔世明;基于自然语言识别的智能检索研究与实现[D];重庆大学;2006年

    10 邱晓俊;面向特殊主题的排序与检索算法研究[D];江西理工大学;2012年


      本文关键词:网络搜索引擎与专家检索系统框架和模型研究,,由笔耕文化传播整理发布。



    本文编号:101587

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/101587.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户7d304***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com