当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于语义本体的垂直搜索引擎模型研究

发布时间:2016-08-04 19:07

  本文关键词:基于语义本体的垂直搜索引擎模型研究,,由笔耕文化传播整理发布。


《大连海事大学》 2011年

基于语义本体的垂直搜索引擎模型研究

石京  

【摘要】:随着互联网的普及和Web信息量的增长,越来越多的用户倾向于使用搜索引擎获取各种信息。目前,搜索引擎主要分为两类:通用搜索引擎和垂直搜索引擎。其中,垂直搜索引擎是针对通用搜索引擎信息量大、查询不准确等问题提出来的新型搜索引擎服务模式,是搜索引擎行业细分化的必然趋势。 但是垂直搜索引擎仍采用基于关键词的检索方式,无法满足用户语义检索的要求。产生这种问题的根本原因是搜索引擎搜集的文档缺乏语义标注信息,导致在信息检索阶段,搜索引擎无法对用户的查询请求进行语义分析,而本体能够完成语义信息的标注,实现语义搜索,将本体技术与搜索引擎结合成为研究语义搜索引擎的重要手段。 因此,本文主要研究了领域本体的构建方法、基于本体的结构化信息抽取方法和利用领域本体对用户的查询请求进行语义查询扩展等技术,提出了一种基于本体的垂直搜索引擎框架结构,并设计实现了原型系统。本文完成的工作主要有: (1)通过对餐饮信息的分析构建了餐饮领域本体EnCatering,包括餐饮店铺类、菜品类、店铺评论类和地址信息类,对各类的属性和类之间的关系进行定义和描述,更好地实现餐饮领域知识的表示和信息组织。 (2)根据餐饮网站的特点,使用基于规则的信息抽取技术完成餐饮领域本体实例的自动构建,为用户查询请求的语义分析和语义扩展打下基础。 (3)对本体中的概念、属性、关系和实例建立索引,利用索引完成对用户查询请求的语义分析和扩展,实现语义信息检索,着重探讨了关键词-本体实体匹配的策略和查询语义扩展的流程。 最后设计实现了基于本体的餐饮垂直搜索引擎Catering Search。实验表明,Catering Search能较好地解决目前基于关键词检索中存在的问题,说明基于本体的垂直搜索具有实际意义。

【关键词】:
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3
【目录】:

  • 摘要5-6
  • ABSTRACT6-10
  • 第1章 绪论10-17
  • 1.1 研究背景和研究意义10-11
  • 1.1.1 研究背景10-11
  • 1.1.2 研究意义11
  • 1.2 基于本体的垂直搜索引擎研究现状11-14
  • 1.2.1 基于本体的信息抽取11-12
  • 1.2.2 基于本体的信息检索12-13
  • 1.2.3 基于本体的垂直搜索引擎13-14
  • 1.3 研究内容及技术路线14-17
  • 1.3.1 研究内容14-15
  • 1.3.2 技术路线15-17
  • 第2章 垂直搜索引擎及本体相关理论基础17-32
  • 2.1 垂直搜索引擎概述17-24
  • 2.1.1 垂直搜索引擎体系结构18-20
  • 2.1.2 垂直搜索引擎关键技术20-23
  • 2.1.3 垂直搜索引擎面临的问题23-24
  • 2.2 本体知识概述24-27
  • 2.2.1 本体定义24-25
  • 2.2.2 本体在垂直搜索引擎中的作用25
  • 2.2.3 本体的建模原语25-27
  • 2.3 本体描述语言27-31
  • 2.3.1 RDF/RDFS27-28
  • 2.3.2 OWL28-31
  • 2.4 本章小结31-32
  • 第3章 领域本体的构建及基于本体的信息抽取研究32-47
  • 3.1 领域本体的构建方法和原则32-34
  • 3.1.1 领域本体的构建方法32-33
  • 3.1.2 领域本体的构建原则33-34
  • 3.1.3 本体构建工具34
  • 3.2 基于本体的信息抽取技术34-38
  • 3.2.1 信息抽取技术分类34-36
  • 3.2.2 基于本体的结构化信息抽取36-38
  • 3.3 餐饮领域本体的构建及餐饮实例的自动抽取38-44
  • 3.3.1 餐饮网站分析38-40
  • 3.3.2 餐饮领域本体的构建40-42
  • 3.3.3 餐饮实例的自动抽取42-44
  • 3.4 本体的存储44-46
  • 3.5 本章小结46-47
  • 第4章 基于本体的查询语义扩展模型47-56
  • 4.1 垂直搜索引擎信息检索模型47-50
  • 4.1.1 信息检索流程47-48
  • 4.1.2 信息检索模型分类48-50
  • 4.1.3 排序算法50
  • 4.2 基于本体的语义检索模型50-55
  • 4.2.1 基于本体的语义检索模型框架结构51-53
  • 4.2.2 查询预处理53
  • 4.2.3 关键词-本体实体匹配53-54
  • 4.2.4 查询语义扩展54-55
  • 4.3 本章小结55-56
  • 第5章 基于本体的餐饮垂直搜索引擎实现56-70
  • 5.1 系统总体框架56-57
  • 5.2 餐饮本体构建的实现57-59
  • 5.3 基于本体的餐饮垂直搜索引擎的实现59-66
  • 5.3.1 信息采集模块59-62
  • 5.3.2 网页结构化信息抽取模块62-64
  • 5.3.3 信息检索模块64-66
  • 5.4 用户界面的设计与实现66-69
  • 5.5 本章小结69-70
  • 第6章 总结与展望70-72
  • 6.1 总结70
  • 6.2 展望70-72
  • 参考文献72-76
  • 攻读学位期间公开发表论文76-78
  • 致谢78
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 顾鹏尧;;让搜索引擎更好地服务于教育教学[J];科学24小时;2003年Z1期

    2 陈新颜;垂直搜索引擎辨析[J];现代情报;2004年09期

    3 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年32期

    4 胡洁;丁宁;关静;曹福年;张磊;;基于“PUBMED+PDF”的医学垂直搜索引擎的实践[J];信息系统工程;2009年05期

    5 一林;;垂直搜索:前进路上的喜与忧[J];互联网天地;2010年02期

    6 牟思;;基于垂直搜索引擎的学校网站的研究与建设[J];中国教育技术装备;2011年21期

    7 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期

    8 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年31期

    9 边凯;;你会搜索吗?[J];中国计算机用户;2007年23期

    10 宿建光;;指点通:移动垂直搜索的创新者[J];通信世界;2007年03期

    中国重要会议论文全文数据库 前10条

    1 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

    2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

    3 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年

    4 赵丽;李明;王彤;;基于本体的建模方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

    5 周安美;于德介;郭建文;;基于设备维护本体的故障诊断研究[A];机械动力学理论及其应用[C];2011年

    6 刘宝良;李建中;张兆功;;基于本体的Web信息组织[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

    7 梁晔;鲍泓;徐光美;;基于本体的数字博物馆检索系统的设计与实现[A];创意科技助力数字博物馆[C];2011年

    8 苗壮;李杰;王智学;刘剑豪;;基于本体的战场信息资源互操作模型研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

    9 李雪竹;周国祥;;基于本体的语义网技术在信息检索中的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

    10 ;基于本体的个性化搜索引擎[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

    中国重要报纸全文数据库 前10条

    1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;[N];计算机世界;2010年

    2 王艳;[N];中国旅游报;2000年

    3 赛迪网 方刚;[N];中国计算机报;2000年

    4 王靖;[N];人民日报海外版;2000年

    5 记者 王浒;[N];中国旅游报;2009年

    6 本报记者 王宏;[N];中国计算机报;2001年

    7 徐瑾 张玉;[N];人民邮电;2009年

    8 本报记者 王晓雁;[N];法制日报;2009年

    9 记者 吴德群;[N];深圳特区报;2009年

    10 本报记者 胡钰;[N];华夏时报;2009年

    中国博士学位论文全文数据库 前10条

    1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年

    2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

    3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年

    4 李冠宇;基于智能体和本体的语义数据集成研究[D];大连理工大学;2010年

    5 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年

    6 刘勇;基于本体的家电领域功能知识表达研究[D];中国海洋大学;2011年

    7 沈瑾;基于本体的产品延伸服务建模与配置研究[D];上海交通大学;2012年

    8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年

    9 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年

    10 王宇华;基于本体的流程类业务需求建模方法研究[D];哈尔滨工程大学;2011年

    中国硕士学位论文全文数据库 前10条

    1 周娟;基于本体的工程预算管理系统的研究与实现[D];成都理工大学;2010年

    2 万慕晨;基于本体的数字化备课资源知识组织个案研究[D];西南大学;2011年

    3 毛鑫;基于本体的语义信息集成与知识发现研究[D];华北电力大学(北京);2010年

    4 叶密;基于地理本体的信息检索[D];安徽大学;2010年

    5 赵天行;基于本体的应急救援系统研究[D];重庆大学;2010年

    6 周艳;基于本体的信息检索的研究与应用[D];电子科技大学;2010年

    7 石京;基于语义本体的垂直搜索引擎模型研究[D];大连海事大学;2011年

    8 周源;基于本体的语义垂直搜索引擎研究[D];北京交通大学;2011年

    9 付斐;基于本体的数据集成及其应用[D];河北科技大学;2010年

    10 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年


      本文关键词:基于语义本体的垂直搜索引擎模型研究,由笔耕文化传播整理发布。



    本文编号:84966

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/84966.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户61b71***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com