当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于本体的智能搜索引擎研究与应用

发布时间:2016-05-29 11:01

  本文关键词:基于本体的智能搜索引擎研究与应用,由笔耕文化传播整理发布。


《青岛科技大学》 2010年

基于本体的智能搜索引擎研究与应用

李振振  

【摘要】: 随着因特网的不断发展,网络信息资源也与日俱增。面对内容冗余、结构复杂的知识海洋,如何准确、及时、全面的获取所需要的信息,成为人们所关注的焦点。传统基于简单关键字匹配的搜索技术已经不能满足用户日益增长的需求,本体作为一种能在语义和知识层次上描述信息的概念模型,具有良好的概念层次结构和对逻辑推理的支持,基于本体的语义检索技术已经成为国内外学者研究的热点。 本文首先讨论了国内外语义检索的进展情况,对传统搜索引擎原理、分类、评价标准以及存在的缺陷、不足进行分析。其次,在本体相关理论研究基础上,结合领域本体构建策略,实现了家电领域本体的构建和存储。再者,对当前制约语义检索发展瓶颈的语义标注技术进行研究,通过对当前语义标注方法、工具的分析,开发一款领域本体标注工具AnnTool。最后,结合家电领域本体以及语义标注技术,提出一种基于领域本体的搜索引擎框架,并且进行了简单实验验证。该框架包括领域信息采集、预处理、语义索引、查询扩展、结果重排5个模块,其中在领域信息采集模块,通过对目前爬虫采集策略的分析,提出一种基于内容领域相关度和超链接分析相结合的网页信息采集策略,并给出对应的采集网页综合价值评价公式;预处理使用AnnTool完成文档信息语义标注;语义索引实现元数据索引;查询扩展利用本体框架对查询条件进行推理扩展;结果排序采用文档价值、文档本体匹配相似度权值以及Lucene评分机制相结合计算文档得分进行排序。通过实验分析表明,基于本体的搜索引擎比传统关键字匹配搜索具有更高查全率和查准率。

【关键词】:
【学位授予单位】:青岛科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3
【目录】:

  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 绪论9-18
  • 1.1 研究背景9-10
  • 1.2 相关领域研究现状10-15
  • 1.2.1 搜索引擎发展史10-11
  • 1.2.2 国外研究现状11-13
  • 1.2.3 国内研究现状13-15
  • 1.3 研究内容15-16
  • 1.4 课题研究的目的和意义16
  • 1.5 本文组织结构16-18
  • 第二章 搜索引擎相关技术研究18-23
  • 2.1 搜素引擎的分类18-19
  • 2.2 搜索引擎原理19-20
  • 2.3 搜索引擎评价标准20-21
  • 2.4 当前信息检索的的不足21-22
  • 2.5 搜索引擎发展趋势22-23
  • 第三章 本体相关技术研究及家电领域本体的构建23-38
  • 3.1 本体概念23-27
  • 3.1.1 本体定义23-24
  • 3.1.2 本体建模元语24
  • 3.1.3 本体描述语言24-27
  • 3.2 本体分类27-28
  • 3.3 本体构建28-30
  • 3.3.1 本体构建方法28-29
  • 3.3.2 本体构建工具29-30
  • 3.4 本体应用30
  • 3.5 领域本体构建30-38
  • 3.5.1 领域本体理论30-31
  • 3.5.2 家电领域本体构建过程31-32
  • 3.5.3 家电领域本体的建立32-38
  • 第四章 语义标注工具-AnnTool38-48
  • 4.1 语义标注简介38-39
  • 4.2 语义标注原型分析39-40
  • 4.2.1 语义标注原型分析39
  • 4.2.2 目前语义标注原型的不足39-40
  • 4.3 现有语义标注工具比较40-41
  • 4.4 语义标注工具——AnnTool41-48
  • 4.4.1 本体标注工具的设计42-44
  • 4.4.2 汉语言分词技术44
  • 4.4.3 Jena 接口44-45
  • 4.4.4 本体标注工具的实现45-47
  • 4.4.5 结语47-48
  • 第五章 基于家电领域本体的搜索引擎设计48-57
  • 5.1 系统总体框架48-49
  • 5.2 领域本体处理49
  • 5.3 领域知识采集49-54
  • 5.3.1 采集工作流程50-51
  • 5.3.2 采集策略分析51-54
  • 5.4 预处理模块54
  • 5.5 语义索引54-55
  • 5.6 查询扩展55-56
  • 5.7 查询重排56-57
  • 第六章 基于家电领域本体的搜索引擎的实现57-75
  • 6.1 系统开发运行环境57-63
  • 6.1.1 网络爬虫-Heritrix57-59
  • 6.1.2 开源搜索引擎开发包-Lucene59-63
  • 6.2 系统架构63-64
  • 6.3 领域本体搜索引擎 OntoSE 的实现64-70
  • 6.3.1 家电领域资源采集64-67
  • 6.3.2 预处理实现67-69
  • 6.3.3 语义索引69
  • 6.3.4 查询扩展69-70
  • 6.3.5 结果排序70
  • 6.4 搜索引擎演示70-73
  • 6.5 性能测试73-75
  • 6.5.1 系统测试73-74
  • 6.5.2 结果分析74-75
  • 总结与展望75-76
  • 参考文献76-80
  • 致谢80-81
  • 攻读学位期间发表(录用)的学术论文目录81-82
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【参考文献】

    中国期刊全文数据库 前4条

    1 欧阳晔,姜浩,潘顺;XRQL——基于XML的新型RDF查询语言[J];微机发展;2003年04期

    2 朱小娟;陈特放;;基于SVM的词频统计中文分词研究[J];微计算机信息;2007年30期

    3 刘凤华,朱欣娟;信息系统领域的本体模型研究[J];西安工程科技学院学报;2003年01期

    4 李学勇,欧阳柳波,李国徽;非贪婪策略在WEB搜索中的应用[J];中央民族大学学报(自然科学版);2004年03期

    中国博士学位论文全文数据库 前1条

    1 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年

    【共引文献】

    中国期刊全文数据库 前10条

    1 陈曦;陈世鸿;;化学学科语义模型的研究[J];武汉大学学报(理学版);2005年S2期

    2 解丹;应时;曹虹华;贾向阳;崔华;肖波;;基于语义的服务资源描述模型RDF4S[J];武汉大学学报(理学版);2008年01期

    3 张娜;李宝敏;;语义检索及其关键技术研究[J];计算机技术与发展;2006年11期

    4 刘芳;林拉;;基于本体的特定领域软件体系结构设计的研究[J];计算机技术与发展;2006年12期

    5 江克勤;张玉州;王一宾;;基于语义的Web信息检索[J];计算机技术与发展;2007年01期

    6 杜光芹;张化祥;赵瑞东;;主题Web挖掘研究[J];计算机技术与发展;2008年02期

    7 李跃民;王浩;赵生慧;计成超;;智能辅助教学系统中知识点切分歧义消除研究[J];计算机技术与发展;2009年04期

    8 拜战胜;徐德智;彭佳红;陈光仪;;基于主题本体的信息采集模型研究[J];计算机技术与发展;2009年10期

    9 王继东;张瑜;李娜;;基于本体的语义检索技术研究与实现[J];计算机技术与发展;2009年10期

    10 张鑫;陈梅;王翰虎;王嫣然;;基于视觉特征和领域本体的Web信息抽取[J];计算机技术与发展;2011年02期

    中国重要会议论文全文数据库 前10条

    1 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

    2 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

    3 景东升;;基于本体和agent的地理空间信息语义共享初探[A];中国地理信息系统协会第八届年会论文集[C];2004年

    4 潘国民;李刚强;邱旋;;基于ePCANS模型的C2组织本体建模方法研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年

    5 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

    6 袁兴宇;王挺;周会平;肖君;;以本体构造中文信息过滤中的需求模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

    7 孙晓玲;林鸿飞;;统一语义视图下的垂直领域跨语言检索模型[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

    8 冯淑芳;王素格;;面向观点挖掘的汽车本体知识库的构建[A];第六届全国信息检索学术会议论文集[C];2010年

    9 苗虹;葛世伦;;基于本体的企业信息系统分析[A];2004年中国管理科学学术会议论文集[C];2004年

    10 李鹏;朱青;任安建;胡伟;杜小勇;;支持短语识别的关系数据库关键词查询算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

    中国博士学位论文全文数据库 前10条

    1 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年

    2 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年

    3 曹虹华;语义编程语言SPROGLE及其实现机制研究[D];武汉大学;2009年

    4 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年

    5 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年

    6 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年

    7 唐素勤;面向语义Web的描述逻辑本体构建[D];中南大学;2011年

    8 谢琪;基于本体方法构建中医药概念信息模型的方法学示范研究[D];中国中医科学院;2011年

    9 曾鸣;基于SOA的森林资源空间信息分级服务研究[D];中国林业科学研究院;2011年

    10 刘伟;基于地理本体的空间数据服务发现与集成[D];中国矿业大学;2010年

    【同被引文献】

    中国期刊全文数据库 前4条

    1 王晓盈;王晓璇;刘鹏;;中文本体构建及可视化研究[J];计算机技术与发展;2010年02期

    2 马中杰;郑诚;苏喻;;一种基于知识库的语义检索系统模型[J];微型机与应用;2010年20期

    3 许文;都云程;李渝勤;施水才;;一种通用HTML网页主题信息提取方法[J];现代图书情报技术;2007年01期

    4 张海英;;搜索引擎技术与原理剖析[J];胜利油田职工大学学报;2008年04期

    【二级参考文献】

    中国期刊全文数据库 前10条

    1 朱辉,杨扬,颉斌,封筠;SVM在小字符集手写体汉字识别中的应用研究[J];微计算机信息;2004年04期

    2 曾庆田,曹存根,眭跃飞,司晋新,田国刚,刘汉武;基于本体的数学知识获取与知识继承机制研究[J];微电子学与计算机;2003年09期

    3 高凤荣,杜小勇,王珊;一种基于稀疏矩阵划分的个性化推荐算法[J];微电子学与计算机;2004年02期

    4 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期

    5 苏晓路;钱平;颜蕴;崔运鹏;胡海燕;李景;;农业科技信息智能检索系统中的知识组织[J];现代图书情报技术;2005年12期

    6 张玫;张晓林;;Connotea中Social Tagging机制研究[J];现代图书情报技术;2007年07期

    7 程勇;黄河;邱莉榕;史忠植;;一个基于相似度计算的动态多维概念映射算法[J];小型微型计算机系统;2006年06期

    8 邱振青;;一个结合版本和日志技术的本体演化框架[J];盐城工学院学报(自然科学版);2006年03期

    9 高成勉;包含飞;周强;;本体构建原则及其在中医顶层本体构建中的应用[J];医学信息;2008年05期

    10 明仲,李师贤,蔡树彬,徐晶;建立本体的协作-挖掘方法[J];中山大学学报(自然科学版);2005年03期

    中国博士学位论文全文数据库 前2条

    1 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年

    2 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年

    【相似文献】

    中国期刊全文数据库 前10条

    1 宋海松,陆正军,廖小刚;使用VBSCRIPT实现“智能搜索引擎”[J];计算机时代;2001年05期

    2 徐险峰;;网络信息检索搜索引擎技术及发展趋势[J];江西图书馆学刊;2005年04期

    3 韩进军;安园园;;搜索引擎的未来发展[J];医学信息学杂志;2007年05期

    4 刘冰;胡风华;;知识库系统在智能搜索引擎中的应用[J];光盘技术;2009年02期

    5 康桂英,张帆,刘春平;新一代智能搜索引擎网典研究[J];情报理论与实践;2000年03期

    6 袁渊;;搜索引擎关键技术及展望[J];湖北财经高等专科学校学报;2006年05期

    7 刘志娟;;虚拟参考咨询与搜索引擎的结合——智能搜索引擎诞生[J];图书情报论坛;2008年03期

    8 王挺;;智能搜索引擎在企业人力资源管理决策支持系统中的应用[J];电脑知识与技术;2010年24期

    9 刘志娟;黄立冬;;虚拟参考咨询与搜索引擎结合——智能搜索引擎的诞生[J];科技情报开发与经济;2008年25期

    10 胡风华;刘冰;;基于知识库系统的智能搜索引擎研究[J];电脑知识与技术;2009年11期

    中国重要会议论文全文数据库 前3条

    1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

    2 冯玉才;胡刚;陈胜;蔡诏;向隆刚;李东;;大能量转换系统远程实时数据库设计与实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

    3 郭树军;范俊红;;范例推理(CBR)在气象服务中的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“城市气象与科技奥运”分会论文集[C];2003年

    中国重要报纸全文数据库 前10条

    1 惠晓霜;[N];新华每日电讯;2009年

    2 本报记者 蒋峥;[N];经济日报;2000年

    3 王旭;[N];计算机世界;2001年

    4 陆元婕;[N];中国计算机报;2001年

    5 朱艳燕;[N];中华工商时报;2004年

    6 钱峻英;[N];光明日报;2004年

    7 本报记者 张彤;[N];网络世界;2003年

    8 王宏亮;[N];经济视点报;2005年

    9 张秋;[N];中国邮政报;2004年

    10 李 贽;[N];大众科技报;2004年

    中国博士学位论文全文数据库 前2条

    1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年

    2 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年

    中国硕士学位论文全文数据库 前10条

    1 张骞;传统搜索引擎与智能搜索引擎比较研究[D];郑州大学;2012年

    2 雷丰云;智能搜索引擎的理论分析与应用研究[D];中南大学;2007年

    3 孟骁;基于语义网络的智能搜索引擎研究[D];东北师范大学;2011年

    4 李振振;基于本体的智能搜索引擎研究与应用[D];青岛科技大学;2010年

    5 张灿;基于多本体的智能搜索引擎模型研究与实现[D];首都师范大学;2013年

    6 杨延锟;面向油田信息服务的智能搜索引擎研究与应用[D];大庆石油学院;2010年

    7 朱素媛;网络教育中的智能搜索引擎的研究[D];合肥工业大学;2004年

    8 朱玉皎;个性化智能搜索引擎中查询扩展技术研究[D];哈尔滨工业大学;2012年

    9 张明远;基于粒计算的智能搜索引擎技术研究[D];武汉理工大学;2010年

    10 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年


      本文关键词:基于本体的智能搜索引擎研究与应用,由笔耕文化传播整理发布。



    本文编号:51487

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/51487.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户33883***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com