当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于本体的数学表达式检索技术研究

发布时间:2017-09-14 12:38

  本文关键词:基于本体的数学表达式检索技术研究


  更多相关文章: 本体 数学表达式检索 搜索引擎 语义检索


【摘要】:在科研、教育和工程等众多领域中,数学表达式作为一类复杂的、语义强的重要信息。人们对它的检索有着表达式二维结构识别和表达式内容语义识别的要求。然而现有的数学表达式检索系统大多是基于表达式字符文本化和基于表达式内容展示形式进行处理的,,很难满足对表达式内容语义的识别。因此,实现数学表达式的语义检索对学习和工作都有着现实的意义。 本论文以支持数学表达式内容语义和关联关系的表达式本体库为基础,对查询条件进行语义扩展,以期达到数学表达式的语义检索的目标。论文主要开展以下工作: 1)论文分析了数学表达式的检索过程,提出了一种基于本体的数学表达式语义检索模型。其思想是以表达式中数学公式部分作为基点归纳出四类数学表达式多元信息的关联关系,再使用改进后的通配符表示方法来构建数学表达式本体库。基于构建出的本体库对查询条件进行语义拓展处理,将语义拓展处理后的关键词汇返回给用户进行关键词精确操作或是直接传递给检索框架,实现数学表达式的语义检索。 2)本文提出了一种改进后的数学公式DOM树的相似度匹配算法来实现上述模型中的语义扩展功能。该算法的基本思想是根据编辑操作对象节点类型的异同和其父节点的异同赋予不同的操作代价,枚举叠加出操作代价总值,得出相应的相似度,实现用户查询条件的语义化和精准化拓展。同时借助数学表达式本体库中归纳的关联关系和上下位层次关系,减少匹配次数,提高匹配的效率。 3)在上述研究工作的基础上,论文使用Protege4.3工具构建出一个初级的数学表达式本体库,再以Lucene检索框架为基础引擎进行实验,验证了基于本体的数学表达式语义检索模型和方法的可行性和有效性。并对改进后的DOM树相似度算法进行对比实验,实验结果表明,改进后的算法在响应时间、查全率、查准率和F-Measure值四项检验指标上均有提高。
【关键词】:本体 数学表达式检索 搜索引擎 语义检索
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要3-4
  • ABSTRACT4-8
  • 1 绪论8-13
  • 1.1 研究背景及意义8-9
  • 1.2 研究现状9-11
  • 1.2.1 数学表达式搜素引擎9-10
  • 1.2.2 数学表达式描述语言10
  • 1.2.3 本体10-11
  • 1.3 论文章节安排11-13
  • 2 数学表达式检索关键技术研究13-28
  • 2.1 数学表达式的检索技术13-17
  • 2.1.1 信息检索技术13-15
  • 2.1.2 数学表达式检索问题15-16
  • 2.1.3 现有搜索引擎对比16-17
  • 2.2 数学表达式的描述语言17-23
  • 2.2.1 基于 XML 的数学标记方法概述17-20
  • 2.2.2 MathML 文档的表达结构20-22
  • 2.2.3 MathML 的描述方法22-23
  • 2.3 数学表达式中本体的应用23-27
  • 2.3.1 本体及本体库的理论23-24
  • 2.3.2 本体在数学表达式的应用形式24-25
  • 2.3.3 本体在数学表达式检索中的作用25-27
  • 2.4 本章小结27-28
  • 3 一种基于本体的数学表达式语义检索模型28-32
  • 3.1 基于本体的数学表达式语义检索模型28-29
  • 3.2 模型的构成要素29-30
  • 3.2.1 模型的物理构成要素29
  • 3.2.2 模型的逻辑功能要素29-30
  • 3.3 模型的检索机理30-31
  • 3.4 本章小结31-32
  • 4 一种基于本体的数学表达式语义检索技术32-51
  • 4.1 基于本体的数学表达式表示方法32-41
  • 4.1.1 数学表达式对象分析32-33
  • 4.1.2 数学表达式间关系的呈现33-34
  • 4.1.3 基于本体的数学表达式通配符表示34-36
  • 4.1.4 数学表达式本体模型的构建和表达36-41
  • 4.2 数学公式的 MathML 解析41-44
  • 4.2.1 建立 DOM 树42
  • 4.2.2 去除括号42-43
  • 4.2.3 标准化转换43-44
  • 4.2.4 节点排序44
  • 4.3 数学表达式匹配方法44-50
  • 4.3.1 传统的数学表达式匹配方法44-45
  • 4.3.2 一种基于本体语义的 DOM 树匹配方法45-50
  • 4.4 本章小结50-51
  • 5 实验与测评51-56
  • 5.1 实验环境51
  • 5.2 实验结果与分析51-55
  • 5.2.1 基于本体的 DOM 树相似度匹配算法结果分析52-54
  • 5.2.2 基于本体的数学表达式语义检索结果分析54-55
  • 5.3 本章小结55-56
  • 6 总结与展望56-58
  • 6.1 本文总结56-57
  • 6.2 研究展望57-58
  • 致谢58-59
  • 参考文献59-62
  • 附录62
  • A 作者在攻读硕士学位期间发表论文的情况62

【参考文献】

中国期刊全文数据库 前7条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 张成昱 ,窦天芳 ,吴滨 ,高竞妹;数学公式的采集、组织和检索[J];大学图书馆学报;2005年05期

3 赵珂;逯鹏;李永强;;基于Lucene的搜索引擎设计与实现[J];计算机工程;2011年16期

4 吴刚,唐杰,李涓子,王克宏;细粒度语义网检索[J];清华大学学报(自然科学版);2005年S1期

5 王洪伟;霍佳震;王伟;廖雅国;;面向语义检索应用的本体模型结构设计[J];系统工程与电子技术;2010年01期

6 李春伟;;基于MathML的web数学公式的解决方案[J];中国科技信息;2008年17期

7 刘功申,李宁;一种基于有序二叉树的多模式匹配算法(英文)[J];小型微型计算机系统;2004年07期



本文编号:850079

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/850079.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户56563***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com