当前位置:主页 > 科技论文 > 搜索引擎论文 >

通用本体学习方法及其应用的关键技术研究

发布时间:2020-08-21 01:00
【摘要】:随着网络技术的发展和社会信息化程度的不断提高,人们在工作、学习、生活等各方面对信息系统的智能化和知识化的需求日益增加,使得数据的表示不仅仅停留在语法层面,更需要聚焦在语义层面。本体作为一种能够在语义知识层面上描述数据与信息的概念模型,为解决语义层面的理解与沟通的问题提供了有效的途径。目前,本体构建存在两种方式:一种方式是通过本体构建工具进行手工构建本体;另一种方式是通过本体学习方法进行自动或半自动构建本体。随着网络大数据时代到来,通过本体学习方法构建本体的方式日益重要。现有的本体学习方法基本上是根据不同数据源类型决定采用不同的本体学习方法。然而,面对互联网上复杂的数据源中庞大的数据信息,如何从复杂、异构的数据源中采用通用的本体学习方法,构建与丰富本体知识,从而提高本体学习的适应性和自动化程度是现在需要解决的问题。针对上述问题,本文模拟人类学习思维方式,提出基于粒计算的通用本体学习体系框架和学习方法。该框架是基于明确的本体学习任务层次,自下而上进行本体的概念、分类关系、术语、非分类关系和规则的学习。同时,该方法是从领域具体实例对象集合中抽取概念和分类关系,从而构建本体的概念粒度空间,为本体学习的后续任务提供了一定基础;由于将前期异构的数据源中抽取的数据,预处理为本体学习的信息输入系统,所以在本体学习方法的通用性上有了较大的提高。本文将所提出的本体学习方法应用于人物领域的本体学习中,从而可以得到人物领域本体;同时,将人物领域本体与搜索引擎相结合,不仅可以提高人物信息搜索的准确性,而且可以验证人物领域本体的正确性和本体学习方法的有效性。本文对通用的本体学习方法及其应用的关键技术进行研究和探讨,主要内容总结为以下五个方面:●本文深入分析了本体学习的研究现状和存在的问题,提出了通用的本体学习体系框架。本文分别从本体的组织结构和本体学习的数据源复杂性、异构性的角度进行分析,阐述了本体的定义、分类、本体学习的任务和同构化的本体学习信息输入系统。根据信息输入系统中数据的特点和人类学习的思维方式,提出了通用的本体学习体系框架。针对本体学习体系框架中学习的任务层次,提出了相应的本体学习方法,为后续本体学习研究提供了基础。●针对无初始本体的本体学习的需求,提出了本体的概念粒度空间模型和构建本体的概念粒度空间的算法。本文描述了领域具体实例对象粒和抽象概念粒粗糙集的表示及粒化方法、本体的概念粒之间的关系和运算、领域具体实例对象粒的粗相似表示方法,同时针对领域具体实例对象粒和抽象概念粒的不同特性,提出了构建第一层抽象概念粒度空间和多层抽象概念粒度空间的算法,并通过实验验证了算法的有效性,提高了本体的概念和分类关系学习的准确性。●针对有初始本体或概念粒度空间的本体学习的需求,提出了基于HowNet的概念语义相似度的改进算法。本文围绕如何进行本体的概念或术语学习的问题,深入分析了国内外已有的概念语义相似度算法,总结归纳了影响概念语义相似度算法准确性的主要因素,结合中文知识库HowNet和同义词林的内容组织结构特点,改进已有的基于HowNet语义相似度算法。该算法综合考虑了多种影响语义相似度值准确性的因素,与其它语义相似度算法相比,实验结果显示概念语义相似度的准确性有了很大提高,进而提高了本体的概念或术语学习的准确性。●本文将所提出的本体学习方法应用于人物领域本体学习中,设计与实现了人物领域本体学习系统,从而得到了人物领域本体。在人物领域本体学习过程中,为了降低构建概念粒度空间算法的时间复杂度和信息输入系统的属性特征的维度,本文提出了基于向量空间模型的KNN-DAG-SVMs分类算法,并通过实验验证了该算法的有效性,与其它分类算法相比,在准确率和召回率方面有了明显的提高。●本文将学习得到的人物领域本体应用于搜索领域,提出了基于人物领域本体的智能搜索体系框架,并且描述了框架中各个模块的功能;为了提高搜索的速度,在数据索引模块中,提出了三级倒排索引模型;同时在本体学习模块中,提出了新增具体实例对象的学习算法,实现了基于人物领域本体的智能搜索系统。该系统不仅提高了人物信息搜索结果的查准率和查全率,而且进一步丰富了人物领域本体的具体实例。实验结果表明,基于人物领域本体的智能搜索与其它搜索相比具有一定的优越性。
【学位授予单位】:华东师范大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1
【图文】:

收据,准确率,实验结果,数据集


大学博士学位论文逦第3章本体的概念粒度空间构建方法的研宄逡逑实验结果及分析逡逑据上述实验的设计,分别可以得到在不同的数据集上,取不同比例的数据逡逑练集的实验结果和实验结果的比较:逡逑表3-3邋Zoo数据集的实验结果逡逑

相似度,可调,音乐家,商人


概念所有情况都考虑在内的语义相似度计算,本文采用改进后的法对实验数据进行计算,同时邀请了邋22个人对测试数据的相改进后算法与刘群算法的计算相似度值,分别与人工打分的平三组实验结果如表4-10和图4-10所示:逡逑表4-10邋HowNet中概念对相似度实验结果逡逑Concept邋pairs逦Siniuu邋Simimproved邋Human逡逑作曲家逦音乐家逦0.913邋0.766逦0.672逡逑中国逦中医逦0.108邋0.156逦0.249逡逑医学家逦音乐家逦0.94〗逦0.763逦0.461逡逑校长逦医生逦0.913邋0.435逦0.508逡逑泰山逦泰山北斗邋0.661邋0.239逦0.155逡逑释遨牟■尼逦硕士逦0.579邋0.410逦0.269逡逑商会逦收集者逦0.113邋0.032逦0.169逡逑生意人逦商人逦1.000邋1.000逦0.963逡逑农民逦商人逦0.896邋0.732逦0.677逡逑

学习系统,主界面,本体,属性特征


华东师范大学博士学位论文逦第5章基于互动百科的人物领域本体学习逡逑非分类关系、规则模块等。数据的显示模块主要用于数据的输入和显示。数据的逡逑输入包括初始领域具体实例对象和新增领域具体实例对象的输入;数据的显示包逡逑括第一层抽象概念粒对应的领域具体实例对象集合和所具有的属性特征的显示、逡逑领域具体实例对象相应的属性特征及属性特征值和关系及关系值的显示、概念粒逡逑的分类关系的层次结构显示等,本体学习系统的主界面如图5-6所示:逡逑丨.:料料秘逦-?邋‘逦.邋.逡逑

【相似文献】

相关期刊论文 前10条

1 张建文;王强;;面向语义Web的本体学习研究[J];科技广场;2006年08期

2 张海营;;本体学习和基于句型规则的自举本体学习方法模型设计[J];图书情报工作;2007年09期

3 张囡囡;李冠宇;曲丽宁;;主要本体学习工具的比较分析[J];微计算机信息;2008年12期

4 徐济成;李绍稳;张友华;;农业本体及本体学习研究[J];计算机技术与发展;2009年08期

5 鹿彦;孙静波;;基于文本的本体概念提取[J];科技信息;2010年13期

6 邓子平;张传宏;;面向医学的本体学习方法[J];计算机时代;2010年10期

7 梁健;吴丹;;种子概念方法及其在基于文本的本体学习中的应用[J];图书情报工作;2006年09期

8 梁健;王惠临;;基于文本的本体学习方法研究[J];情报理论与实践;2007年01期

9 宗江琴;范荣;;基于粒计算的本体学习研究[J];科技广场;2007年05期

10 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期

相关会议论文 前3条

1 刘柏嵩;高济;;通用本体学习框架研究(英文)[A];全国语域web与本体能研讨会论文集[C];2006年

2 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

3 徐惠;高志强;陆青健;朱万颖;;ORIGO:一种基于数字化图书馆资源的本体学习方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

相关博士学位论文 前4条

1 刁丽娟;通用本体学习方法及其应用的关键技术研究[D];华东师范大学;2015年

2 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年

3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年

4 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年

相关硕士学位论文 前10条

1 王晓庆;基于框架语义的中文本体学习研究[D];中国海洋大学;2008年

2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年

3 贾秀玲;面向文本的本体学习中概念提取及关系提取的研究[D];中南大学;2007年

4 鹿彦;面向文本的本体学习方法研究[D];长春工业大学;2011年

5 谢彩云;基于法律领域的本体学习方法的研究与应用[D];南昌大学;2012年

6 胡冬润;面向网络舆情任务的本体学习方法研究[D];南京航空航天大学;2013年

7 杨芬;本体学习中概念和关系抽取方法研究[D];重庆大学;2010年

8 刘婷;本体学习及其在语义检索中应用的研究[D];南昌大学;2011年

9 刘明生;粒计算及其在本体学习中应用的研究[D];南昌大学;2007年

10 陈绍琛;基于非结构中文数据源的本体学习[D];哈尔滨工程大学;2009年



本文编号:2798687

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2798687.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3e0b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com