基于本体的民族教育资源自动语义标注研究
本文关键词:基于本体的民族教育资源自动语义标注研究
【摘要】:现在我们面对着网络数据的浩瀚海洋,要想使计算机能够完全准确地从这些数量大、结构不规则的数据中提取出满足人们要求的信息变得越来越难,以前我们使用搜索引擎进行搜索时不仅所需要的时间非常短,而且搜索产生的数据也是十分准确的,但是现在我们要想更好地实现信息检索就要往语义检索的方向发展,要想实现语义检索的前提是语义标注,只有将网络上的资源进行了有效的语义标注才能将人类的语义检索的梦想变为现实。也就是说我们现在面对着数据海量化与检索低效率化这样一个矛盾,在这样一个矛盾的背景下,语义标注尤其是自动语义标注越来越受到研究者的青睐,然而由于各国使用的网络语言不同,以及不同的网络时代下的网络框架的区别等诸多原因,语义标注的完全自动化仍未得到全面的发展,要满足人们的个性化、专业化的检索需求还需要克服相当大的困难。在这样一个复杂的情况下,本论文首先分析信息采集的原理和方法,对民族教育信息网络文档资源的采集技术进行了充分研究,通过网络爬虫技术爬取了网络上的资源,接着充分利用了领域本体在语义表达上的有利条件,来对网络上的资源进行有效的语义表达,因此构建了领域本体库来对特定主题的网络资源进行描述,最后对语义标注方法进行了深入研究分析,借鉴软件工程的思想,以迭代模型为基础,并改进原有的OCRNIP算法,提出了语义标注的迭代模型,同时对该模型系统进行了设计实现与实验分析。
【关键词】:语义标注 本体 迭代模型 三元组
【学位授予单位】:云南师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G750;TP391.1
【目录】:
- 摘要3-4
- Abstract4-9
- 第1章 绪论9-14
- 1.1 引言9-10
- 1.2 国内外研究现状10-12
- 1.3 本文的主要研究工作12-13
- 1.4 本文结构13-14
- 第2章 语义网的发展14-22
- 2.1 Web的发展14-17
- 2.1.1 PC时代15
- 2.1.2 Web1.0 时代15-16
- 2.1.3 Web2.0 时代16
- 2.1.4 Web3.0 时代16-17
- 2.1.5 Web4.0 时代17
- 2.1.6 Web发展历程小结17
- 2.2 语义网17-21
- 2.2.1 语义网的概念18
- 2.2.2 语义网的层次模型18-20
- 2.2.3 语义网和万维网的对比分析20-21
- 2.3 本章小结21-22
- 第3章 相关理论与技术22-40
- 3.1 本体的相关理论22-28
- 3.1.1 本体与领域本体的基本概念22-24
- 3.1.2 本体描述语言24-27
- 3.1.3 本体构建工具27-28
- 3.2 民族教育资源本体库的构建28-35
- 3.2.1 民族教育资源本体领域数据来源29
- 3.2.2 民族教育资源本体构建流程29-31
- 3.2.3 民族教育资源本体库的设计与实现——以傣族为例31-35
- 3.3 网络爬虫技术35-38
- 3.3.1 网络爬虫的概念35
- 3.3.2 网络爬虫的基本框架35-36
- 3.3.3 主题爬虫36-38
- 3.4 中文分词技术38-39
- 3.5 本章小结39-40
- 第4章 语义标注系统模型40-58
- 4.1 语义标注的基本概念40-41
- 4.2 语义标注方法的分类41-44
- 4.2.1 根据标注方法分类41-43
- 4.2.2 根据自动化程度划分43-44
- 4.3 语义标注工具44-46
- 4.4 语义标注系统模型——语义标注迭代模型46-57
- 4.4.1 网页文档内容的获取过程49
- 4.4.2 本体库的建立与完善49
- 4.4.3 用户自定义词典的获取49-50
- 4.4.4 分词文档的获取50-53
- 4.4.5 RDF文档的获取53-57
- 4.5 本章小结57-58
- 第5章 语义标注迭代模型在傣族教育资源中的应用58-65
- 5.1 语义标注迭代模型系统的实现58-63
- 5.1.1 网页内容抽取59-61
- 5.1.2 用户自定义词典的生成61
- 5.1.3 中文分词61-62
- 5.1.4 生成RDF文件62-63
- 5.2 语义标注迭代模型系统的实验结果及分析63-64
- 5.2.1 评价指标63
- 5.2.2 结果分析63-64
- 5.3 本章小结64-65
- 第6章 总结与展望65-66
- 6.1 总结65
- 6.2 展望65-66
- 参考文献66-70
- 攻读学位期间发表的学术论文和研究成果70-71
- 致谢71
【相似文献】
中国期刊全文数据库 前2条
1 栾悉道;谢毓湘;陈丹雯;邓莉琼;;基于剧本描述的动画素材语义标注方法[J];长沙大学学报;2012年02期
2 ;[J];;年期
中国重要会议论文全文数据库 前9条
1 苗传江;刘智颖;;现代汉语语料的句子级语义标注[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 谢法奎;张全;袁毅;;基于HNC理论的语义标注语料库[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 宋雨;郑怿;吴燕;;RDFa语义标注技术综述[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 鲍广宇;谭伟;吴亚宁;;机器兵力指挥控制语言的语义标注技术研究[A];2013第一届中国指挥控制大会论文集[C];2013年
6 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 王浩然;徐建良;张巍;;一种XML元数据的自动语义标注方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 袁柳;李战怀;陈世亮;;OntoWord:一种新的Web页面语义标注方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国博士学位论文全文数据库 前5条
1 米杨;基于顶级本体整合的医学领域语义标注研究[D];吉林大学;2012年
2 谢铭;关联数据和知识表示的自动语义标注技术[D];武汉大学;2012年
3 唐金辉;视频语义标注的若干问题研究[D];中国科学技术大学;2008年
4 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
5 王传清;超网络视域下数字资源聚合研究[D];吉林大学;2015年
中国硕士学位论文全文数据库 前10条
1 彭晨漪;物联网环境下面向服务的实体语义标注[D];华南理工大学;2015年
2 张锐;面向期刊论文的多粒度语义标注方法研究[D];华中师范大学;2015年
3 程童凌;基于维基类百科知识资源的实体关系发现和语义标注[D];北京化工大学;2015年
4 何中山;基于语义网的初中数学的自动语义标注方法研究与实现[D];电子科技大学;2014年
5 崔愉;面向文本的自动语义标注技术研究与实现[D];西安电子科技大学;2014年
6 王伟强;基于运动捕捉数据的人体行为分割与行为语义标注[D];北京交通大学;2016年
7 孙亚男;基于本体的民族教育资源自动语义标注研究[D];云南师范大学;2016年
8 丁长林;中医古籍文献语义标注技术的研究[D];沈阳航空航天大学;2013年
9 丁蓉;自动语义标注方法研究[D];兰州理工大学;2012年
10 王国印;科技文献语义标注系统研究[D];华中科技大学;2009年
,本文编号:1040549
本文链接:https://www.wllwen.com/jiaoyulunwen/crjy/1040549.html