当前位置:主页 > 社科论文 > 图书档案论文 >

《汉语主题词表》本体化的自动生成研究

发布时间:2020-07-29 15:38
【摘要】: 对自然语言中的词汇进行选择、规范、控制,并揭示词汇间的各种关系是叙词表的本质,在自然语言的基础上形成受控词汇的集合,从而构成一个叙词表。叙词表中的每个词汇都称为叙词,每个叙词都表达一定的概念。我国《汉语主题词表》(以下简称《汉表》)作为一部大型综合性科技检索工具,收词范围包括自然科学、医学、农业、工程技术等各学科领域的主要名词术语,是主题标引、检索和组织目录、索引的主要工具。而本体是一种新型的网络信息组织方法,作为一种能在语义知识层次上描述信息的概念模型工具,已经受到越来越多的关注。但由于本体自身的复杂性,现阶段本体的构建将是一项费时、费力的工作。由于叙词表已经汇集了众多领域专家的知识,包括了各学科领域中比较完整的词汇。因此,有人提议,以现有叙词表为基础构建本体。叙词表中的简单语义关系可以为本体的属性、实例以及各种关系的创建提供指导。本文以《汉语主题词表》为核心,构建基于词表的本体,对于促进词表在语义网下的发展具有一定的理论意义和实际应用价值。 文章对《汉表》和本体的定义、构成要素和特点进行了详细的分析,并得出基于《汉表》转换本体的必要性和优越性。结合《汉表》的特点,提出了自身的一套构建本体的程序步骤,针对传统纸质版词表的缺陷,形成了词表的SQL数据库形式。最终借助Java程序调用Jena包自动生成基于《汉表》构建本体的模板,并按照规则提取出限制条件。最终实现《汉表》SQL数据库到本体的自动转换,并使用本体表示语言OWL对词表进行形式化表示。
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:G353

【引证文献】

相关期刊论文 前1条

1 肖京文;;从《汉语主题词表》获取本体概念的研究[J];科技情报开发与经济;2012年17期



本文编号:2774163

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2774163.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6722a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com