当前位置:主页 > 科技论文 > 软件论文 >

中文学科术语相关语义关系获取方法研究

发布时间:2019-03-29 08:25
【摘要】:文章对中文非结构化文本中(半)自动获取学科术语的相关语义关系进行了探讨,以寻找行之有效的获取方法。从CNKI获取"数字图书馆"学科领域文献,通过术语抽取、动词抽取、向量空间模型构建、双重关联规则分析和规则评价获得了具有较强关联的术语对以及作为关联标签的动词,从而获取了学科术语的相关语义关系。该获取方法与其他方法相比,具有较高的可行性和有效性,并对术语的相关语义关系进行了有效性和实用性的评价,提高了获取的准确率。但文章也存在一定的局限性,在对术语相关语义关系的有效性和实用性进行评价时,指标的选择和阈值的确定存在人工干预,具有一定的主观性。
[Abstract]:This paper discusses the semantic relationship of automatic acquisition of disciplinary terms in Chinese unstructured texts in order to find an effective way to obtain them. Through terms extraction, verb extraction, vector space model construction, double association rule analysis and rule evaluation, we get the term pairs with strong relevance and verbs as the associated label through the acquisition of documents in the field of "Digital Library" from the CNKI, and through the terms extraction, verb extraction, vector space model construction, double association rule analysis and rule evaluation. Thus, the related semantic relations of the subject terms are obtained. Compared with other methods, this method is more feasible and effective, and evaluates the related semantic relations of terms effectively and practically, so as to improve the accuracy of the acquisition. However, there are some limitations in this paper. When evaluating the validity and practicability of the semantic relations related to terms, manual intervention exists in the selection of indicators and the determination of threshold values, which has a certain degree of subjectivity.
【作者单位】: 南京大学信息管理学院;江苏省数据工程与知识服务重点实验室;
【基金】:江苏省社会科学基金一般项目“领域术语语义关系自动获取研究”(项目编号:15TQB009) 国家自然科学基金青年项目“面向学术资源的TSD与TDC测度及分析研究”(项目编号:71503121)研究成果之一
【分类号】:TP391.1

【参考文献】

相关期刊论文 前6条

1 朱惠;杨建林;王昊;;中文领域专业术语层次关系构建研究[J];现代图书情报技术;2016年01期

2 张立国;陈荔;;维基百科中基于语义依存的领域本体非分类关系获取方法研究[J];情报科学;2014年06期

3 王红;高斯婷;潘振杰;肖志伟;;基于NNV关联规则的非分类关系提取方法及其应用研究[J];计算机应用研究;2012年10期

4 邱桃荣;黄海泉;段文影;周石林;李向军;;非分类关系学习的粒计算模型研究[J];南昌大学学报(工科版);2012年03期

5 古凌岚;孙素云;;基于语义依存的中文本体非分类关系抽取方法[J];计算机工程与设计;2012年04期

6 谷俊;严明;王昊;;基于改进关联规则的本体关系获取研究[J];情报理论与实践;2011年12期

相关硕士学位论文 前1条

1 舒万里;中文领域本体学习中概念和关系抽取的研究[D];重庆大学;2012年

【共引文献】

相关期刊论文 前10条

1 熊晶;王继鹏;魏墨济;;基于细粒度依存关系的中文长句相似度计算[J];科学技术与工程;2017年11期

2 朱惠;杨建林;王昊;;中文学科术语相关语义关系获取方法研究[J];图书与情报;2017年02期

3 王红;樊红杰;孙康;;面向领域本体非分类关系的语义相关度计算方法[J];计算机应用与软件;2016年11期

4 赵明;杜亚茹;杜会芳;张家军;王红说;陈瑛;;植物领域知识图谱构建中本体非分类关系提取方法[J];农业机械学报;2016年09期

5 顾铁军;李毅;;面向复杂规范文本的基础评价本体构建及本体关系完善研究[J];图书馆理论与实践;2015年11期

6 张清华;郭永龙;薛玉斌;;概率统计下的多粒度搜索算法研究[J];模式识别与人工智能;2015年05期

7 熊晶;支丽平;袁冬;;基于本体和依存句法的词汇语义关系标注及评价方法研究[J];中文信息学报;2015年03期

8 邱桃荣;肖勇峰;张虹;黄瑶;;伴随二元关系粒运算的布料色卡图像检索模型[J];南昌大学学报(工科版);2015年01期

9 王昊;苏新宁;朱惠;;中文医学专业术语的层次结构生成研究[J];情报学报;2014年06期

10 余凡;程虹;楼雯;;语法规则和改进关联规则的中文文本非等级关系提取研究[J];图书情报工作;2013年22期

相关硕士学位论文 前3条

1 郭瑞;基于纯文本的领域本体构建与实现[D];河北科技大学;2016年

2 贺海涛;基于关联规则的领域本体概念提取技术研究[D];长春工业大学;2015年

3 申光鹏;基于链接数据的分散式数据语义集成的研究与应用[D];北京工业大学;2013年

【二级参考文献】

相关期刊论文 前10条

1 王昊;苏新宁;朱惠;;中文医学专业术语的层次结构生成研究[J];情报学报;2014年06期

2 涂鼎;陈岭;陈根才;吴勇;王敬昌;;基于多路层次聚类的商品评论数据概念分类构建[J];计算机研究与发展;2013年S2期

3 李树青;;基于引文关键词加权共现技术的图情学科领域本体自动构建方法研究[J];情报学报;2012年04期

4 谷俊;朱紫阳;;基于聚类算法的本体层次关系获取研究[J];现代图书情报技术;2011年12期

5 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期

6 谷俊;王昊;;基于领域中文文本的术语抽取方法研究[J];现代图书情报技术;2011年04期

7 林源;陈志泊;孙俏;;计算机领域术语的自动获取与层次构建[J];计算机工程;2011年02期

8 季培培;鄢小燕;岑咏华;王凌燕;;面向领域中文文本信息处理的术语语义层次获取研究[J];现代图书情报技术;2010年09期

9 乔建忠;;基于主题爬虫的本体非分类关系学习框架[J];图书情报工作;2010年18期

10 温春;石昭祥;张霄;;本体概念层次获取方法综述[J];计算机应用与软件;2010年09期

相关硕士学位论文 前5条

1 杨芬;本体学习中概念和关系抽取方法研究[D];重庆大学;2010年

2 段明秀;层次聚类算法的研究及应用[D];中南大学;2009年

3 官莹莹;面向中文文本的本体学习方法研究[D];吉林大学;2009年

4 陈绍琛;基于非结构中文数据源的本体学习[D];哈尔滨工程大学;2009年

5 贾秀玲;面向文本的本体学习中概念提取及关系提取的研究[D];中南大学;2007年

【相似文献】

相关硕士学位论文 前1条

1 马兴茹;构式“(S)V_1多少,(S)(就)V_2多少”分析[D];华中师范大学;2016年



本文编号:2449336

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2449336.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2ca12***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com