当前位置:主页 > 科技论文 > 软件论文 >

中文领域专业术语层次关系构建研究

发布时间:2018-03-24 20:36

  本文选题:术语 切入点:层次关系 出处:《现代图书情报技术》2016年01期


【摘要】:【目的】对如何从中文非结构化文本获取术语的层次关系进行探讨。【方法】从CNKI获取数字图书馆学科领域文献,通过术语抽取、术语向量空间模型构建、BIRCH算法聚类和聚类标签确定构建术语的语义层次结构。【结果】构建数字图书馆领域术语的层次结构,并对构建结果进行验证,聚类正确率达到80.88%,类标签抽取正确率达到89.71%。【局限】对构建效果的验证是通过随机抽样进行的,且仅与一种其他构建方法进行实证比较。【结论】应用BIRCH算法聚类构建术语层次结构,该方法与K-means聚类方法相比具有明显优势,具备较高的执行效率和聚类有效性。
[Abstract]:[objective] to discuss how to obtain the hierarchical relationship of terms from unstructured Chinese texts. [methods] to obtain the subject domain literature of digital library from CNKI, and extract the terms from them. The term vector space model is constructed by clustering and clustering tags to determine the semantic hierarchy of the constructed terms. [results] the hierarchical structure of the terminology in the digital library domain is constructed, and the construction results are verified. The correct rate of clustering is 80.88 and the correct rate of class label extraction is 89.71. [limitation] the effect of construction is verified by random sampling. And it is only compared with one other construction method. [conclusion] using BIRCH clustering algorithm to construct term hierarchy, this method has obvious advantages over K-means clustering method, and has higher execution efficiency and clustering effectiveness.
【作者单位】: 南京大学信息管理学院;江苏省数据工程与知识服务重点实验室;
【基金】:江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(项目编号:BK20130587) 中央高校基本科研业务费专项资金项目“我国图书情报学科知识结构及演化动态研究”(项目编号:20620140645)的研究成果之一
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 张建文;王强;;面向语义Web的本体学习研究[J];科技广场;2006年08期

2 张海营;;本体学习和基于句型规则的自举本体学习方法模型设计[J];图书情报工作;2007年09期

3 张囡囡;李冠宇;曲丽宁;;主要本体学习工具的比较分析[J];微计算机信息;2008年12期

4 徐济成;李绍稳;张友华;;农业本体及本体学习研究[J];计算机技术与发展;2009年08期

5 鹿彦;孙静波;;基于文本的本体概念提取[J];科技信息;2010年13期

6 邓子平;张传宏;;面向医学的本体学习方法[J];计算机时代;2010年10期

7 梁健;吴丹;;种子概念方法及其在基于文本的本体学习中的应用[J];图书情报工作;2006年09期

8 梁健;王惠临;;基于文本的本体学习方法研究[J];情报理论与实践;2007年01期

9 宗江琴;范荣;;基于粒计算的本体学习研究[J];科技广场;2007年05期

10 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期

相关会议论文 前3条

1 刘柏嵩;高济;;通用本体学习框架研究(英文)[A];全国语域web与本体能研讨会论文集[C];2006年

2 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

3 徐惠;高志强;陆青健;朱万颖;;ORIGO:一种基于数字化图书馆资源的本体学习方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

相关博士学位论文 前5条

1 刁丽娟;通用本体学习方法及其应用的关键技术研究[D];华东师范大学;2015年

2 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年

3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年

4 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年

5 贾真;面向中文网络百科的本体学习与知识获取研究[D];西南交通大学;2014年

相关硕士学位论文 前10条

1 王晓庆;基于框架语义的中文本体学习研究[D];中国海洋大学;2008年

2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年

3 贾秀玲;面向文本的本体学习中概念提取及关系提取的研究[D];中南大学;2007年

4 鹿彦;面向文本的本体学习方法研究[D];长春工业大学;2011年

5 谢彩云;基于法律领域的本体学习方法的研究与应用[D];南昌大学;2012年

6 胡冬润;面向网络舆情任务的本体学习方法研究[D];南京航空航天大学;2013年

7 杨芬;本体学习中概念和关系抽取方法研究[D];重庆大学;2010年

8 刘婷;本体学习及其在语义检索中应用的研究[D];南昌大学;2011年

9 刘明生;粒计算及其在本体学习中应用的研究[D];南昌大学;2007年

10 陈绍琛;基于非结构中文数据源的本体学习[D];哈尔滨工程大学;2009年



本文编号:1659929

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1659929.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e48bb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com