实体词语义信息对中文实体关系抽取的作用研究
[Abstract]:In order to explore the role of the semantic information of entity words extracted from external dictionaries in the extraction of Chinese entity relations, two new features, the semantic tree of knowledge web and the coding tree of synonym forest, are proposed, together with the existing shortest path dependency tree. The first basic semantic source, synonym forest coding, entity large class and entity subclass feature are studied together to study its influence on extraction performance. Experimental data show that, as a single feature, the performance of the proposed two new features is not as good as that of the entity class and the entity subclass, but it is better than the shortest path dependency tree, the first basic semantic element of the network, and the encoding of the synonym forest. As a combination feature, the shortest path dependency tree and the combined features of two new features achieve the best performance. It can be concluded that the features of the shortest path dependency tree, the semantic tree of the known web and the coding tree of the synonym forest obtained from the non-corpus can replace the features of the large and small classes of entities obtained from the corpus. It can be used for the next open domain relational extraction.
【作者单位】: 太原理工大学计算机科学与技术学院;武汉大学软件工程国家重点实验室;
【基金】:武汉大学软件工程国家重点实验室开放课题(SKLSE2012-09-30) 山西省自然科学基金资助项目(2013011015-2)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 邓擘;郑彦宁;傅继彬;;汉语实体关系模式的自动获取研究[J];计算机科学;2010年02期
2 牟晋娟;包宏;;中文实体关系抽取研究[J];计算机工程与设计;2009年15期
3 朱姗;;基于规则和本体的实体关系抽取系统研究[J];情报杂志;2010年S2期
4 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
5 朱鸿宇;刘瑰;陈左宁;唐福华;;实体关系识别中长距离依赖问题的研究[J];小型微型计算机系统;2008年02期
6 周利娟;林鸿飞;罗文华;;基于实体关系的犯罪网络识别机制[J];计算机应用研究;2011年03期
7 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
8 李小红;钱龙华;;基于自举的弱指导中文实体关系抽取研究[J];高科技与产业化;2010年09期
9 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期
10 黄晨;钱龙华;周国栋;朱巧明;;基于卷积树核的无指导中文实体关系抽取研究[J];中文信息学报;2010年04期
相关会议论文 前3条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关博士学位论文 前5条
1 陈忱;面向Web的实体关系查询与分析关键技术研究[D];东北大学;2013年
2 郭喜跃;面向开放领域文本的实体关系抽取[D];华中师范大学;2016年
3 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
4 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
相关硕士学位论文 前10条
1 施琦;无监督中文实体关系抽取研究[D];中国地质大学(北京);2015年
2 林家欣;基于多源知识的地理选择题答题方法研究[D];哈尔滨工业大学;2015年
3 刘绍毓;实体关系抽取关键技术研究[D];解放军信息工程大学;2015年
4 胡春艳;中文开放式实体关系抽取技术研究[D];东北大学;2014年
5 程文亮;中文企业知识图谱构建与分析[D];华东师范大学;2016年
6 徐力;面向Web2.0的二元人物关系抽取研究[D];华东交通大学;2016年
7 韩海丹;面向智能服务机器人的家庭环境关系知识库构建[D];燕山大学;2016年
8 孔兵;中文文本实体关系抽取方法研究[D];哈尔滨工业大学;2016年
9 刘q,
本文编号:2322170
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2322170.html