结合从句级远程监督与半监督集成学习的关系抽取方法
[Abstract]:Aiming at the problems of noise and negative case data utilization in traditional relational extraction methods based on remote supervision, a relationship extraction method combining clause level remote monitoring with semi-supervised integrated learning is proposed. First, the relational instance set is constructed by remote supervision, and the noise in the relational instance set is removed by using the de-noising algorithm based on clause recognition. Then the lexical features of relational instances are extracted and transformed into distributed representation vectors to construct feature data sets. Finally, all positive data and partial negative case data in feature data set are selected to form annotated data sets, and the remaining negative case data are selected to form unlabeled datasets. The improved semi-supervised learning algorithm is used to train the relationship classifier. Experimental results show that the proposed method can achieve higher classification accuracy and recall than baseline method.
【作者单位】: 浙江大学计算机科学与技术学院;浙江鸿程计算机系统有限公司;
【基金】:国家自然科学基金项目(No.61332017,60703040) 浙江省重大科技专项(No.2015C33002,2013C01046,2011C13042) 中国工程科技知识中心项目(No.CKCEST-2014-1-5)资助~~
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 袁汉宁;;双层多示例集成学习[J];武汉理工大学学报(信息与管理工程版);2011年05期
2 俞扬;周志华;;集成学习中完全随机学习策略研究[J];计算机工程;2006年17期
3 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期
4 陈凯;;基于聚类技术的集成学习差异性研究[J];南京工业职业技术学院学报;2008年04期
5 李凯;崔丽娟;;集成学习算法的差异性及性能比较[J];计算机工程;2008年06期
6 潘志松;燕继坤;;少数类的集成学习[J];南京航空航天大学学报;2009年04期
7 陈凯;马景义;;一种选择性SER-BagBoosting Trees集成学习研究[J];计算机科学;2009年09期
8 陈全;赵文辉;李洁;江雨燕;;选择性集成学习算法的研究[J];计算机技术与发展;2010年02期
9 张燕平;曹振田;赵姝;郑尧军;杜玲;窦蓉蓉;;一种新的决策树选择性集成学习方法[J];计算机工程与应用;2010年17期
10 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期
相关会议论文 前4条
1 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
相关博士学位论文 前10条
1 阿里木·赛买提(Alim.Samat);基于集成学习的全极化SAR图像分类研究[D];南京大学;2015年
2 王永明;集成回归问题若干关键技术研究[D];华东师范大学;2015年
3 常征;基于混合集成学习的眼部与四肢交互动作建模与识别[D];北京科技大学;2016年
4 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
5 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
6 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
7 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年
8 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
9 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年
10 李烨;基于支持向量机的集成学习研究[D];上海交通大学;2007年
相关硕士学位论文 前10条
1 高伟;基于半监督集成学习的情感分类方法研究[D];苏州大学;2015年
2 宋文展;基于抽样的集成进化算法研究[D];广西大学;2015年
3 汤莹;迁移与集成学习在文本分类中的应用研究[D];江苏科技大学;2015年
4 刘政;基于知识元和集成学习的中文微博情感分析[D];大连理工大学;2015年
5 丘桥云;结合文本倾向性分析的股评可信度计算研究[D];哈尔滨工业大学;2014年
6 秦海;融合非标记样本选择的集成学习研究[D];湘潭大学;2015年
7 李想;基于多示例的集成学习理论与应用研究[D];合肥工业大学;2014年
8 李震宇;基于集成学习的数字图像隐写定量分析[D];解放军信息工程大学;2014年
9 王希玲;基于选择性集成学习的网络入侵检测方法研究[D];青岛科技大学;2016年
10 陈范曙;基于信息整合的药物相关信息挖掘方法研究[D];华东师范大学;2016年
,本文编号:2366515
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2366515.html