基于双模型投票的人物关系抽取研究
本文关键词:基于双模型投票的人物关系抽取研究 出处:《计算机应用研究》2017年03期 论文类型:期刊论文
【摘要】:网页标题具有简洁、信息量大的特点,而且其中蕴涵了丰富、动态、复杂的人物关系。主要针对网页标题文本中的人物关系抽取进行研究,提出一种双模型投票的机器学习方法。针对19种关系类型分别进行特征抽取和选择;使用两种统计模型——最大熵和支持向量机分别进行模型训练;对于每种关系类型利用模型投票的方法,即选择训练集中得到性能较好的模型作为该类的模型,最后使用训练好的模型对测试集进行测试。结果显示,该方法对于人物关系抽取任务取得了总体F1值为67.64%的性能。
[Abstract]:The title of a web page has the characteristics of simplicity and large amount of information, and it contains rich, dynamic and complex character relationships. This paper mainly focuses on the extraction of the relationship between people in the text of the title of the page. A two-model voting machine learning method is proposed, in which the feature extraction and selection are carried out for 19 relation types. Two statistical models, maximum entropy and support vector machine, are used for model training. For each relationship type, the model voting method is used, that is, the model with better performance is selected as the model of the training set. Finally, the trained model is used to test the test set. The result shows. This method achieves a total F1 value of 67.64% for the human relationship extraction task.
【作者单位】: 内蒙古师范大学计算机与信息工程学院;
【基金】:国家自然科学基金资助项目(61562068) 内蒙古师范大学“十百千”人才培养工程资助项目;内蒙古师范大学引进人才科研启动经费资助项目(2014YJRC036);内蒙古师范大学校级基金资助项目(2015YBXM002) 内蒙古民委蒙古文信息化专项扶持子项目(MW-2014-MGYWXXH-01) 内蒙古自然科学基金资助项目(2013MS0912,2013MS0913,2014MS0617,2015MS0629) 内蒙古自治区高等学校科学研究资助项目(NJZY028)
【分类号】:TP391.1;TP181
【正文快照】: 0引言伴随着互联网大数据的日益增长,如何从大数据中挖掘人们需要的有用信息成为科研人员关注的主要问题。而分散在海量数据中的人物与人物之间的关系(也称为实体关系)是其中一类非常有用的信息,它在机器翻译、信息检索、自动问答等领域具有重要的价值。实体关系抽取是从自由
【相似文献】
相关期刊论文 前3条
1 傅宛菊;陈木兰;;中国新魔幻电影的类型化初探[J];东南传播;2014年08期
2 丁海峰;;论电影《海洋天堂》中细节的运用[J];西部广播电视;2013年05期
3 ;[J];;年期
相关会议论文 前3条
1 白劲鹏;;可怕的对称——论《了不起的盖茨比》中的主次人物关系[A];外语语言教学研究——黑龙江省外国语学会第十一次学术年会论文集[C];1997年
2 黄素影;;《天伦》创作小结[A];我的角色与我们的剧团——第六届电影表演艺术学会奖文集[C];1997年
3 吴士余;;重视人物关系的典型化[A];《毛泽东文艺思想研究》第三辑暨全国毛泽东文艺思想研究会第三次年会论文集[C];1983年
相关重要报纸文章 前6条
1 本报记者 张悦;音乐剧《蝶》推出修排版[N];中国艺术报;2008年
2 记者 金朝力;网络视频业首推人脸识别功能[N];北京商报;2010年
3 本文实习记者 张柳青;纪念汶川地震一周年[N];中国电影报;2009年
4 许柏林;小成本拍出大境界[N];人民日报;2012年
5 张克丹 综合整理;青春·理想·奋斗·奉献[N];中国电影报;2009年
6 上海戏剧学院副教授 石俊;问号的力量[N];文汇报;2012年
相关硕士学位论文 前10条
1 潘云;基于中文在线资源的人物关系抽取研究[D];华东师范大学;2015年
2 史军;初析舞剧《奶奶的信》的立意与结构[D];北京舞蹈学院;2015年
3 唐丞博;谈《追梦时刻》中人物关系的发展和变化[D];云南艺术学院;2016年
4 刘博佳;基于维基百科的人物关系抽取研究[D];北京交通大学;2016年
5 陈静;关于《哥儿》的中译本中粗话的翻译研究[D];北京外国语大学;2016年
6 冯元为;基于知识图谱构建人物关系的设计与实现[D];重庆大学;2016年
7 徐珊;孙昌涉初期小说的人物关系和作家意识研究[D];山东大学;2009年
8 顾静航;基于信息抽取的人物关系网络构建研究[D];苏州大学;2014年
9 许婷;基于话单挖掘的可视化人物关系分析系统的设计与实现[D];哈尔滨工业大学;2014年
10 范少帅;基于特征向量的人物关系抽取方法研究[D];华东交通大学;2015年
,本文编号:1392967
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1392967.html