中文文本中实体数值型关系无监督抽取方法
本文关键词:中文文本中实体数值型关系无监督抽取方法,由笔耕文化传播整理发布。
【摘要】:中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的.
【作者单位】: 武汉科技大学计算机科学与技术学院;智能信息处理与实时工业系统湖北省重点实验室;武汉科技大学管理学院;
【关键词】: 实体关系抽取 无监督 数值型三元组 信息抽取
【基金】:国家社会科学基金重大项目(11&ZD189) 湖北省自然科学基金面上项目(2015CFB564) 湖北省教育厅科学技术研究计划指导性项目(B2016010)资助
【分类号】:TP391.1
【正文快照】: 0引言随着互联网信息爆炸式增长,人们迫切需要从海量数据中获取有价值的信息.传统行业在应对当前的市场环境时,更需要拥抱互联网,需要从互联网信息中分析当前行业市场发展前景.互联网上的大量信息都是非结构化的电子文本,如新闻、博客、政府文件等,这些文本中含有大量的数值信
【参考文献】
中国期刊全文数据库 前7条
1 刘倩;伍大勇;刘悦;程学旗;庞琳;;结合全局特征的命名实体属性值抽取[J];计算机研究与发展;2016年04期
2 郭喜跃;何婷婷;胡小华;陈前军;;基于句法语义特征的中文实体关系抽取[J];中文信息学报;2014年06期
3 钟浪生;;补语的认识与分析[J];语文教学通讯·D刊(学术刊);2014年07期
4 贾真;杨宇飞;何大可;刘胜久;尹红风;;面向中文网络百科的属性和属性值抽取[J];北京大学学报(自然科学版);2014年01期
5 陈立玮;冯岩松;赵东岩;;基于弱监督学习的海量网络数据关系抽取[J];计算机研究与发展;2013年09期
6 吴春相;;现代汉语介词结构的语体考察[J];当代修辞学;2013年04期
7 黄承慧;印鉴;侯f ;;一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J];计算机学报;2011年05期
【共引文献】
中国期刊全文数据库 前10条
1 何永强;秦勤;王俊鹏;;基于深度神经网络的嵌入式向量及话题模型[J];计算机工程与设计;2016年12期
2 王华秋;殷志恒;;采用自适应聚类的教学视频关键帧研究[J];计算机时代;2016年12期
3 田驰远;陈德华;王梅;乐嘉锦;;基于依存句法分析的病理报告结构化处理方法[J];计算机研究与发展;2016年12期
4 王亚民;胡悦;;基于BTM的微博舆情热点发现[J];情报杂志;2016年11期
5 王华秋;聂珍;;快速搜索密度峰值聚类在图像检索中的应用[J];计算机工程与设计;2016年11期
6 朱林;;基于Web的主题内容提取与存储系统研究[J];软件;2016年11期
7 吴胜;刘茂福;胡慧君;张志清;顾进广;;中文文本中实体数值型关系无监督抽取方法[J];武汉大学学报(理学版);2016年06期
8 马慧芳;曾宪桃;李晓红;,
本文编号:482969
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/482969.html