当前位置:主页 > 管理论文 > 科研管理论文 >

基于CRFs的冶金领域中文专利术语抽取研究

发布时间:2019-03-27 11:17
【摘要】:【目的】探讨冶金领域中文专利术语抽取模型的最优条件,用于有效地抽取冶金领域专利术语。【方法】使用尚不完善的核心语料库,在无需人工标引的情况下,采用条件随机场(CRFs)构建字角色标注的冶金领域中文专利术语识别模型。详细说明模型的构建过程,同时重点对比CFRs的各个因素(特征组合、字长窗口等)对识别效果的影响。【结果】实验结果表明字序列、级别特征、领域特征、温度特征的组合在字长窗口为3,c等于1,f等于1时,准确率达到94.26%,召回率达到94.37%,F1值达到94.5%。【局限】核心词典欠完善,使得部分词语标注不够准确;未与其他方法作详细比较,未详细说明CRFs的可靠性。【结论】CRFs在适当的角色和特征以及特征模板的组合下能较好地识别出冶金领域的中文专利术语。
[Abstract]:[objective] to explore the optimal condition of Chinese patent term extraction model in metallurgical field, which can be used to effectively extract patent term in metallurgical field. [methods] the core corpus, which is not perfect, can be used without manual indexing. The conditional random field (CRFs) is used to construct the Chinese patent term recognition model of character tagging in metallurgical field. The construction process of the model is described in detail, and the influence of each factor of CFRs (feature combination, word length window, etc.) on the recognition effect is compared in detail. [results] the experimental results show that the word sequence, the level feature, the domain feature, and so on. The combination of temperature features at the word length window of 3, c equals 1, f equals 1, the accuracy rate reaches 94.26%, the recall rate reaches 94.37%, and the F1 value reaches 94.5%. Make part of the words not accurate tagging; The reliability of CRFs is not explained in detail compared with other methods. [conclusion] CRFs can identify the Chinese patent terms in metallurgical field well under the combination of appropriate roles and features and feature templates.
【作者单位】: 南京大学信息管理学院;江苏省数据工程与知识服务重点实验室;
【基金】:江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(项目编号:BK20130587) 江苏省“333”工程项目“面向知识服务的中文本体学习研究”(项目编号:BRA2015401)的研究成果之一
【分类号】:TP391.1;G306

【参考文献】

相关期刊论文 前10条

1 卢达威;宋柔;;基于最大熵模型的汉语标点句缺失话题自动识别初探[J];计算机工程与科学;2015年12期

2 袁劲松;张小明;李舟军;;术语自动抽取方法研究综述[J];计算机科学;2015年08期

3 李洪政;晋耀红;;基于条件随机场方法的汉语专利文本介词短语识别[J];现代语文(语言研究版);2015年07期

4 刘伙玉;王东波;苏新宁;;多特征下的科研论文段落自动划分与构成要素识别研究[J];情报学报;2015年04期

5 李丽双;王意文;黄德根;;基于信息熵和词频分布变化的术语抽取研究[J];中文信息学报;2015年01期

6 刘辉;刘耀;;基于条件随机场的专利术语抽取[J];数字图书馆论坛;2014年12期

7 张雷瀚;吕学强;李卓;徐丽萍;;领域本体术语的抽取方法研究[J];情报学报;2014年02期

8 汤青;吕学强;李卓;施水才;;领域本体术语抽取研究[J];现代图书情报技术;2014年01期

9 化柏林;;针对中文学术文献的情报方法术语抽取[J];现代图书情报技术;2013年06期

10 乐娟;赵玺;;基于HMM的京剧机构命名实体识别算法[J];计算机工程;2013年06期

相关重要报纸文章 前1条

1 贺延芳;;专利文献研究助力我国创新活动[N];中国知识产权报;2012年

【共引文献】

相关期刊论文 前10条

1 王密平;王昊;邓三鸿;吴志祥;;基于CRFs的冶金领域中文专利术语抽取研究[J];现代图书情报技术;2016年06期

2 李伊潇;李宏伟;沈立炜;赵文耘;;基于启发式规则的自动化本体扩充[J];计算机科学;2016年03期

3 曾镇;吕学强;李卓;;一种面向专利摘要的领域术语抽取方法[J];计算机应用与软件;2016年03期

4 刘彤;倪维健;柳梅;;面向搜索引擎查询日志的领域术语自动识别方法[J];现代图书情报技术;2016年02期

5 郑秋生;刘守喜;;基于CRF的互联网文本命名实体识别研究[J];中原工学院学报;2016年01期

6 蒋婷;孙建军;;基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域[J];情报理论与实践;2016年01期

7 化柏林;;学术论文中方法知识元的类型与描述规则研究[J];中国图书馆学报;2016年01期

8 刘宝菊;陶宏才;;基于隐马尔可夫的商标词识别[J];成都信息工程学院学报;2015年06期

9 袁劲松;张小明;李舟军;;术语自动抽取方法研究综述[J];计算机科学;2015年08期

10 张莉;刘昱显;;基于语序位置特征的汉英术语对自动抽取研究[J];南京大学学报(自然科学);2015年04期

【二级参考文献】

相关期刊论文 前10条

1 胡韧奋;;面向汉英专利机器翻译的介词短语自动识别策略[J];语言文字应用;2015年01期

2 栗伟;赵大哲;李博;彭新茗;刘积仁;;CRF与规则相结合的医学病历实体识别[J];计算机应用研究;2015年04期

3 卢达威;宋柔;尚英;;从广义话题结构考察汉语篇章话题认知复杂度[J];中文信息学报;2014年05期

4 朱晓;金力;;条件随机场图模型在《明史》词性标注研究中的应用效果探索[J];复旦学报(自然科学版);2014年03期

5 季翠;卢达威;宋柔;;动词引出新支话题的语用功能研究[J];中文信息学报;2014年03期

6 蒋玉茹;宋柔;;基于细粒度特征的话题句识别方法[J];计算机应用;2014年05期

7 吴秦;胡丽娟;梁久祯;;基于分块重要度和二维条件随机场的Web信息抽取[J];南京大学学报(自然科学);2014年01期

8 汤青;吕学强;李卓;施水才;;领域本体术语抽取研究[J];现代图书情报技术;2014年01期

9 蒋玉茹;宋柔;;话题句识别中候选话题句评估函数的优化[J];北京工业大学学报;2014年01期

10 宋柔;;汉语篇章广义话题结构的流水模型[J];中国语文;2013年06期

【相似文献】

相关期刊论文 前1条

1 乔杨;;专利计量方法在技术预见中的应用——以国内冶金领域为例[J];情报杂志;2013年04期

相关会议论文 前2条

1 葛道才;郭雄军;;阴阳膜和双极膜在冶金领域的应用探讨[A];第四届全国膜分离技术在冶金工业中应用研讨会论文集[C];2014年

2 徐铜文;;我国分离膜发展的战略浅议及在冶金领域中应用前景展望[A];第四届全国膜分离技术在冶金工业中应用研讨会论文集[C];2014年

相关重要报纸文章 前6条

1 通讯员 尹欣欣;华油工建承建工程首获冶金领域优质奖[N];中国石油报;2009年

2 驻湖北记者 李文聪 通讯员 邝冬林 张珂斌;武汉科尔辊破机进军冶金领域[N];中国建材报;2007年

3 记者 徐刚;耐磨产品多项“扎根”冶金领域[N];中国冶金报;2004年

4 夏杰生;电磁冶金领域的全能专家[N];中国冶金报;2009年

5 记者 周炳文;微波技术新增产值近10亿[N];云南政协报;2011年

6 田庆华;高校冶金学院院长学术论坛举行[N];中国有色金属报;2007年



本文编号:2448132

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2448132.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4e9de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com