当前位置:主页 > 科技论文 > 自动化论文 >

基于深度迁移学习的数控系统领域技术术语识别

发布时间:2020-10-13 19:38
   近年来,随着工业4.0、互联网+等科技产业变革范式的提出,科技创新发展迅速,数控系统技术作为一种战略性技术无疑属于国家重大技术领域,大力发展数控加工技术是由制造大国走向制造强国的重要条件。在此背景下,研究识别数控系统领域新兴技术术语,预测领域发展趋势,对于国家和企业制定战略性发展规划具有重大意义。专利文献是技术情报的最新来源,被广泛的用于新兴技术预见,专利文献易于使用,但术语难以挖掘、抽取难度大,存在缺乏术语标签的问题,因此如何针对专利文献抽取技术术语是本文研究的重点。针对现有研究的不足,本文首先引入深度迁移学习的思想,基于命名实体识别技术,构建了数控系统领域新兴术语识别、技术类别划分和专利趋势分析的整体方案;然后,本文基于语言模型和基于命名实体识别模型的迁移学习技术术语识别方案,利用成熟的公共领域源数据,运用Bi-LSTM(双向长短时记忆)模型实现跨领域迁移,有效识别技术术语并过滤高频非术语词串;最后,本文通过构建术语词向量,选用WMD(词移距离)技术计算文档相似度,通过K-means对文档和技术术语划分技术类别,聚类结果以术语形式呈现,更为准确易懂,可解释性更强。基于上述步骤,本文收集了2013年~2018年数控系统(CNC)领域专利文献,通过将新闻领域源数据已有知识迁移到数控系统领域目标数据,解决了专利文献缺少标注的问题,通过构建术语词向量和文档聚类,将数控系统领域分为硬件化、软件化、工艺化、网络化、智能化五大类。本文结合专利分析的方法,整合划分的技术类别,对2013年~2018年数控系统领域发展动向进行综合分析。
【学位单位】:华中科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TG659;TP391.1;TP18
【部分图文】:

流程图,术语,流程,专利文献


图 2-1 基于深度迁移学习的技术术语识别流程2.3 方案设计2.3.1 基于深度迁移学习的技术术语识别方案基于专利文献的术语识别方案设计如图一蓝色箭头所示:第一,调研数控系统领域科技文献,查阅维基百科对数控机床种类的说明,检索领域相关技术清单,翻阅数控机床教科书,联合专家辅助制定检索式,以机床和数控系统共现的关键词为主结合 IPC 分类号,在 Thomson Innovation 专利数据库中检索专利文献;第二,提取专利文献数据集中摘要字段,通过抽取摘要关键短语并结合提取相关论文关键词字段的方式构建候选标签库,经过与专家研讨得到基础术语标签库,编写代码实现专利摘要字段的自动标注,相比人工全部标注大大减少了专家资源的浪费,

框架图,语言模型,框架,领域


华 中 科 技 大 学 硕 士 学 位 论 文体识别技术通过捕捉语言风格进行任务的学习,而迁移学习通领域或者源任务和目标任务的相似性进行知识的学习,因此当似性较低时,通过 NER 技术捕捉句法特征,基于深度学习模型映射关系明确的相似或相同任务可以实现跨领域迁移学习。同领域有其独特语言特点,描述方式和知识结构都有领域特色很好的模型可能并不适用于另一领域。跨领域 NER 任务迁移的知识从源领域数据迁移到目标领域数据,因此目标数据必须有数据和目标数据的标签存在映射关系,则共享模型的全部参数签数量和映射关系不一致,则只迁移 Bi-LSTM 结构的参数,解共享,每个任务单独学习 CRF[23]。

框架图,框架,标签,样本


图 3-2 基于 NER 模型的迁移学习框架分析和模型介绍分析体识别任务在条件随机场层时预测标签的行为实际上可以理研究去除了传统命名实体的抽取,只针对技术术语实体进行识二分类问题。在机器学习分类案例中,通常使用混淆矩阵标来评价模型的泛化性能。如表 3-1 所示,混淆矩阵分为 TP、本数量,TP 表示将正类样本标签预测为正类(即正正,正类表示将负类样本标签预测为负类(即负负,负类样本预测正确标签预测为负类(即正负,正类样本预测错误),FP 表示将负(即负正,负类样本预测错误)。其中,TP、TN 均表示预测
【参考文献】

相关期刊论文 前4条

1 祝捷频;赵蕴华;;基于美国对华技术管制清单的专利分析——以数控系统领域为例[J];情报杂志;2014年11期

2 黄晓莉;郑佳;王莹;董涛;;基于专利情报分析的中国数控机床产业研究[J];情报杂志;2012年09期

3 刘立;王博;;基于专利情报分析的数控机床产业研究[J];科技管理研究;2010年15期

4 高蓓;;数控机床全球专利申请状况分析[J];电子知识产权;2009年11期



本文编号:2839620

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2839620.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户897cc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com