当前位置:主页 > 社科论文 > 图书档案论文 >

第三代半导体材料领域文献的实体关系抽取研究

发布时间:2023-02-19 08:31
  第三代半导体材料因其优异的特性在光电子和微电子等领域具有重要的应用价值。而半导体材料领域文献是该领域知识的主要来源,文献中的实体关系是该领域知识的一种重要表现形式。随着近几年第三代半导体材料的迅猛发展,单单IEEE上每个月就增长近1000篇相关领域的文献。过多的文献增长使得研究人员难以及时、准确的获取领域内的最新研究动向或成果。为了能够让机器辅助处理大量领域文献,研究人员使用自然语言处理技术来帮助从文献中提取关键信息。然而现阶段针对通用领域或生物医学领域文献文本的关系抽取模型在第三代半导体材料领域并不适用。因此本文以第三代半导体材料领域英文文献的实体关系抽取为研究主线,针对该领域文献中的语言描述特点以及现有方法的不足,侧重于集成预训练模型和深度学习网络来抽取该领域文献中的材料、器件、方法等实体以及它们之间的关系,具体工作如下:1.针对现阶段缺少第三代半导体材料领域英文文献数据集的问题,本文收集大量该领域的英文文献,定义实体和关系类型,并对这些文献进行人工标注,标注完成后进行人工校验,最后生成两个数据集,分别用于命名实体识别和实体关系抽取任务。2.根据第三代半导体材料领域文献实体识别的特...

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 信息抽取研究现状
        1.2.2 科技文献命名实体识别研究现状
        1.2.3 科技文献实体关系抽取研究现状
    1.3 论文主要工作及结构安排
第二章 相关理论与方法介绍
    2.1 实体关系抽取
        2.1.1 实体关系抽取概述
        2.1.2 实体关系抽取方法
    2.2 词嵌入特征方法
        2.2.1 Word2vec
        2.2.2 BERT
    2.3 深度学习技术
        2.3.1 双向长短期记忆网络
        2.3.2 卷积神经网络
    2.4 条件随机场
    2.5 本章小结
第三章 英文文献数据集构建与领域文献实体识别
    3.1 引言
    3.2 第三代半导体材料领域英文文献数据集构建
        3.2.1 实体类型与关系定义
        3.2.2 数据集构建流程
        3.2.3 数据集构成
    3.3 材料领域文献实体识别的特点
    3.4 领域文献实体识别模型介绍
        3.4.1 动态融合BERT层
        3.4.2 BiLSTM层
        3.4.3 线性CRF层
    3.5 领域文献实体识别模型实验
        3.5.1 实验数据及实验环境
        3.5.2 评估方法及参数设置
        3.5.3 公共数据集上的对比实验
        3.5.4 领域文献数据集上的对比实验
        3.5.5 模型分析实验
    3.6 本章小结
第四章 领域文献关系抽取及系统实现
    4.1 引言
    4.2 EI-BERT-CNN模型结构
        4.2.1 词嵌入层
        4.2.2 句子卷积模块
        4.2.3 实体信息模块
        4.2.4 特征融合和分类层
    4.3 领域文献关系抽取模型实验
        4.3.1 实验数据及实验环境
        4.3.2 评估方法及参数设置
        4.3.3 公共数据集上的对比实验
        4.3.4 领域文献数据集上的对比实验
        4.3.5 模型分析实验
    4.4 第三代半导体材料领域文献知识抽取系统
        4.4.1 系统设计
        4.4.2 系统实现
        4.4.3 系统展示
    4.5 本章小结
总结与展望
    总结
    展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件



本文编号:3745885

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3745885.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户30bb1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com