专利权利要求书生成关键技术研究

发布时间:2022-08-08 10:35
  人工智能的出现推动了多个领域的快速发展,其中自然语言处理领域通过计算机理解并应用人类语言,在机器翻译、自动写作等方面已取得了多项研究成果。近代科学的快速发展也催生了专利制度,其设立的目的是鼓励发明以及保护发明人的权利。在申请专利时,需要提交说明书及权利要求书。其中权利要求书是以说明书为依据,明确发明内容并限定权利范围。因此,可以根据说明书的内容自动生成权利要求书。本文探索专利权利要求书自动生成技术,从以下三个方面进行研究:说明书中权利要求依据识别,权利要求特征和限定部分生成以及权利要求引用部分生成。本文的研究内容及贡献如下:第一,对专利说明书中权利要求依据识别技术进行了探索,涉及到对专利说明书的深度理解及推理,将其形式化为机器阅读理解任务。首先通过清洗数据并设计对齐算法将权利要求对齐到说明书中的内容,生成伪标注数据。然后通过设计4种不同问题形式探索其对于识别效果的影响,并基于BERT模型完成训练。最后,在BERT模型基础上添加了Bi DAF网络以捕获问题及篇章间的联系,进一步提升模型性能,并在测试集上得到EM值35.54,F1值38.08的结果。第二,对权利要求特征及限定部分的自动生成... 

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 研究现状
        1.2.1 机器阅读理解领域
        1.2.2 文本摘要领域
        1.2.3 文本分类领域
    1.3 本文主要研究内容
    1.4 论文主要组织结构
第2章 说明书权利要求依据识别
    2.1 权利要求到说明书的对齐加工
        2.1.1 数据清洗
        2.1.2 权利要求到发明内容对齐算法
    2.2 不同模型结构对系统性能影响
        2.2.1 BERT预训练模型
        2.2.2 引入双向注意力流网络的BERT模型
    2.3 问题形式对系统性能影响
    2.4 实验结果与分析
        2.4.1 实验数据集与评价指标
        2.4.2 实验设置
        2.4.3 问题形式影响实验结果
        2.4.4 模型结构影响实验结果
    2.5 本章小结
第3章 权利要求特征及限定部分生成
    3.1 不同模型结构对性能影响
        3.1.1 seq2seq模型
        3.1.2 引入attention机制的seq2seq模型
        3.1.3 进一步引入copy机制的seq2seq模型
        3.1.4 进一步引入coverage机制的seq2seq模型
    3.2 实验设置
        3.2.1 实验数据集
        3.2.2 评价指标
        3.2.3 模型参数设置
    3.3 实验结果
    3.4 本章小结
第4章 权利要求引用部分识别
    4.1 引用识别数据集构造
    4.2 不同模型结构对性能影响
        4.2.1 引入LSTM结构的BERT模型
        4.2.2 引入CNN结构的BERT模型
        4.2.3 引入RCNN结构的BERT模型
        4.2.4 引入DPCNN结构的BERT模型
    4.3 实验数据集与评价指标
        4.3.1 实验数据集
        4.3.2 评价指标
    4.4 实验结果与分析
        4.4.1 样本比例影响实验结果
        4.4.2 模型结构影响实验结果
    4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其他成果
致谢



本文编号:3671353

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3671353.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d674a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com