当前位置:主页 > 社科论文 > 图书档案论文 >

中文专利标题及摘要生成技术研究

发布时间:2023-11-05 09:18
  专利作为信息技术的载体,包含了全球百分之九十以上的最新技术,国家和企业可以通过及时获取已公开专利中的技术信息为自己所用,可以产生巨大的经济价值以及在此基础上进行进一步的研究,因此专利在信息化时代具有非常重要的作用。但是由于专利申请人在专利审查前不希望被别人知道专利的具体内容,因此在撰写专利时会使用一些上位词来代替专利的具体内容,这就导致专利检索会出现漏检的情况,不能将如此巨大的信息资源充分利用。随着专利申请数量的不断增多,专家人工进行专利深加工的方式成本大、速度慢,不能满足现在的专利检索需求。本文在中医药专利数据集上通过深度学习方法训练专利深加工模型来对原始的专利标题和摘要进行重新生成。实验结果表明,重新生成的专利标题和摘要可以包含更多的专利关键信息,可以加强专利的可读性与易检索性,有助于充分利用专利中的信息资源。本文的主要创新和贡献点如下:(1)提出一种融合义原的中文专利标题生成方法。在Skip-gram模型的基础上使用注意力机制引入HowNet(知网)义原来解决一词多义的问题,同时使得模型能够更加准确地得到一个词语在当前上下文中的具体语义。本文还针对所研究的中文专利数据集构建专属义...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 专利研究的研究现状
        1.2.1 专利深加工研究现状
    1.3 文本摘要研究现状
        1.3.1 抽取式摘要研究现状
        1.3.2 生成式摘要研究现状
    1.4 本文的主要研究思路
    1.5 本文的组织结构
第2章 深度学习相关理论与技术
    2.1 引言
    2.2 循环神经网络
        2.2.1 长短期记忆网络
        2.2.2 门控循环神经网络
        2.2.3 双向循环神经网络
    2.3 编解码器模型与注意力机制
    2.4 Word2vec
        2.4.1 Skip-gram
        2.4.2 CBOW
        2.4.3 Skip-gram和CBOW模型的对比以及改进
    2.5 评测指标
        2.5.1 ROUGE评测指标
        2.5.2 BLEU评测指标
    2.6 本章小结
第3章 融合义原的专利标题生成方法
    3.1 引言
    3.2 ASPM-一种融合义原的专利标题生成方法
        3.2.1 义原介绍
        3.2.2 融合义原知识的词义表示模型
        3.2.3 指针网络模型
        3.2.4 融合义原的中文专利标题生成模型
    3.3 实验分析
        3.3.1 实验数据集
        3.3.2 实验参数设置
        3.3.3 实验结果与分析
    3.4 本章小结
第4章 利用BERT进行专利说明书内容抽取
    4.1 引言
    4.2 BERTKM-一种使用BRET聚类进行内容提取的方法
        4.2.1 BERT
        4.2.2 K-means
        4.2.3 BERTKM
    4.3 实验分析
        4.3.1 数据集
        4.3.2 实验分析
    4.4 本章小结
第5章 融合原文事实的中文专利摘要生成方法
    5.1 引言
    5.2 专利文本问题分析
    5.3 TTPN-融合原文事实的中文专利摘要生成方法
        5.3.1 原文事实抽取
        5.3.2 Transformer
        5.3.3 TTPN
    5.4 实验分析
        5.4.1 数据集
        5.4.2 参数设置
        5.4.3 实验结果分析
    5.5 本章小结
第6章 总结与展望
    6.1 本文工作总结
    6.2 未来研究工作展望
致谢
参考文献
个人简历在校期间发表论文与研究成果



本文编号:3860747

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3860747.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cbf37***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com