当前位置:主页 > 社科论文 > 图书档案论文 >

基于文本数据挖掘的核心专利识别方法研究

发布时间:2023-11-16 20:18
  核心专利一般是指某个技术领域的某种产品的关键核心技术所对应的专利[1],对某行业的核心专利进行识别是挖掘该行业关键核心技术信息的有效途径,进而可以为行业企业提供技术研发指导。为了更全面的对核心专利进行识别,本文提出了一种基于文本数据挖掘的核心专利识别方法,该方法首先通过文本挖掘相关智能算法对专利进行领域细分,然后在细分领域的基础上使用改进型PageRank算法对专利进行评分以识别该领域下的核心专利。本文的核心专利识别任务中包含三个子任务:分类子任务、聚类子任务和核心专利识别子任务,本文主要对三个子任务中使用的智能算法进行了深入研究,并使用本文方法对电力系统与设备领域的专利进行了实例分析。主要研究内容如下:(1)提出了一种基于BERT-A-BiLSTM的多特征专利文本分类算法专利分类子任务中,为了依据专利所属技术领域对其进行划分,本文提出了一种基于BERT-A-BiLSTM的多特征专利文本分类算法。目前专利文本分类算法大都采用静态预训练技术生成的词向量进行文本向量化表示,无法解决词语一词多义的问题。基于此,本文使用动态预训练模型BERT模型产生的可以根据语境变化的动...

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
1 绪论
    1.1 背景及意义
    1.2 国内外研究现状
        1.2.1 基于评价指标的核心专利识别方法研究现状
        1.2.2 基于引用的核心专利识别方法研究现状
    1.3 主要研究内容
    1.4 论文结构安排
2 相关研究思路及基础
    2.1 研究思路
    2.2 核心专利概述
    2.3 文本分类研究基础
        2.3.1 BERT模型
        2.3.2 双向长短时记忆神经网络
    2.4 文本聚类研究基础
        2.4.1 Word2vec模型
        2.4.2 K-means算法基本原理
    2.5 引文网络及其节点重要性排序技术概述
        2.5.1 引文网络及其度中心性
        2.5.2 PageRank算法
3 基于BERT-A-BiLSTM的多特征专利文本分类算法研究
    3.1 专利文本分类相关研究及分析
    3.2 算法设计与实现
        3.2.1 文本向量化表示层
        3.2.2 文本特征提取层
        3.2.3 输出层
    3.3 实验设计与对比分析
        3.3.1 实验环境
        3.3.2 实验数据
        3.3.3 实验参数
        3.3.4 对比实验
        3.3.5 评价指标
        3.3.6 实验结果与分析
    3.4 本章小结
4 基于改进型K-means算法的专利文本聚类方法研究
    4.1 专利文本聚类处理流程
    4.2 文本向量化表示
    4.3 基于初始中心点优化的K-means改进算法
        4.3.1 改进的K-means算法设计
        4.3.2 实验分析
    4.4 实证分析
    4.5 本章小结
5 基于改进型PageRank算法的核心专利识别方法研究
    5.1 PageRank及其改进算法在核心专利识别方面的不足
    5.2 基于权重分配优化的PageRank改进算法
        5.2.1 算法设计
        5.2.2 改进算法的收敛性分析
    5.3 实验设计与对比分析
        5.3.1 实验环境配置
        5.3.2 数据采集与处理
        5.3.3 实验结果及对比分析
    5.4 本章小结
6 核心专利识别实例分析
7 总结与展望
    7.1 总结
    7.2 展望
参考文献
作者简历
致谢



本文编号:3864508

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3864508.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户36eff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com