基于深度学习的专利文本分析方法研究
发布时间:2021-03-12 01:17
随着现代科学技术和信息技术的发展,专利分析(Patent Analysis)在衡量技术竞争力,预测技术趋势等方面发挥着不可替代的作用,在工业、商业、法律、学术界等多个领域得到广泛的应用。在专利分析领域,高效提取专利特征,度量相似专利是一项具有挑战性的任务。鉴于深度学习(Deeplearning,DL)方法在文本分类、情感分析等自然语言处理(Natural language processing,NLP)领域表现出来的优势,本文提出了一种基于深度学习的专利文本挖掘方法,旨在挖掘、提取和量化专利文本特征,为专利检索、相似专利度量等专利分析任务提供高质量的专利特征数据。本文提出了一套较为系统的专利文本特征提取方法。首先,结合专利文本结构特点和专利文本外表特征,构造出一种用于本方法的专利文本结构化数据集;然后,利用概率统计模型——主题模型(Topic model)对专利文本潜在的语义结构进行提取、降维和聚类,并依据聚类结果构造用于深度学习的训练集;接着,构建卷积神经网络(Convolutional neural network,CNN)模型,通过有监督学习的方式,提取和组合专利文本不同维度的关...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
图1-2RNN模型架构图|19I??为了解决RNN的偏倚问题,CNN将一个无偏倚问题的模型引入到文本处理??
图1?-4?Recurrent-CNN模型架构图间??对四种神经网络模型优缺点总结如表1-1所示
图2-1?USPTO的XML格式专利文本结构(部分)??2.1.2专利文本相似度度量方法??,
本文编号:3077429
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
图1-2RNN模型架构图|19I??为了解决RNN的偏倚问题,CNN将一个无偏倚问题的模型引入到文本处理??
图1?-4?Recurrent-CNN模型架构图间??对四种神经网络模型优缺点总结如表1-1所示
图2-1?USPTO的XML格式专利文本结构(部分)??2.1.2专利文本相似度度量方法??,
本文编号:3077429
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3077429.html