当前位置:主页 > 社科论文 > 图书档案论文 >

基于深度学习的中文专利文本自动分类研究

发布时间:2025-01-09 02:54
  专利文本作为重要信息的载体,对其实现自动分类具有重要的研究意义。随着大数据时代的到来,人们越来越重视知识产权,专利文件也越来越多,面临的问题就是如何对专利文件进行正确的检索与分类管理。目前对于专利的分类主要还是以人工为主,不仅耗时耗力,还不能保证分类的准确率。因此,迫切需要对专利文本进行自动分类,以提高专利分类效率与审查速度。针对上述情况,本文对中文专利文本分类主要做了以下研究:首先,针对海量的专利文本,提出一种基于Word2Vec和logistic回归的中文专利文本分类的机器学习方法。本方法利用Word2Vec产生的词向量对专利文本进行表示,然后配合logistic回归模型,对专利说明和摘要合并的文本语料进行学习和训练,从而实现对专利文本的自动分类。试验结果表明,本文提出的机器学习方法能够得到较好的分类效果,其中个别类别的分类准确率达到了 83.6%;并且与k近邻算法相比,该模型在精确度、召回率以及F1值上均有显著提高。另外,虽然Word2Vec模型相较one-hot编码、TF-IDF表示法而言,有显著提高分类的效果,但是它不能解决一词多义的问题。因此,为解决利用Word2Vec模型进...

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

图1-1论文研宄框架??第一章是引言,主要包括专利文本分类的研究背景及意义、目前国内外的研??究现状

图1-1论文研宄框架??第一章是引言,主要包括专利文本分类的研究背景及意义、目前国内外的研??究现状

浙江科技学院硕士学位论文?第1章引言??f?\?,??I?引言?I??!?L?一???J??\?^^^_?:??!?背景及意义?国内外研究现状?研究内容与结构|??I?V?)?V?J?V?J?\??I?广?N?I??;?f专利文本分类相关?I??!?技术?:??j?t?一、^^?....


图2-1专利文本分类流程??

图2-1专利文本分类流程??

浙江科技学院硕士学位论文?第2章专利文本分类相关技术介绍??第2章专利文本分类相关技术介绍??2.1专利文本分类流程??专利文本是一种特殊的文本,大量专业术语的使用,行业特定的语言降低了??词汇密度,并可能导致算法的搜索空间稀疏。故意使用的非标准化语言可能会帮??助申请人扩大专利....


图2-2决策树示意图??决策树训练的过程其实是一个从训练集中归纳总结分类规则的过程,能对训??

图2-2决策树示意图??决策树训练的过程其实是一个从训练集中归纳总结分类规则的过程,能对训??

浙江科技学院硕士学位论文?第2章专利文本分类相关技术介绍??型的树形结构表示基于特征对样本进行决策的过程[48]。决策树不仅是一个递归??过程,还可以认为是定义在特征空间与类空间上的条件概率分布。根据损失函数??最小化原则在训练时利用训练集建立决策树模型,然后利用该模型在预测时对....


图3-1'可知,CBOW的核心思想.是在B知上下文w(t_2)、Wa—D、w(t+1)、??

图3-1'可知,CBOW的核心思想.是在B知上下文w(t_2)、Wa—D、w(t+1)、??

Skip-gram模型也加入一个投影层>?但此投影层??只对输入的当前词汇的ft量进行加权,最后经过输出层输出当前词t的J:下文词??汇:的词??输入?搜影?输:出?输入?_?输出??w(,-2)?^?wit-'X)??冰(,-1)|?N.?\w(t-l)??????>????^....



本文编号:4025034

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/4025034.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户97da2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com