当前位置:主页 > 科技论文 > 电力论文 >

增强领域特征的电力审计文本分类方法

发布时间:2021-06-01 01:44
  针对电力审计领域的文本具有行业特征明显、文本特征相似度高、分类边界模糊的特性,提出了增强领域特征的电力审计文本分类方法。首先构建面向电力审计的专业词典,提出EF-Doc2VecC模型再联合专业词典增强文本的特征,最后送入BiLSTM分类器实现专业领域的文本分类。实验结果表明,针对专业性显著的电力审计类文本分类,EF-Doc2Vec模型,在召回率、特异性、准确率和F1值分类指标上比对照模型Doc2VecC分别高出4,2,2,2个百分点;针对通用领域文本分类,EF-Doc2VecC模型在召回率、差异性、准确率和F1值分类指标上比对照模型Doc2VecC高出3,3,4,4个百分点。另外,EF-Doc2VecC模型在电力审计类的文本分类性能分别比通用领域高出4,5,3,3个百分点。因此,提出的文本向量表示方法及文本分类方法,不仅能提升通用领域的文本分类性能,还能显著提升垂直领域的文本细粒度分类性能。 

【文章来源】:计算机应用. 2020,40(S1)北大核心CSCD

【文章页数】:4 页

【部分图文】:

增强领域特征的电力审计文本分类方法


增强特征的EF-Doc2VecC模型

单元,特征向量,文本,文本分类


EF-Doc2VecC联合BiLSTM文本分类结构如图3所示。本文将每个输入文本映射成固定维度的特征向量,在与电力审计词相似性比较并筛选后得到增强的向量,将该特征向量送入BiLSTM模型中训练,可实现专业领域文本的分类任务。流程见图4所示。

文本分类,特征向量,文本


本文将每个输入文本映射成固定维度的特征向量,在与电力审计词相似性比较并筛选后得到增强的向量,将该特征向量送入BiLSTM模型中训练,可实现专业领域文本的分类任务。流程见图4所示。图4 EF-Doc2VecC联合BiLSTM文本分类过程

【参考文献】:
期刊论文
[1]基于混合神经网络的电力短文本分类方法研究[J]. 曹湘,李誉坤,钱叶,闫晨阳,杨忠光.  计算机与数字工程. 2019(05)
[2]电力行业数据式审计模式研究[J]. 余从容,卢利娟,梁东贵.  现代信息科技. 2018(04)
[3]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春.  计算机科学. 2016(06)



本文编号:3209409

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianlilw/3209409.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a9987***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com