文本相似度在综合计划的专项项目可研评审工作中的应用
发布时间:2020-11-13 03:33
近年来国家电网公司不断深化综合计划管理,在原来的基础上共设置了电网基建、生产技改、生产大修、小型基建、零星购置、非生产技改、非生产大修、营销授投入、信息化投入、研究开发、管理咨询、教育培训、产业基建、产业技改、产业大修、股权投资16个专须项目。这不仅是强化了项目管理,而且对经研院的评审支撑作用提出了更高的要求。这就需要经研院的评审人员从专业和技术经济角度,充分论证项目必要性,评审人员需要严格按照国家和公司相关标准要求,优化实施方案和设备选型,明确项目投入估算。因为西藏经研院从事评审工作的人员较少,所以每一位评审人员都需要阅读大量的专项项目可研送审报告,然后判断其可研送审报告内容是否完整,建设是否必要、方案是否可行、估算是否准确。针对上述问题,本课题通过文本相似度在可研评审工作中的应用,开展专项项目可研送审报告的预审工作,为评审人员的评审工作提供辅助作用,为其判断该专项项目可研送审报告是否应用专项项目可研报告模板以及专项项目可研送审报告内容是否完整。本文简要对文本相似度算法的国内外研究现状进行了介绍分析,阐述其基本原理和优点,并提出其存在的局限性,从而开展论文所提出的基于隐性狄利克雷分配(Latent Dirichlet Allocation,LD.A)的相似度度量算法为基础的相关工作。本文通过停用词过滤、分词及诃频统计、文本主题挖掘、文本聚类和评估结果搭建完成文本相似度计算实验。本文利用阿里云的PAI平台实现文本相似度计算实验。该实验已经在不同的专项项目可研送审报告得到了应用,已经取得明显的效果。其提高了项目评审的工作效率,对专项项目可研送审报告进行了预审,剔除内容不全的专项项目可研送审报告,使评审人员把更多的精力放在审核符合预审要求的报告上,对其建设必要性、方案是否可行等方面的审查,进而提高了可研评审质量,为综合计划管理提供了支撑。
【学位单位】:电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F426.61;TP391.1
【部分图文】:
第四章文本相似度实验的设计第四章文本相似度实验的设计??似度实验概述??述研究的基础之上来设计一个文本查重实验。该实验将主台来实现,仅借助web网页的方式进行传输应用文件格式,件的文本信息,最后针对所获取的文本信息采取相应的运相似度值。通过设计文本查重实验为开展专项项目可研预审评估奠定了基础。??相似度实验的组成??验共涉及了如下四个层面的模块,包括停用词过滤、分词及掘、结果分析和评估。实验的结构如下图所示:??
?和??滤?I?I?i??图4-1文本相似度实验的组成??4.1.2文本相似度实验流程??在计算文本相似度时,实验大致分为以下五个步骤:??首先要将待比较的文本从各种常用格式的文件中提取出来^??(1)
?和??滤?I?I?i??图4-1文本相似度实验的组成??4.1.2文本相似度实验流程??在计算文本相似度时,实验大致分为以下五个步骤:??首先要将待比较的文本从各种常用格式的文件中提取出来^??(1)
【参考文献】
本文编号:2881665
【学位单位】:电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F426.61;TP391.1
【部分图文】:
第四章文本相似度实验的设计第四章文本相似度实验的设计??似度实验概述??述研究的基础之上来设计一个文本查重实验。该实验将主台来实现,仅借助web网页的方式进行传输应用文件格式,件的文本信息,最后针对所获取的文本信息采取相应的运相似度值。通过设计文本查重实验为开展专项项目可研预审评估奠定了基础。??相似度实验的组成??验共涉及了如下四个层面的模块,包括停用词过滤、分词及掘、结果分析和评估。实验的结构如下图所示:??
?和??滤?I?I?i??图4-1文本相似度实验的组成??4.1.2文本相似度实验流程??在计算文本相似度时,实验大致分为以下五个步骤:??首先要将待比较的文本从各种常用格式的文件中提取出来^??(1)
?和??滤?I?I?i??图4-1文本相似度实验的组成??4.1.2文本相似度实验流程??在计算文本相似度时,实验大致分为以下五个步骤:??首先要将待比较的文本从各种常用格式的文件中提取出来^??(1)
【参考文献】
相关期刊论文 前10条
1 张佩云;陈传明;黄波;;基于子树匹配的文本相似度算法[J];模式识别与人工智能;2014年03期
2 王静婷;;基于汉字聚类特征的中文字符串相似度计算研究[J];现代图书情报技术;2011年02期
3 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
4 彭京;杨冬青;唐世渭;王腾蛟;高军;;基于概念相似度的文本相似计算[J];中国科学(F辑:信息科学);2009年05期
5 王晓东;郭雷;方俊;董淑福;;一种基于EMD的文档语义相似性度量[J];电子与信息学报;2008年09期
6 曹恬;周丽;张国煊;;一种基于词共现的文本相似度计算[J];计算机工程与科学;2007年03期
7 刘宝生;闫莉萍;周东华;;几种经典相似性度量的比较研究[J];计算机应用研究;2006年11期
8 曹勇刚;曹羽中;金茂忠;刘超;;面向信息检索的自适应中文分词系统[J];软件学报;2006年03期
9 霍华,冯博琴;基于压缩稀疏矩阵矢量相乘的文本相似度计算[J];小型微型计算机系统;2005年06期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
相关硕士学位论文 前1条
1 郭勇;基于《知网》的词语相似度计算研究及应用[D];湖南大学;2012年
本文编号:2881665
本文链接:https://www.wllwen.com/qiyeguanlilunwen/2881665.html