当前位置:主页 > 科技论文 > 软件论文 >

一种面向软件配置管理制品的层次分类方法

发布时间:2018-08-17 10:07
【摘要】:配置管理工具(configuration management tool,简称CMT)作为运维自动化的组成部分,是实现开发运维一体化(development and operations,简称Dev Ops)的重要支撑技术.当前,互联网开源社区中存在数量众多的CMT脚本制品,但是缺乏有效的层次分类管理,给快速检索和高效利用CMT脚本制品带来困难.针对该问题,提出一种面向CMT制品的基于在线非结构化描述文档分析的层次分类方法.该方法利用标签共现性关系(tag co-occurrence)建立层次类别体系,基于描述属性特征,实现对CMT制品的层次分类器;并使用混合的样本划分方式针对数据倾斜问题进行了改进.对超过11 000例训练数据和1 000例测试数据进行实验,结果表明:改进的样本划分方式得到的最佳查准率、查全率、调和平均值分别达到0.81、0.88、0.85,较传统方式查全率提高0.15,调和平均值提高0.06.该结果验证了层次分类方法的有效性.
[Abstract]:As a part of operation and maintenance automation, configuration management tool (configuration management tool, (CMT) is an important supporting technology for developing integrated (development and operations, for Dev Ops). At present, there are a large number of CMT scripts in the open source community of the Internet, but the lack of effective hierarchical classification management makes it difficult to quickly retrieve and efficiently utilize CMT scripting products. To solve this problem, a hierarchical classification method based on online unstructured description document analysis for CMT products is proposed. This method uses label co-occurrence relation (tag co-occurrence) to establish a hierarchical classification system. Based on the description of attribute features, the hierarchical classifier of CMT products is implemented, and the mixed sample partitioning method is used to improve the problem of data skew. More than 11,000 training data and 1,000 test data were tested. The results showed that the best precision and recall rate obtained from the improved sample partition method, The harmonic average value reached 0.81g 0.88m 0.85, which was 0.15% higher than that of the traditional method, and 0.06% higher than that of the traditional method. The results show that the hierarchical classification method is effective.
【作者单位】: 中国科学院软件研究所;中国科学院大学;计算机科学国家重点实验室(中国科学院软件研究所);
【基金】:国家自然科学基金(61402453) 国家重点研发计划(2016YFB1000803)~~
【分类号】:TP311.5

【相似文献】

相关期刊论文 前10条

1 王义章;层次分类模型的构造及实现[J];计算机应用研究;1994年04期

2 陆彦婷;陆建峰;杨静宇;;层次分类方法综述[J];模式识别与人工智能;2013年12期

3 古平;罗志恒;欧阳源怞;;基于增量模式的文档层次分类研究[J];计算机工程;2014年01期

4 何力;丁兆云;贾焰;韩伟红;;大规模层次分类中的候选类别搜索[J];计算机学报;2014年01期

5 张金;王桥;陈卓宁;;基于规则动态解析的层次分类树控件[J];机械工程师;2007年01期

6 李文;苗夺谦;卫志华;王炜立;;基于阻塞先验知识的文本层次分类模型[J];模式识别与人工智能;2010年04期

7 高波;赵政;;文本层次分类系统的研究[J];计算机工程与应用;2006年11期

8 谭金波;杨晓江;李艺;;基于统计-规则方法的网页层次分类技术研究[J];现代图书情报技术;2007年08期

9 卫振华,忻建华,曹华,金兴;基于隶属度和规则的层次分类诊断模型[J];动力工程;2005年02期

10 曹瑛;;特征选择算法在层次分类中的比较研究[J];数字技术与应用;2010年05期

相关会议论文 前1条

1 周毅;江云亮;张铭;熊宇红;冯是聪;;基于“链接”层次分类的主题爬取[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

相关博士学位论文 前2条

1 何力;面向互联网文本的大规模层次分类技术研究[D];国防科学技术大学;2014年

2 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年

相关硕士学位论文 前8条

1 朱丽;基于层次分类的病性分析[D];南京理工大学;2015年

2 杜晓燕;基于松弛策略的文本层次分类体系构建与分类方法研究[D];北京工业大学;2016年

3 张薇娟;基于模糊认知图的分步文本层次分类研究[D];天津师范大学;2008年

4 肖雪;中文文本层次分类研究及其在唐诗分类中的应用[D];重庆大学;2006年

5 孔照昆;中文文本层次分类方法研究及应用[D];扬州大学;2013年

6 王栋;基于SVM的分类方法在内容管理中的应用[D];西北大学;2006年

7 谷峰;中文网页层次分类研究[D];华侨大学;2007年

8 缪有栋;基于类中心化的快速大规模文本层次分类问题研究[D];复旦大学;2011年



本文编号:2187271

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2187271.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69667***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com