基于决策树算法的研发项目管理系统的设计与实现
发布时间:2021-11-02 02:32
随着大数据时代的到来,数据挖掘技术被应用到各个领域中。尤其是现代企业管理中,利用数据挖掘技术分析企业大数据潜在信息,并基于此建立良好的项目管理制度以及绩效考核评价体系,提高企业的经济效益,帮助企业在复杂的市场环境下生存和发展。本文以数据挖掘技术中的决策树算法为技术核心,通过实现项目以及员工管理模块,生成绩效考核数据集,进而生成决策树,根据对决策树的评价与分析,帮助员工提升自己及管理人员实施管理。此外,基于绩效考核成绩以及项目管理信息对企业的成本进行分析,生成多维度的成本分析报表,帮助管理层更加清晰的了解公司运营状况。综合以上功能设计,编程实现了一款软件研发项目的管理系统。决策树算法是数据挖掘技术中常用的分类算法,其结果通常以if-then的规则形式进行表达。其中C4.5算法是决策树算法中的一种,具有易于理解且准确率高的优点,与其前身ID3算法相比较,增加了信息增益率的概念。经过理论分析后,本文选用C4.5算法对绩效考核结果进行分析,通过收集数据、数据预处理、计算信息增益率、确定分裂属性以及后剪枝等步骤,生成用于绩效考核的决策树。进而利用测试数据集对决策树进行检验,得出决策树的准确率在9...
【文章来源】:北京建筑大学北京市
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
数据挖掘步骤示意图
第2章相关理论和研究方法7视化工具进行展示[18]。数据挖掘的主要方法有分类、估值、预测、关联规则以及聚类,其中分类、估值、预测属于有指导的数据挖掘,这些方法可以通过数据建立一个可以对特定属性进行描述的模型,关联规则以及聚类分析属于无指导的数据挖掘,这类方法使用过所有属性寻找某种关系。不同的数据挖掘方法有着属于自己的数据挖掘算法,例如分类中的决策树算法、预测中的回归分析、聚类中的K-means聚类,具体算法介绍如图2-2:图2-2数据挖掘算法分类图Fig.2-2Dataminingalgorithmclassificationgraph本文根据绩效考核的相关需求,选用分类方法中的决策树算法作为数据挖掘的算法,通过对系统数据的分析,得出有关于绩效考核体系的决策树,帮助管理人员更方便的对员工进行考核分析。2.1.2决策树算法本文所使用的的算法是分类算法中的决策树算法。在数据挖掘[19]的分类算法中,与其他的分类方法相比,决策树分类方法有着简单易懂、不用过于专业的背景知识等优点。决策树生成的结果通常是以if-then的规则形式进行表达的,这种方式清晰且简单,被广泛应用在金融行业、气象分析、交通管理等多个领域中[20]。决策树是一种树结构,包括根节点、分支、叶子三部分,根节点表示树的一个属性,叶子表示分类的标记,分支表示输出的结果。该方法从根节点开始循环反复遍历,根据测试所得出的结果,将实例分配到其子节点,每个子节点都会对应该特征的一个取值,通过递归的方法,继续对实例进行测试与分配,直到到达叶节点,最后将实例分到叶节点的类中。在决策树中,有样本数据集以及测试数据集两种,样本数据集是一个数据集
第2章相关理论和研究方法10||||log||||(X)SplitInfo21AXXXXjijj(2-4)接着根据属性A的分裂之后的样本集的信息增益:ain(X(X)H-H(X)A),InfoGA(2-5)属性A分裂之后的样本集的信息增益率:)(),(),(XSplitInfoainAXInfoGatioAXGainRA(2-6)在C4.5算法执行之后,得到有属性信息增益率的结果,选取信息增益率最大的属性作为当前节点的分裂属性[31]。其他属性将会继续进行递归计算。随着属性逐渐的计算,信息增益率将会变得越来越小,选择相对较大的信息增益率的属性作为分类属性。直到最终决策树的生成。C4.5的具体流程图如下图2-3:图2-3C4.5算法流程图
本文编号:3471163
【文章来源】:北京建筑大学北京市
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
数据挖掘步骤示意图
第2章相关理论和研究方法7视化工具进行展示[18]。数据挖掘的主要方法有分类、估值、预测、关联规则以及聚类,其中分类、估值、预测属于有指导的数据挖掘,这些方法可以通过数据建立一个可以对特定属性进行描述的模型,关联规则以及聚类分析属于无指导的数据挖掘,这类方法使用过所有属性寻找某种关系。不同的数据挖掘方法有着属于自己的数据挖掘算法,例如分类中的决策树算法、预测中的回归分析、聚类中的K-means聚类,具体算法介绍如图2-2:图2-2数据挖掘算法分类图Fig.2-2Dataminingalgorithmclassificationgraph本文根据绩效考核的相关需求,选用分类方法中的决策树算法作为数据挖掘的算法,通过对系统数据的分析,得出有关于绩效考核体系的决策树,帮助管理人员更方便的对员工进行考核分析。2.1.2决策树算法本文所使用的的算法是分类算法中的决策树算法。在数据挖掘[19]的分类算法中,与其他的分类方法相比,决策树分类方法有着简单易懂、不用过于专业的背景知识等优点。决策树生成的结果通常是以if-then的规则形式进行表达的,这种方式清晰且简单,被广泛应用在金融行业、气象分析、交通管理等多个领域中[20]。决策树是一种树结构,包括根节点、分支、叶子三部分,根节点表示树的一个属性,叶子表示分类的标记,分支表示输出的结果。该方法从根节点开始循环反复遍历,根据测试所得出的结果,将实例分配到其子节点,每个子节点都会对应该特征的一个取值,通过递归的方法,继续对实例进行测试与分配,直到到达叶节点,最后将实例分到叶节点的类中。在决策树中,有样本数据集以及测试数据集两种,样本数据集是一个数据集
第2章相关理论和研究方法10||||log||||(X)SplitInfo21AXXXXjijj(2-4)接着根据属性A的分裂之后的样本集的信息增益:ain(X(X)H-H(X)A),InfoGA(2-5)属性A分裂之后的样本集的信息增益率:)(),(),(XSplitInfoainAXInfoGatioAXGainRA(2-6)在C4.5算法执行之后,得到有属性信息增益率的结果,选取信息增益率最大的属性作为当前节点的分裂属性[31]。其他属性将会继续进行递归计算。随着属性逐渐的计算,信息增益率将会变得越来越小,选择相对较大的信息增益率的属性作为分类属性。直到最终决策树的生成。C4.5的具体流程图如下图2-3:图2-3C4.5算法流程图
本文编号:3471163
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3471163.html