当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于流特征的因果结构学习算法研究

发布时间:2021-01-29 00:08
  因果结构学习的目标是通过对大量数据的训练得到一个反映事物之间客观联系的因果模型。挖掘蕴含在数据中的因果结构关系,为我们认识事物发展变化的规律以及探究引起事物发展变化的本质因素提供思路和依据,从而更好的做出决策,是数据挖掘领域的重要内容。然而,目前为止对因果结构学习问题的研究只局限于静态特征空间下,而在数据动态变化急剧增长的今天,静态特征空间下的学习方法显然存在着空间和时间上的不适性和不可行性。为了将因果结构学习算法同样可以高效的应用在动态特征空间上,本文主要研究了动态特征空间下的因果结构学习算法,并且同时兼容静态特征空间下的因果结构学习问题,并且比其更加高效。具体而言,本文的研究工作如下:首先,针对现有因果结构学习算法无法适应动态变化的特征空间的现状,对动态特征空间下和因果结构学习的关键理论和技术进行研究,以流特征的概念来建模特征空间的动态性,提出了一种基于流特征的因果结构学习框架。在该框架中,我们对于每一个新到的特征,我们首先在已经到达的特征中选择出其可能的候选邻居节点来缩小候选邻居节点的搜索范围。随后基于这些可能的候选邻居节点进行进一步地筛选得到其候选邻居节点。对每一个新到的特征做... 

【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校

【文章页数】:76 页

【学位级别】:硕士

【部分图文】:

基于流特征的因果结构学习算法研究


图3.3五个算法在不同网络和不同数据样本大小下的运行时间??Fig?3.?3?Running?time?of?five?algor?

结构误差,数据样本,阈值,互信息


置会直接影响算法的性能,所以在进行正式的算法性能验证试验之前,我们首先??通过一系列的实验来获得算法的最佳阈值,该阈值应该能使算法在所有网络下均??表现出较好的适应性。如图4.2所示为CSSU算法采用不同的互信息阚值(0.005,??0.01,0.01和0.1)在不同网络下的结构误差数目。其中X轴表示样本大小(100,??500,1000,?5000和10000)?,?Y轴表示网络结构误差数目。图4.2中(a)?-?(g)??分别显示了不同网络下的实验结果,按照网络维度递增的顺序依次为:(a)??insurance,?(b)?alarm,(c)?barley’(d)?carpo,(e)?alarmlO,(f)?hailfinderlO?和(g)?gene。??从图4.2的实验结果可以看出,互信息阈值的设定确实会对CSSU算法的性能产生??影响。基本上在每个网络下,当数据集较小(实验中样本数量为1〇〇)时,算法的??结构误差数目普遍较大,这是由于小样本下互信息的计算缺乏可靠性,所以导致??算法表现出较低的准确度

结构误差,算法,数据样本,样本数量


Two-phase算法与CSSU算法相比,从实验图中可以看出,CSSU算法无论是??在结构误差方面还是运行时间上都比Two-phase算法更加优良,且随着样本数量??的增加CSSU算法的优势更加明显,如图4.4所示two-phase算法的运行时间随着??样本数量的增加急剧增长


本文编号:3005937

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3005937.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12699***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com