基于负序列模式的序列规则挖掘算法研究
发布时间:2021-06-11 06:46
负序列规则考虑了未发生事件对决策的影响,从新的角度分析了数据潜在的含义,弥补了正序列规则可能误导决策的不足,有重要研究意义。然而,现有的负序列规则挖掘算法的研究非常匮乏,仍然存在很多问题需要解决,包括:(1)由于负序列模式并不满足向下封闭性原理,使得频繁负序列模式的某些子模式有可能不频繁,从而无法计算相应负序列规则的置信度,同时还会导致一些负序列规则的置信度可能大于1,给用户设置置信度阈值带来困难;(2)由于首次从负序列模式中挖掘负序列规则,生成哪种形式的负序列规则才算合理;(3)从负序列模式中挖掘负序列规则后会产生相互矛盾的规则,如何修剪掉这些矛盾规则以保证得到的规则能够真正用于决策?本文对上述问题进行了研究,提出了一个从负序列模式中挖掘负序列规则的算法nsp Rule和一个基于贡献度和相关系数的规则修剪算法ASR(Actionable Sequential Rule)。具体如下:针对前两个问题,本文提出了一个从负序列模式中挖掘负序列规则的有效算法—nsp Rule。该算法首先判断规则的前件或后件是否是频繁模式,通过删除掉不频繁的模式以解决规则置信度无法计算的问题。而对于部分规则的置...
【文章来源】:齐鲁工业大学山东省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
min_sup在DS1数据集上的影响
齐鲁工业大学硕士学位论文29图3.3min_sup在DS2数据集上的影响图3.4min_sup在DS3数据集上的影响图3.5支持度在DS4数据集上的影响3.4.2置信度对实验的影响分析在第二个实验中,我们使用不同的min_conf值和一个固定的min_sup值在DS1到DS4数据集上来评估min_conf对产生的正负序列规则数量的影响。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下运行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup为固定值0.06,min_conf分别设定为0.1,0.2,…,0.5。在DS4上,这两个算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18运行。我们之所以在DS3数据集上设置不同的min_conf,是因为DS3中的数据比较集中,即对min_conf不敏感。如果我们将min_conf还是设置为0.12-0.18,修剪掉的规则的数量变化并不明显。图3.6(a)显示,在min_conf不断的增加的情况
齐鲁工业大学硕士学位论文29图3.3min_sup在DS2数据集上的影响图3.4min_sup在DS3数据集上的影响图3.5支持度在DS4数据集上的影响3.4.2置信度对实验的影响分析在第二个实验中,我们使用不同的min_conf值和一个固定的min_sup值在DS1到DS4数据集上来评估min_conf对产生的正负序列规则数量的影响。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下运行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup为固定值0.06,min_conf分别设定为0.1,0.2,…,0.5。在DS4上,这两个算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18运行。我们之所以在DS3数据集上设置不同的min_conf,是因为DS3中的数据比较集中,即对min_conf不敏感。如果我们将min_conf还是设置为0.12-0.18,修剪掉的规则的数量变化并不明显。图3.6(a)显示,在min_conf不断的增加的情况
【参考文献】:
期刊论文
[1]基于校园一卡通数据的大学生用餐消费相关性分析[J]. 王金鑫. 科学技术创新. 2018(15)
[2]基于校园卡消费数据的大学生消费行为的研究[J]. 湛思思,冯维华,杜宇,曾卫林. 电子技术与软件工程. 2018(03)
[3]基于决策树数据挖掘算法的大学生消费数据分析[J]. 黄剑. 电脑与信息技术. 2015(05)
[4]基于校园一卡通数据的学生消费及学习行为分析[J]. 姜楠,许维胜. 微型电脑应用. 2015(02)
本文编号:3224041
【文章来源】:齐鲁工业大学山东省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
min_sup在DS1数据集上的影响
齐鲁工业大学硕士学位论文29图3.3min_sup在DS2数据集上的影响图3.4min_sup在DS3数据集上的影响图3.5支持度在DS4数据集上的影响3.4.2置信度对实验的影响分析在第二个实验中,我们使用不同的min_conf值和一个固定的min_sup值在DS1到DS4数据集上来评估min_conf对产生的正负序列规则数量的影响。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下运行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup为固定值0.06,min_conf分别设定为0.1,0.2,…,0.5。在DS4上,这两个算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18运行。我们之所以在DS3数据集上设置不同的min_conf,是因为DS3中的数据比较集中,即对min_conf不敏感。如果我们将min_conf还是设置为0.12-0.18,修剪掉的规则的数量变化并不明显。图3.6(a)显示,在min_conf不断的增加的情况
齐鲁工业大学硕士学位论文29图3.3min_sup在DS2数据集上的影响图3.4min_sup在DS3数据集上的影响图3.5支持度在DS4数据集上的影响3.4.2置信度对实验的影响分析在第二个实验中,我们使用不同的min_conf值和一个固定的min_sup值在DS1到DS4数据集上来评估min_conf对产生的正负序列规则数量的影响。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下运行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup为固定值0.06,min_conf分别设定为0.1,0.2,…,0.5。在DS4上,这两个算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18运行。我们之所以在DS3数据集上设置不同的min_conf,是因为DS3中的数据比较集中,即对min_conf不敏感。如果我们将min_conf还是设置为0.12-0.18,修剪掉的规则的数量变化并不明显。图3.6(a)显示,在min_conf不断的增加的情况
【参考文献】:
期刊论文
[1]基于校园一卡通数据的大学生用餐消费相关性分析[J]. 王金鑫. 科学技术创新. 2018(15)
[2]基于校园卡消费数据的大学生消费行为的研究[J]. 湛思思,冯维华,杜宇,曾卫林. 电子技术与软件工程. 2018(03)
[3]基于决策树数据挖掘算法的大学生消费数据分析[J]. 黄剑. 电脑与信息技术. 2015(05)
[4]基于校园一卡通数据的学生消费及学习行为分析[J]. 姜楠,许维胜. 微型电脑应用. 2015(02)
本文编号:3224041
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3224041.html
最近更新
教材专著