序列事件周期性检测模型优化及应用
发布时间:2021-07-23 08:59
周期模式挖掘是在时间序列数据中寻找重复出现的序列模式的方法,主要用来刻画变化较小或者稳定的用户行为模式,在许多应用场景下,时间序列数据的周期模式挖掘都具有重要意义。本文在基于交叉熵的序列事件周期性检测方法CEPD(Cross-Entropy based Periodicity Detection)的基础上,针对该方法存在的三个问题,做了进一步改进和拓展研究,并结合电子商务和移动互联网环境下的用户行为进行了推荐应用。本文的主要内容包括三个方面,第一,实现了基于交叉熵的序列事件周期性检测方法的对比研究,并给出了该方法理论上的时间复杂度,在构造数据集和实际数据集上,将基于交叉熵的序列事件周期性检测方法与其他已有方法在运行效率、抗噪音性能和周期检测结果的准确率这三个方面进行了对比,从实验和理论两个方面证明了该方法的可用性。第二,使用机器学习中的正则化技术对周期检测方法的目标函数进行优化,解决了交叉熵随划分周期的增大而系统性下降的问题,提高了方法的可用性以及周期检测结果的可用性,并使用构造数据和实际数据进行实验验证。在具有明显周期的数据集上,添加了正则化项之后的模型更容易检测到合适的周期值。第三...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
京东商城某用户购物记录网络结构挖掘(WebStructureMining)和网络用途挖掘(WebUsageMining),网
| |(|| ) log*j jSnnsupp x P supp x P Ssupp x suppLx np q 式 5-1 可以看出,有两种方式可以最小化 得 *|jsupp x Ssupp x Pn ,这样 将接近 0;S ,这样可以得到一个较小的Sn 值。制序列 BS {1000010000100001000010000100001该序列的交叉熵曲线,上面的nKL 表示分布周期在 表示结构周期在不同划分 下的交叉熵。以看出:(1) 5 , 1 0 和 1 5 都是可能的周期分;(2)对于所有可能的划分 中的某些划分,小值,同时随着划分周期n的增大,交叉熵的值也 部分。
MV 166 欧美 7登录 408 频道 962电台 1237 其它 7124港台 1 日韩 7歌曲 489 试听 24057歌手 5056 收藏 435华语 9 搜索 2890内地 30 专辑 1具体用户的行为类型可能只有几种,不同用户在不同时间点的不一样,比如 ID 为“A4A68C413638708428CE81F5772FAE91”有“试听、电台、歌手、其他”四种行为类型。下表 6-1 展示了歌行为在一天 24 小时上的汇总统计,可以看出该用户听歌的午 18 点到晚上 21 点,而在上午 10 点之前没有听歌行为。不时间维度上会表现出不一样的规律性。
【参考文献】:
期刊论文
[1]时间序列周期模式挖掘算法分析[J]. 邹蕾. 中国管理信息化. 2016(03)
[2]基于二进制序列数据的确定事件周期性检测研究[J]. 袁华,杨锐,钱宇,罗谦. 管理工程学报. 2015(04)
[3]大数据背景下基于网络整合数据的消费者行为分析[J]. 陈思. 新闻传播. 2013(08)
[4]个性化推荐系统的研究进展[J]. 刘建国,周涛,汪秉宏. 自然科学进展. 2009(01)
[5]序列模式挖掘综述[J]. 陈卓,杨炳儒,宋威,宋泽锋. 计算机应用研究. 2008(07)
[6]时间序列数据挖掘综述[J]. 贾澎涛,何华灿,刘丽,孙涛. 计算机应用研究. 2007(11)
博士论文
[1]基于流量监测的网络用户行为分析[D]. 延皓.北京邮电大学 2011
硕士论文
[1]基于交叉熵的序列事件周期性检测及应用研究[D]. 杨锐.电子科技大学 2013
本文编号:3298991
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
京东商城某用户购物记录网络结构挖掘(WebStructureMining)和网络用途挖掘(WebUsageMining),网
| |(|| ) log*j jSnnsupp x P supp x P Ssupp x suppLx np q 式 5-1 可以看出,有两种方式可以最小化 得 *|jsupp x Ssupp x Pn ,这样 将接近 0;S ,这样可以得到一个较小的Sn 值。制序列 BS {1000010000100001000010000100001该序列的交叉熵曲线,上面的nKL 表示分布周期在 表示结构周期在不同划分 下的交叉熵。以看出:(1) 5 , 1 0 和 1 5 都是可能的周期分;(2)对于所有可能的划分 中的某些划分,小值,同时随着划分周期n的增大,交叉熵的值也 部分。
MV 166 欧美 7登录 408 频道 962电台 1237 其它 7124港台 1 日韩 7歌曲 489 试听 24057歌手 5056 收藏 435华语 9 搜索 2890内地 30 专辑 1具体用户的行为类型可能只有几种,不同用户在不同时间点的不一样,比如 ID 为“A4A68C413638708428CE81F5772FAE91”有“试听、电台、歌手、其他”四种行为类型。下表 6-1 展示了歌行为在一天 24 小时上的汇总统计,可以看出该用户听歌的午 18 点到晚上 21 点,而在上午 10 点之前没有听歌行为。不时间维度上会表现出不一样的规律性。
【参考文献】:
期刊论文
[1]时间序列周期模式挖掘算法分析[J]. 邹蕾. 中国管理信息化. 2016(03)
[2]基于二进制序列数据的确定事件周期性检测研究[J]. 袁华,杨锐,钱宇,罗谦. 管理工程学报. 2015(04)
[3]大数据背景下基于网络整合数据的消费者行为分析[J]. 陈思. 新闻传播. 2013(08)
[4]个性化推荐系统的研究进展[J]. 刘建国,周涛,汪秉宏. 自然科学进展. 2009(01)
[5]序列模式挖掘综述[J]. 陈卓,杨炳儒,宋威,宋泽锋. 计算机应用研究. 2008(07)
[6]时间序列数据挖掘综述[J]. 贾澎涛,何华灿,刘丽,孙涛. 计算机应用研究. 2007(11)
博士论文
[1]基于流量监测的网络用户行为分析[D]. 延皓.北京邮电大学 2011
硕士论文
[1]基于交叉熵的序列事件周期性检测及应用研究[D]. 杨锐.电子科技大学 2013
本文编号:3298991
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3298991.html