当前位置:主页 > 科技论文 > 软件论文 >

支持推荐非空率的关联规则推荐算法

发布时间:2018-05-01 19:02

  本文选题:关联规则 + 推荐系统 ; 参考:《通信学报》2017年10期


【摘要】:现有的关联规则推荐技术在数据提取时主要侧重于关联规则的提取效率,缺乏对冷、热门数据推荐平衡性的考虑和有效处理。为了提高个性化推荐效率和推荐质量,平衡冷门与热门数据推荐权重,对关联规则的Apriori算法频繁项集挖掘问题进行了重新评估和分析,定义了新的测评指标推荐非空率以及k前项频繁项集关联规则的概念,设计了基于k前项频繁项集的剪枝方法,提出了优化Apriori算法且适合不同测评标准值的k前项频繁项集挖掘算法,降低频繁项集提取的时间复杂度。理论分析比较与实验表明,k前项剪枝方法提高了频繁项集的提取效率,拥有较高的推荐非空率、调和平均值和推荐准确率,有效地平衡了冷、热门数据的推荐权重。
[Abstract]:The existing association rule recommendation techniques mainly focus on the efficiency of association rule extraction when data extraction, lack of cold, hot data recommendation balance consideration and effective processing. In order to improve the efficiency and quality of personalized recommendation and to balance the recommended weight between the unpopular and popular data, the frequent itemset mining problem of Apriori algorithm for association rules is reevaluated and analyzed. In this paper, we define the concepts of new evaluation index recommendation non-empty ratio and frequent itemsets association rules of k-front terms, and design a pruning method based on k-preterm frequent itemsets. An algorithm for mining k-front frequent itemsets with optimized Apriori algorithm and suitable for different evaluation standard values is proposed to reduce the time complexity of frequent itemsets extraction. The theoretical analysis and experiment show that the pruning method improves the efficiency of extracting frequent itemsets, has a high recommendation non-empty rate, harmonizes the average value and the recommendation accuracy, and effectively balances the recommended weights of cold and hot data.
【作者单位】: 北京工业大学信息学部计算机学院;国网英大国际控股集团有限公司信息化工作部;
【基金】:国家自然科学基金资助项目(No.91646201,No.91546111) 北京市自然科学基金资助项目(No.4153058,No.4113076) 北京市教委面上基金资助项目(No.KM201710005023)~~
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 贾磊,裴仁清;多约束下的频繁项集挖掘[J];计算机工程与应用;2003年31期

2 肖基毅,邹腊梅,刘丰;频繁项集挖掘算法研究[J];情报杂志;2005年11期

3 蔡进;薛永生;张东站;;基于分区分类法快速更新频繁项集[J];计算机工程与应用;2007年09期

4 胡学钢;徐勇;王德兴;张晶;;基于多剪枝格的频繁项集表示与挖掘[J];合肥工业大学学报(自然科学版);2007年04期

5 胡学钢;刘卫;王德兴;;基于剪枝概念格模型的频繁项集表示及挖掘[J];合肥工业大学学报(自然科学版);2007年09期

6 栾鸾;李云;盛艳;;多关系频繁项集的并行获取[J];微电子学与计算机;2008年10期

7 李彦伟;戴月明;王金鑫;;一种挖掘加权频繁项集的改进算法[J];计算机工程与应用;2011年15期

8 陈立潮,张建华,刘玉树;提高频繁项集挖掘算法效率的方法研究[J];计算机工程与应用;2002年10期

9 朱玉全,孙志挥,赵传申;快速更新频繁项集[J];计算机研究与发展;2003年01期

10 宋宝莉;张帮华;何炎祥;朱骁峰;;带有多个可转化约束的频繁项集挖掘算法[J];计算机科学;2003年12期

相关会议论文 前10条

1 栾鸾;李云;盛艳;;多关系频繁项集的并行获取[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年

2 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

3 邓传国;;频繁项集挖掘与学生素质测评应用研究[A];2007系统仿真技术及其应用学术会议论文集[C];2007年

4 李彤岩;李兴明;;基于分布式关联规则挖掘的告警相关性研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年

5 王洪利;冯玉强;;频繁项集挖掘算法Apriori的改进研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年

6 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年

7 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

8 邹远娅;周皓峰;王晨;汪卫;施伯乐;;FSC——利用频繁项集挖掘估算视图大小[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

9 杨晓雪;衡红军;;一种对XML数据进行关联规则挖掘的方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

10 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

相关重要报纸文章 前10条

1 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

2 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年

3 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年

4 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年

5 任中华;财务数据挖掘六步走[N];中国计算机报;2007年

6 电脑商报记者 谢涛;数据挖掘:未来政府信息化的重要环节[N];电脑商报;2007年

7 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年

8 本报特约撰稿 许丽萍;数据挖掘:软件应用的新境界[N];计算机世界;2009年

9 谢立宏博士;企业的“黄金眼”数据挖掘决策支持[N];中国计算机报;2002年

10 吴勇毅;危机下,数据挖掘与提供信息决策是关健[N];中国冶金报;2009年

相关博士学位论文 前10条

1 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年

2 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年

3 贾彩燕;关联规则挖掘的取样复杂性分析[D];中国科学院研究生院(计算技术研究所);2004年

4 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年

5 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年

6 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年

7 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年

8 吴贤;社会化数据挖掘中的若干问题研究[D];上海交通大学;2015年

9 杨博;基于GPU异构体系结构的大规模图数据挖掘关键技术研究[D];国防科学技术大学;2015年

10 冯骥;自然邻居思想概念及其在数据挖掘领域的应用[D];重庆大学;2016年

相关硕士学位论文 前10条

1 王立俊;基于多重最小支持度的氋效用频繁项集挖掘算法研究[D];广西大学;2015年

2 陈国俊;基于Hadoop的云存储系统的研究与应用[D];电子科技大学;2014年

3 尹艳红;基于Apriori算法的增量式关联规则控制研究[D];大连理工大学;2015年

4 田苗凤;大数据背景下并行动态关联规则挖掘研究[D];兰州交通大学;2015年

5 李雪迪;基于本体论的精细化数据分析[D];南京邮电大学;2015年

6 许静文;基于模糊等价类的频繁项集精简表示算法研究[D];合肥工业大学;2015年

7 王大伟;大数据环境下的关联规则提取算法研究[D];辽宁工业大学;2016年

8 廖友金;基于有向图的关联规则挖掘研究与改进[D];东南大学;2015年

9 王苏琦;基于Hadoop的不确定频繁项集并行挖掘方法研究[D];南京大学;2013年

10 韩宏莹;并行数据挖掘技术在电信网管告警中的应用研究[D];长春工业大学;2016年



本文编号:1830663

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1830663.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a720c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com