基于Hadoop的数据挖掘算法在葡萄酒信息数据分析系统中的应用
本文选题:Hadoop 切入点:数据挖据算法 出处:《计算机应用》2017年S1期 论文类型:期刊论文
【摘要】:针对宁夏贺兰山东麓葡萄酒庄在销售自产葡萄酒的过程中存在葡萄酒信息数据分析不准确、销售渠道窄、销售信息更新慢、销量不高等问题,提出了一种基于Hadoop分布式框架的数据挖掘算法,对极大量的葡萄酒信息数据分析系统的数据进行采集、分析,并根据分析结果为用户推荐适合其口味的葡萄酒饮品。该系统以宁夏贺兰山东麓葡萄酒庄为实验基地,自主开发葡萄酒信息数据分析系统,并利用数据挖据算法中的聚类算法K-means算法和分类算法中的C4.5算法进行数据挖据;其中针对聚类算法中的K-means算法和分类算法中的C4.5算法实现分布式研究,实现了基于Map Reduce的分布式聚类和分类算法,并且在此基础上对其各自的缺点进行相应的改进。实验证明了基于Hadoop框架的数据挖掘算法在算法的稳定性和准确率上均有很好的提升,并且可以对葡萄酒信息数据分析系统的海量数据进行很好的处理。
[Abstract]:In view of the problems of inaccurate analysis of wine information data, narrow sales channels, slow updating of sales information and low sales volume in the process of selling wine from the eastern foothills of Helan Mountain in Ningxia, the wine farms have some problems, such as inaccurate analysis of wine information data, narrow sales channels, and so on. A data mining algorithm based on Hadoop distributed framework is proposed to collect and analyze the data of a large number of wine information data analysis system. Based on the results of the analysis, the authors recommend the wine drinks suitable for their taste. The system takes the eastern foothills of Helan Mountain in Ningxia as the experimental base and independently develops the wine information and data analysis system. The data mining algorithm is based on the clustering algorithm (K-means) and the classification algorithm (C4.5), in which the K-means algorithm and the C4.5 algorithm of the clustering algorithm are used to realize the distributed research. The distributed clustering and classification algorithm based on Map Reduce is implemented. On the basis of this, the corresponding improvement is made on their respective shortcomings. The experiment proves that the data mining algorithm based on Hadoop framework has a good improvement in the stability and accuracy of the algorithm. And the wine information data analysis system can do a good deal with the massive data.
【作者单位】: 宁夏大学信息工程学院;
【基金】:宁夏大学研究生创新项目(GIP201625)
【分类号】:F426.82;TP311.13
【相似文献】
相关期刊论文 前10条
1 李磊;;黑龙江邮政数据分析系统研究[J];林业科技情报;2011年04期
2 陈起榕;陈新亮;曹世彪;;一种新的数据分析系统前端展示方案[J];邮电设计技术;2012年10期
3 孟庆超;李永亮;;智能数据分析系统研究[J];现代商贸工业;2008年11期
4 郭静;;钢铁企业能源数据分析系统的构建[J];昆明理工大学学报(理工版);2009年05期
5 哈文雷;;基于云计算的油田数据分析系统[J];中国新技术新产品;2013年17期
6 黄丽丽;陈华辉;;博客数据分析系统的设计与实现[J];宁波大学学报(理工版);2008年03期
7 田月洁;焦波;谢金洲;;中药不良反应数据分析系统的设计与应用[J];中国药物警戒;2007年04期
8 毛兰斌;;基于机电结构检测的可靠性数据分析系统设计[J];中国高新技术企业;2008年08期
9 毛羽芳;王锐明;;天津市工商行政管理局数据分析系统的建设[J];信息系统工程;2010年07期
10 章璐;;人民币跨境结算业务数据分析系统的设计与实现[J];中国金融电脑;2013年01期
相关会议论文 前7条
1 顾红生;;浅谈汽车行业竞品数据分析系统解决方案[A];第八届中国汽车设计与研发高峰论坛论文集[C];2013年
2 辛建峰;辛阳;;数据分析系统中的自定义量度方案设计实现[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 尚屹;朱琦;;国家持久性有机污染物数据分析系统研究[A];2008中国环境科学学会学术年会优秀论文集(下卷)[C];2008年
4 郑慧娟;周嘉元;李斌;;水电站生产数据分析系统及其现场应用[A];中国水力发电工程学会信息化专委会2010年学术交流会论文集[C];2010年
5 张永忠;赵静;;基于事件检测算法的交通数据分析系统[A];2008全国第十三届自动化应用技术学术交流会论文集[C];2008年
6 王治国;王薇;訾凯;任鹏;;临床检验方法确认与性能验证数据分析系统(MVS)的开发与应用[A];中华医学会第九次全国检验医学学术会议暨中国医院协会临床检验管理专业委员会第六届全国临床检验实验室管理学术会议论文汇编[C];2011年
7 董刚;孙建林;谭耘宇;;建立梅钢热轧数据分析系统[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
相关重要报纸文章 前8条
1 记者 刘慧敏;开发区一企业研发成功“消费行为数据分析系统”[N];宁波日报;2009年
2 别志铭;基于云的大数据分析系统[N];网络世界;2013年
3 袁毅;苏州:数据分析系统精准问诊城市交通[N];人民公安报·交通安全周刊;2011年
4 绍兴职业技术学院 沈华峰 宁波大学信息科学与工程学院 朱双东;基于可缩放矢量图形数据分析系统的设计与实现[N];中国计算机报;2010年
5 记者 董科;转型客户服务 打造全新竞争力[N];期货日报;2010年
6 江苏省淮安市涟水地税局 周跃 黄吕胜 童政;应完善税收数据分析系统提升使用效能[N];中国税务报;2013年
7 陶利军;路桥当好企业经济分析师[N];中国工商报;2007年
8 本报记者 巩国强;汛潮的“卖点”[N];山西经济日报;2004年
相关硕士学位论文 前10条
1 夷臻;学生事务数据分析系统的设计与实现[D];苏州大学;2015年
2 李永秋;智能化体检数据分析系统设计与实现[D];山东大学;2014年
3 翟羽佳;莱芜供电公司经营数据分析系统的设计与实现[D];山东大学;2015年
4 张磊磊;高考录取数据分析系统前端界面模块的设计与实现[D];山东大学;2015年
5 韩继军;金卡科技公司业务数据分析系统设计与实现[D];大连理工大学;2015年
6 张志祥;某数据分析系统的设计与实现[D];北京邮电大学;2015年
7 龙少杭;基于Storm的实时大数据分析系统的研究与实现[D];上海交通大学;2015年
8 余梦然;面向商务智能的公共交通数据分析系统的设计与实现[D];西安电子科技大学;2014年
9 张鹏宇;中国联通ERP用户感知业务监控数据分析系统的设计与实现[D];华南理工大学;2015年
10 廖宁平;石化企业数据分析系统的开发及运营管理中的应用[D];浙江工业大学;2014年
,本文编号:1645910
本文链接:https://www.wllwen.com/gongshangguanlilunwen/1645910.html