基于大数据的社交网络数据挖掘
本文选题:大数据 切入点:社交网络 出处:《苏州大学》2015年硕士论文 论文类型:学位论文
【摘要】:万事万物都有联系,人们与社交网络相互联系,与信息,组织,所在地相互联系,只对个体进行研究所获得成果是有限的,所以要对整个系统进行研究,而这个系统就是一个社交网络。社交网络分析由图论,数学以及社会学中的社交网络理论发展而来,在最近的这10-15年中,网络分析还借助计算机科学,物理学,生物学和经济学等不同领域的发展。与常规的网络数据分析相比,基于社交网络的数据分析,分析对象非常明确,分析的形式多种多样,分析的方法和内容更多。若将常规的分析方法应用到社交网络数据分析中,我们会发现分析的结果达不到我们的预期效果。就当前的数据分析方法、数据模型和社交网络数据,本文从数据的获取、数据的清洗加工、数据模型应用并在应用过程中对模型进行优化,形成的数据分析结果如何为管理者进行决策进行了一系列的研究。本文先从斯坦福大学的Stanford Large Network Dataset Collection中下载Amazon networks数据,探讨了从抓取数据、清洗数据、预处理数据、探索数据、选择合适的算法、建立相关模型到最终分析评估的全过程。先用Python对预处理数据,导入数据库,并用Clementine 12.0分析其中客户购买产品后评价的有效性,并评估此评价是否会对其他客户购买该产品产生影响,采用数据挖掘技术可挖掘出数据背后的信息。数据挖掘中的聚类分析是将相似度较高的用户聚成一个类,然后再进行数据分析。本文对客户评价的次数,评价的时间,评价的频次,评价的得分进行聚类分析,最后对分析过程中运用的两种聚类方法取得的结果进行比较,构建客户分级体系。通过分析结果可对当前亚马逊的购买客户进行分级维护,对于最有价值客户需要给予重点关注,将社交网络大数据与微营销结合起来,提升亚马逊的销售业绩和影响力,从原先的单一购物商城模式,发展成为综合电商平台,并培育自己的客户群。
[Abstract]:Everything is connected, people are connected to social networks, they are connected to information, organizations, locations, and the results of individual research are limited, so we have to study the system as a whole. And this system is a social network. Social network analysis has evolved from graph theory, mathematics, and sociological social network theory, and in the last 10-15 years, network analysis has also relied on computer science, physics. Development in different fields, such as biology and economics. Compared with conventional network data analysis, social network-based data analysis has very clear objects and many forms of analysis. If we apply the conventional analysis method to the social network data analysis, we will find that the results of the analysis are not as good as we expected. For the current data analysis method, the data model and the social network data, In this paper, the data acquisition, data cleaning and processing, data model application and optimization of the model in the application process, The result of data analysis makes a series of researches on how to make decisions for managers. Firstly, this paper downloads Amazon networks data from Stanford Large Network Dataset Collection of Stanford University, discusses how to capture data, clean data, preprocess data and explore data. Select the appropriate algorithm, establish the relevant model to the whole process of final analysis and evaluation. First, use Python to pre-process the data, import the database, and use Clementine 12.0 to analyze the validity of the evaluation after the customer buys the product. And evaluate whether this evaluation will affect other customers to buy the product, the data mining technology can be used to mine the information behind the data. The clustering analysis in data mining is to cluster the users with high similarity into a class. Then the data are analyzed. The paper makes cluster analysis on the frequency, time, frequency and score of customer evaluation. Finally, it compares the results obtained by the two clustering methods used in the process of analysis. Build a customer rating system. Through the analysis of the results of the current Amazon customers can be graded maintenance, for the most valuable customers need to give priority attention, the social network big data and micro-marketing combined, To boost Amazon's sales and influence from the original single shopping mall model to an integrated ecommerce platform and to nurture its own customer base.
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期
3 刘明晶;数据挖掘[J];华南金融电脑;2001年04期
4 张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期
5 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
6 朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期
7 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
8 李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期
9 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
10 ;2002数据挖掘研讨班[J];计算机工程;2002年06期
相关会议论文 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
相关重要报纸文章 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
相关博士学位论文 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
8 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年
9 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
10 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
相关硕士学位论文 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
,本文编号:1581123
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/1581123.html