当前位置:主页 > 管理论文 > 营销论文 >

面向社交商务的大数据分析方法研究

发布时间:2018-03-14 14:01

  本文选题:社交商务 切入点:大数据 出处:《东南大学》2015年硕士论文 论文类型:学位论文


【摘要】:随着大数据时代的来临,面向海量、异构和非结构化数据的分析技术得到越来越广泛的应用。社交商务作为一种新兴的电子商务模式,其融合了社交媒体的社交互动功能与电子商务的商务功能,并且已经成为重要的大数据来源,其蕴含的大量非结构化数据,尤其是文本数据具有极大的商业价值。在这些复杂的文本数据当中隐含着用户的喜好偏向、行为习惯、消费倾向等,对这些文本数据的分析可以很好地为社交商务中的社交购物和社交营销服务。在这种背景下,面向社交商务的大数据分析显得迫切和必要,本文围绕社交商务中的文本数据进行大数据分析。首先,分析了社交商务环境下商务数据的复杂性,其社交商务数据具有典型的大数据特征,并且对社交商务中的非结构化数据进行了分析,重点讨论了社交商务环境下的数据管理以及中文文本数据挖掘过程的复杂性,给出了中文文本数据挖掘的流程。其次,提出了利用Apriori算法抽取产品特征的方法,并应用于社交购物中的产品评论情感分析。在社交商务领域,众多的用户对众多的产品进行了纷繁复杂地评论,这些评论是非结构化的文本数据,复杂的非结构化特征使得用户在查看评论时遇到了很大的困难。基于此,对社交商务环境下的产品评论进行情感挖掘,提出一种利用Apriori算法来挖掘产品的频繁特征,并讨论如何对频繁特征进行剪枝操作以提高抽取的特征的有效性,利用语义词典HowNet来确定情感词的情感倾向。最后,提出了识别电商微博数据进行热点话题的EM-LDA综合模型。电商微博是一种非结构化的文本信息载体,但却具备不同于其他非结构化文本信息的特点,通过对电商微博的分析,提出了一种面向电商微博的EM-LDA综合模型。首先对电商微博依据是否含有哈希标签进行分类,将含有哈希标签的微博称为显式话题微博,并用ET-LDA模型进行主题挖掘;对于不含哈希标签的微博,称为隐式话题微博,通过细分此类微博的类型来改进LDA模型,提出IT-LDA模型。
[Abstract]:With the advent of big data era, the analysis technology of mass, heterogeneous and unstructured data has been applied more and more widely. It combines the social interaction function of social media with the business function of electronic commerce, and has become an important source of big data, which contains a lot of unstructured data. In particular, text data has great commercial value. In these complex text data, there are user preferences, behavior habits, consumption tendencies and so on. The analysis of these text data can be a good service for social shopping and marketing in social commerce. Against this background, big data's analysis for social commerce is urgent and necessary. This paper analyzes the text data of social commerce by big data. Firstly, it analyzes the complexity of business data in social commerce environment. The unstructured data in social commerce is analyzed, and the complexity of data management and Chinese text data mining in social commerce environment is discussed. Secondly, the process of Chinese text data mining is given. This paper proposes a method of extracting product features by using Apriori algorithm, and applies it to the analysis of product reviews in social shopping. In the field of social commerce, many users comment on many products. These comments are unstructured text data, and complex unstructured features make it difficult for users to view comments. This paper proposes a method of mining frequent features of products by using Apriori algorithm, discusses how to prune frequent features to improve the validity of extracted features, and uses semantic dictionary HowNet to determine the affective tendency of affective words. This paper presents an EM-LDA synthesis model for identifying hot topics from Weibo data, which is an unstructured text information carrier, but different from other unstructured text information. In this paper, a comprehensive EM-LDA model for e-commerce Weibo is proposed. First, according to whether the hashtag is included or not, Weibo is classified as an explicit topic, then the topic mining is carried out with ET-LDA model. For Weibo without hashtag, it is called the implicit topic Weibo. By subdividing the types of this kind of IT-LDA, the LDA model is improved and the IT-LDA model is put forward.
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 艾孜尔古丽;李晓;玉素甫·艾白都拉;;中小学维吾尔语文教材用词数据分析方法研究[J];计算机工程与应用;2014年03期

2 韩玲;胡学钢;李建国;冯崇岭;;基于数据分析方法的属性简约算法的实现[J];电脑知识与技术(学术交流);2007年06期

3 应里孟;;数据式审计常用的数据分析方法[J];中国农业会计;2011年09期

4 章婷;石坚;沈森祖;;标准样片制备的测量数据分析方法研究[J];计算机与数字工程;2010年09期

5 栾世武;数据挖掘给企业应用带来什么?[J];微电脑世界;2000年23期

6 陈方樱;关于数据分析方法及SAS软件教学的探索[J];数学的实践与认识;2004年01期

7 陈涛;;SQL数据分析方法在医疗收费检查中的应用[J];中国价格监督检查;2011年12期

8 戴征宇,李广生;DSAM的数据分析方法研究──峰形分析法[J];中国原子能科学研究院年报;1994年00期

9 吴大岳;谢福鼎;;一种X线征象的智能数据分析方法[J];计算机工程与应用;2007年28期

10 龚峻;;运用关系型数据分析方法规划企业级IT系统模型[J];电信技术;2010年04期

相关会议论文 前3条

1 刘红云;张雷;骆方;;多元追踪数据分析方法新进展与应用[A];全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集[C];2008年

2 吴志清;;浅议实验室对比数据分析方法——稳健统计Z比分数[A];2011(昆明)中西部第四届有色金属工业发展论坛论文集[C];2011年

3 张宁;陈红;;基于ParaWare MOLAP系统的PSC智能数据分析方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

相关博士学位论文 前5条

1 蔡伟达;证候研究中常用数据分析方法的文献研究及基于隐类模型的抑郁症隐变量分析[D];北京中医药大学;2015年

2 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年

3 相洁;启发式问题解决认知神经机制及fMRI数据分析方法研究[D];太原理工大学;2010年

4 胡宇;函数型数据分析方法研究及其应用[D];东北师范大学;2011年

5 蒋红卫;一种新的多向数据分析方法—多重双线性分解及运用初步[D];第二军医大学;2010年

相关硕士学位论文 前6条

1 尹海峰;面向LTE移动网络KPI数据分析方法的研究[D];西安电子科技大学;2014年

2 伍万坤;面向社交商务的大数据分析方法研究[D];东南大学;2015年

3 邓春瑶;哈尔滨市居民公交IC卡数据分析方法研究[D];东北林业大学;2013年

4 赵金鑫;基于MapReduce的无线网优平台数据分析方法[D];北京邮电大学;2015年

5 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年

6 杨s,

本文编号:1611517


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/1611517.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户04b4c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com