当前位置:主页 > 科技论文 > 软件论文 >

机器学习在影视大数据分析中的研究及应用

发布时间:2019-03-26 21:27
【摘要】:影视产业作为我国国民经济体系中新的突破口,广受影视市场主导人员、电台运营商、各大视频网站运营机构以及一些科研学者的关注。面对大数据时代的到来,影视行业的数据存储、处理和分析等多个方面也面临着巨大的挑战,传统的数据存储模式、数据处理方法和数据分析技术将无法满足拥有海量数据的应用需求。随着数理统计理论及人工智能等诸多领域的不断发展,基于机器学习的理论体系逐渐构建起来,人们试图应用机器学习方法去对海量数据进行处理分析,以期从中提取出有用的知识和信息。因此,研究如何运用机器学习方法从海量影视大数据中挖掘出数据背后隐藏的特征和波动趋势,是具有重大的现实指导意义的。本文主要是利用机器学习方法来对影视大数据进行处理与分析,同时结合智能影视大数据分析系统对海量的电视剧收视相关数据先后进行预处理、特征降维、图表分析与收视预测,其增加了数据处理的效率和收视预测的准确性。因此,通过机器学习方法来解决影视大数据场景中的问题具有重要的意义,其给予了研究人员有效的应用思路,也为影视企业赢取最终市场并获得更高收视率创造了可能。本文的主要工作如下:[1]基于K-Means聚类算法对高维影视数据进行预处理。其针对筛选出的电视剧样本数据进行属性选择、数据聚集和数据规范化,最后利用K-Means算法对数据进行补全操作。[2]基于因子分析法对高维影视数据进行降维处理。其针对高冗余、高维度的电视剧特征数据,运用因子分析法来获得低维的冗余性小的影响因子作为降维后的特征向量。[3]基于SVM算法和AdaBoost-BP算法对电视剧收视水平和收视率进行分类与预测。其使用降维后的电视剧特征数据,运用SVM算法和AdaBoost-BP算法来建立收视预测模型。之后对相关数据进行预测分析。最后对比分析预测效果,总结出更具有效性的预测算法。[4]基于智能影视大数据分析系统对收视进行分析与展示。其针对处理后的电视剧收视相关数据,多层次多角度地进行图表关联分析与直观展示,并把文中提出的预测模型运用到影视大数据收视预测中,验证了其有效性。
[Abstract]:As a new breakthrough in China's national economic system, the film and television industry is widely concerned by the leading personnel in the film and television market, radio operators, major video website operators and some scientific researchers. In the face of the arrival of big data's era, the film and television industry's data storage, processing and analysis are also facing enormous challenges, traditional data storage mode, Data processing methods and data analysis techniques will not meet the needs of applications with huge amounts of data. With the development of mathematical statistics theory and artificial intelligence and many other fields, the theoretical system based on machine learning is gradually constructed, and people try to use machine learning method to process and analyze massive data. In order to extract useful knowledge and information from it. Therefore, it is of great practical significance to study how to use the machine learning method to dig out the hidden features and fluctuating trends behind the data from the massive film and television big data. This article mainly uses the machine learning method to process and analyze the film and television big data, at the same time combines the intelligent film and television big data analysis system to pre-process the massive TV series ratings related data successively, and reduces the feature dimension. Chart analysis and ratings prediction increase the efficiency of data processing and the accuracy of ratings prediction. Therefore, it is of great significance to solve the problems in the film and television big data scene by means of machine learning, which gives researchers effective application ideas and creates the possibility for film and television enterprises to win the final market and obtain higher ratings. The main work of this paper is as follows: [1] pre-processing high-dimensional video data based on K-Means clustering algorithm. According to the selected TV series sample data for attribute selection, data aggregation and data normalization, finally using the K-Means algorithm to complete the data. [2] based on factor analysis for high-dimensional film and television data dimensionality reduction. For highly redundant, high-dimensional TV feature data, The factor analysis method is used to obtain the lower dimension redundancy factor as the feature vector after dimension reduction. [3] based on SVM algorithm and AdaBoost-BP algorithm, the ratings and ratings of TV series are classified and predicted. It uses the reduced dimension TV series feature data, uses the SVM algorithm and the AdaBoost-BP algorithm to establish the ratings prediction model. Then the related data are predicted and analyzed. Finally, the prediction results are compared and the more effective prediction algorithms are summarized. [4] based on the intelligent film and television big data analysis system, the analysis and display of the ratings are carried out. According to the related data of TV series after processing, multi-level and multi-angle graph correlation analysis and visual display are carried out, and the prediction model proposed in this paper is applied to the movie and television big data ratings prediction to verify its effectiveness.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181;TP311.13

【参考文献】

相关期刊论文 前10条

1 张文;;大数据分析对中国影视业运营的意义[J];新闻世界;2015年04期

2 王贺;胡志坚;张翌晖;李晨;杨楠;王战胜;;基于聚类经验模态分解和最小二乘支持向量机的短期风速组合预测[J];电工技术学报;2014年04期

3 曹莹;苗启广;刘家辰;高琳;;AdaBoost算法研究进展与展望[J];自动化学报;2013年06期

4 胡海青;张琅;张道宏;;供应链金融视角下的中小企业信用风险评估研究——基于SVM与BP神经网络的比较研究[J];管理评论;2012年11期

5 吴俊利;张步涵;王魁;;基于Adaboost的BP神经网络改进算法在短期风速预测中的应用[J];电网技术;2012年09期

6 徐雯;高建华;;基于Spring MVC及MyBatis的Web应用框架研究[J];微型电脑应用;2012年07期

7 柳玉;郭虎全;;基于AdaBoost与BP神经网络的风速预测研究[J];电网与清洁能源;2012年02期

8 师洪涛;杨静玲;丁茂生;王金梅;;基于小波—BP神经网络的短期风电功率预测方法[J];电力系统自动化;2011年16期

9 陈盼;陈皓勇;叶荣;陈天恩;李丹;;基于小波包和支持向量回归的风速预测[J];电网技术;2011年05期

10 宁连举;李萌;;基于因子分析法构建大中型工业企业技术创新能力评价模型[J];科研管理;2011年03期

相关会议论文 前1条

1 陈红丽;张国成;万磊;;预测控制中的建模方法综述[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

相关博士学位论文 前6条

1 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年

2 朱林;基于特征加权与特征选择的数据挖掘算法研究[D];上海交通大学;2013年

3 彭柳青;高维高噪声数据聚类中关键问题研究[D];西安电子科技大学;2011年

4 蒋胜利;高维数据的特征选择与特征提取研究[D];西安电子科技大学;2011年

5 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年

6 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年

相关硕士学位论文 前8条

1 江帆;基于因子分析法的区域物流竞争力研究[D];南京大学;2013年

2 康永为;大数据环境下高维数据处理若干问题[D];广西师范大学;2013年

3 王颖;基于神经网络的数据挖掘方法的研究和应用[D];中国地质大学(北京);2012年

4 崔丹丹;K-Means聚类算法的研究与改进[D];安徽大学;2012年

5 任天峰;影响电视剧受众收视行为的需求因素分析[D];东华大学;2007年

6 周正林;基于人工神经网络交通流量预测模型的研究[D];哈尔滨工程大学;2007年

7 关大伟;数据挖掘中的数据预处理[D];吉林大学;2006年

8 李晓明;k-means类型变量加权聚类算法的研究与实现[D];哈尔滨工业大学;2006年



本文编号:2447947

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2447947.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e3386***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com