网络视频环境中面向用户QoE的分析与应用
本文关键词:网络视频环境中面向用户QoE的分析与应用 出处:《南京邮电大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 用户体验质量 建模预测 决策树 信息增益 快速离散
【摘要】:互联网技术飞速发展的当下,视频多样性服务也大量涌现,用户对于视频质量的需求也随之增长。为了更好地服务用户,提升用户体验,服务商致力于研究各方面指标以改善用户体验质量(QoE)。因此,如何通过调整、权衡各指标来预测QoE成为了当下的研究热点。本文从数据分析、建模预测的角度出发,展开了一系列研究。本文首先进行了数据搜集、数据预处理等前期准备工作,从而获得了大量与视频相关的指标数据。为了对可能影响QoE的因素进行分析,本文进行了数据清洗、离散化、统计分析等工作,从而筛选出合适的影响因素。通过对比多种经典机器学习算法,选取决策树模型对QoE进行建模预测。具体而言,本文的主要研究工作有如下三点:首先,在利用信息增益进行相关性分析时,采用信息增益最大化方法对连续型数据进行离散化处理,并对现有快速离散算法进行改进。通过对含有重复值的特征数据进行重新整合归类,使快速离散算法能适用于任何类型的数据集,提高了离散化的准确率。与此同时将改进快速算法运用到构建树时的二分离散中,加快了建树速度,又达到了与原树相同的预测效果。其次,为了精简C4.5决策树模型,对停止条件进行了改进。通过将模型复杂度与准确率权衡比较,共同决定待分裂子集数据量的最小值,使决策树在保证一定准确率的前提下达到最精简模式。通过实验验证这样改进会使得模型的复杂度、算法耗时大大降低,从而能够适应更庞大的数据量。最后,针对决策树建模过程中的特征选取准则进行了改进。通过引入特征离散度指标,与原始信息增益率指标相结合,综合考虑数据本身的离散程度和分布情况,构建新的选取标准。通过实验证明新的选取标准使得特征选取更为准确,同时可以提高决策树模型的预测准确率。本文最后通过与其他模型进行对比,对改进模型准确率、复杂度、耗时等多方面进行测试,验证了所设计方案的性能以及改进算法在QoE预测准确性方面的提升效果。
[Abstract]:The rapid development of Internet technology at present, the diversity of services is the emergence of a large number of video users, along with growth for video quality requirements. In order to better serve customers, enhance the user experience, the service provider is devoted to the study of the indicators to improve the quality of user experience (QoE). Therefore, how to adjust, to predict the QoE become a research the focus of the present balance each index. This paper from the data analysis, modeling and forecasting perspective, launched a series of research. This paper carried out the data collection, data processing and other preparatory work, to obtain a great deal of data associated with video. In order to analyze the influencing factors of QoE, this paper has carried on the data cleaning, discretization, statistical analysis and so on, so as to select the appropriate factors. By comparing various classic machine learning algorithms, then the decision tree model is used to model QoE Forecast. Specifically, the main research work of this paper has the following three points: first, the correlation analysis based on information gain, the information gain maximization method for discretization of continuous data, and the existing fast discrete algorithm. Based on the characteristics of data containing duplicate values were re classified, the fast discrete algorithm can be applied to any type of data sets, to improve the accuracy of the discretization. At the same time the improved fast algorithm using two discrete to construct the tree, accelerate the speed of tree and predicted the same effect as the original tree. Secondly, in order to streamline the C4.5 decision tree model, to stop the condition was improved. The model complexity and accuracy tradeoffs, jointly determine the minimum amount of data to be split subset, the decision tree to the issued under the premise of ensuring accuracy Reduced complexity model. Experiments show this improvement makes the model, computation time is greatly reduced, which can adapt to a large amount of data. Finally, according to the criterion of feature selection decision tree modeling process was improved. By introducing the characteristics of dispersion index, combined with the original information gain rate index, considering the discrete the extent and distribution of the data itself, the criteria for the selection of new building. Experiments show that the feature selection criterion is more accurate, and can improve the prediction accuracy of the decision tree model. Finally, by comparing with other models, the improved model accuracy, complexity, time and other aspects of the test. To verify the design scheme of the improved algorithm performance and forecasting accuracy improvement in QoE.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 董立岩;李真;周灵艳;;特定信息增益决策森林分类器研究[J];计算机工程与应用;2010年26期
2 孙挺;耿国华;周明全;;基于词出现和信息增益的连续属性离散化方法[J];计算机应用研究;2009年02期
3 熊平;朱天清;顾霄;;基于信息增益比例约束的数据匿名方法及其评估机制[J];计算机应用研究;2014年03期
4 王卫平;王旭哠;陈赫然;陈家耀;;基于信息增益的防火墙过滤域排序优化[J];计算机系统应用;2009年07期
5 张小康;帅建梅;史林;;基于加权信息增益的恶意代码检测方法[J];计算机工程;2010年06期
6 苑春燕;李爱华;;基于信息增益和相关性的贝叶斯分类算法研究[J];网络与信息;2010年02期
7 刘庆和;梁正友;;一种基于信息增益的特征优化选择方法[J];计算机工程与应用;2011年12期
8 杨敬妹;王学军;;文本分类中信息增益算法的改进[J];计算机时代;2013年09期
9 潘若愚,韩晓峰;一种基于信息增益的产品评价系统模型[J];合肥工业大学学报(自然科学版);2003年S1期
10 陶剑文;赵杰煜;姚奇富;;信息增益区分频繁模式分类方法[J];计算机工程与应用;2009年07期
相关会议论文 前3条
1 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
2 刘鹏;雷蕾;张雪凤;;缺失数据处理方法的比较研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
相关硕士学位论文 前5条
1 孙思莹;网络视频环境中面向用户QoE的分析与应用[D];南京邮电大学;2016年
2 黄冬丽;基于信息增益的基因互作挖掘方法研究[D];哈尔滨工业大学;2014年
3 刘一正;基于信息增益的互联网二元关系抽取[D];华东师范大学;2014年
4 周志凯;免疫入侵检测中基于信息增益的检测器生成研究[D];哈尔滨理工大学;2014年
5 黄杨潮;miRNA前体与成熟体预测方法的设计与实现[D];哈尔滨工业大学;2011年
,本文编号:1364736
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1364736.html