面向三类应用数据的智能分析与优化研究
本文关键词: 大数据 发电调度 用户特征预测 输入系统 轨迹识别 出处:《中国科学技术大学》2016年博士论文 论文类型:学位论文
【摘要】:大数据时代已经到来。数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的分析、优化及运用,预示着新一波生产率增长和消费者盈余浪潮的到来。手机、平板电脑、PC机、移动互联网、物联网、云计算、车联网以及遍布地球各个角落的各种各样的传感器,无一不是数据来源。基于大数据的应用如雨后春笋般出现,例如个性化商品推荐、足球胜负预测、电力大数据相关应用等。怎样分析出数据中的价值,怎样优化关键技术以提高现有应用的体验是近年大数据研究的发展趋势。然而面对不同类型的数据和日渐复杂的应用场景,数据分析与优化工作会面临很多不同的挑战。例如数据采集、数据整理和存储等常规问题;某些数据分析方法计算复杂度大、求解困难等问题;相同的处理方法在不同应用场景、不同分布的训练数据上得到的结果有时也很不相同。针对以上数据分析时所面临的问题,本文对三类应用数据做了智能分析与优化研究,具体做了以下几点研究工作:1.构建面向电力数据的发电优化调度算法传统的发电调度对于机组新产生的数据反馈较慢,不具备灵活性。决策由人的经验完成,没有充分利用历史数据,缺乏客观科学性。2014年初,安徽省已完成对发电机组污染物排放数据的实时采集工作,基于这些数据完善一个优化的、轻量级的发电调度方案势在必行。本工作对发电机组历史数据中的发电功率与污染物排放量进行回归分析,拟合出每台机组发电功率与排放数据回归模型,在此基础上设计优化调度算法使所有发电机组总污染物排放量降低。2.建立面向电商数据的用户特征预测模型在个性化搜索和推荐系统等应用中,完整的入口学信息特征是应用具有良好性能的前提条件。但是这些理想的数据集很少出现在实际的应用场景中,主要特征的缺失(如年龄、性别等)使这些应用无法正常工作。在本工作中设计了一个预测模型来解决时间依赖的人口学特征预测的问题。该方案的关键点在于利用时间回溯方法来将用户历史行为的内在时间关联考虑在内,然后搜集数据来训练分类器,使用户的历史行为与其人口学特征对应。3.提出一种面向空间磁感数据的字符识别方法设计了一个细粒度的字母输入系统Magemitet,该系统利用设备周围空间作为有限输入区域的扩展,用户以使用一个永磁铁在设备周围书写的方式来与该设备通话。Magemite的关键点在于集成在智能设备中的磁性传感器能够感知设备周围的磁场强度变化。不同于以往的磁感解决方案只能识别粗粒度的手势,Magemite能够识别用户细粒度的输入,例如英文字母。然而用户不同的书写模式会影响识别的精度。为了应对这个挑战,首先对输入的轨迹做了预处理,并提取了不同的特征来独特地刻画用户的输入,然后使用这些特征向量来训练字母识别模型。最终实验结果表明:在发电优化调度工作中拟合的发电功率与排放数据回归模型达到了97.02%的平均准确度,在10台机组上的实验表明本文的优化调度算法能使机组总污染物排放量降低4%,达到节能减排的目的;通过预测用户幼儿年龄的实验来验证用户特征预测模型的效果,在一大型电子商务平台的真实数据集下,我们的算法在各个年龄段上的表现更加均衡,并且在预测幼儿年龄时能达到78.2%的准确率;Magemite能识别用户细粒度的轨迹输入,在不同情景下的实验显示,Magemite能达到高于85%的平均识别准确率。
[Abstract]:This paper analyzes and optimizes three kinds of application data , such as data collection , data collection and storage , etc . The key points of this project are to use time - tracing method to consider the intrinsic time of the user ' s historical behavior , then gather data to train the classifier , so that the historical behavior of the user is correspondent to the demographic characteristics . The results show that the optimal scheduling algorithm can reduce the total pollutant discharge of the unit by 4 % and achieve the goal of energy saving and emission reduction . The results show that the optimal scheduling algorithm can reduce the total pollutant discharge of the unit by 4 % and reach the accuracy rate of 78.2 % when the child ' s age is predicted .
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 郭莹;;数据空间关键问题探究[J];软件导刊;2012年07期
2 厉剑;张绍雄;刘俊杰;李成柱;;大数据引发信息时代新变革[J];大众科技;2013年12期
3 李斌;;大数据及其发展趋势研究[J];广西教育;2013年35期
4 张晓军;孟祥武;;数字化周期[J];计算机科学;2002年05期
5 崔晨;吴扬扬;;基于活动的数据空间数据关系发现[J];微型机与应用;2011年11期
6 贾云得;;微型数字存贮遥测装置数据预存贮方法[J];遥测遥控;1989年06期
7 靳小龙;王元卓;程学旗;;大数据的研究体系与现状[J];信息通信技术;2013年06期
8 朝乐门;;数据空间及其信息资源管理视角研究[J];情报理论与实践;2013年11期
9 黄一凡;;合并分区 数据无损有妙招[J];电脑爱好者;2011年23期
10 葛敬军;胡长军;刘歆;李扬;刘震宇;;面向领域科学数据的虚拟数据空间共享模型[J];小型微型计算机系统;2014年03期
相关会议论文 前5条
1 李鸿奎;陈洪艳;;大连市房地产基础地理信息系统的设计和建设[A];中国地理信息系统协会第九届年会论文集[C];2005年
2 董彦磊;申德荣;寇月;聂铁铮;;数据空间中数据组织模型以及关联关系发现模型的研究[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 庞怡;许洪光;张志敏;;针对海量科技信息的存储研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
4 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年
5 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年
相关重要报纸文章 前6条
1 牛泽亚;用户如何在数据空间里“被遗忘”?[N];人民邮电;2014年
2 风格;指引大数据未来发展方向的九大真理[N];中华读书报;2013年
3 录音整理 本报记者 刘文强 杨丰源;创新驱动,,奋力奔向大数据时代[N];贵阳日报;2014年
4 中国人民大学信息学院 李玉坤;云计算与数据空间[N];中国计算机报;2008年
5 整理 本报记者 苏丹丹;把握大数据机遇 推动文化产业跨越发展[N];中国文化报;2013年
6 安徽国税局 赵为民;税务综合数据平台的设想[N];计算机世界;2007年
相关博士学位论文 前10条
1 李晓娜;面向SaaS应用的多租户数据放置机制研究[D];山东大学;2015年
2 张德兵;基于机器学习的数据补全、标注和检索若干问题研究[D];浙江大学;2015年
3 刘思彤;空间文本数据的查询处理技术研究[D];清华大学;2015年
4 侯振隆;重力全张量梯度数据的并行反演算法研究及应用[D];吉林大学;2016年
5 柯余洋;面向三类应用数据的智能分析与优化研究[D];中国科学技术大学;2016年
6 姜朔;数据空间中数据集成若干关键问题研究[D];东华大学;2014年
7 陈鹏;面向情景感知计算的时空数据管理、查询、分析与相关算法研究[D];华东师范大学;2013年
8 杨丹;数据空间中基于语义的实体搜索关键技术研究[D];东北大学;2012年
9 王晓蕊;华北克拉通地球化学科学数据的管理及应用研究[D];中国地质大学;2008年
10 张晓东;数字河口平台建设关键技术研究[D];中国海洋大学;2009年
相关硕士学位论文 前10条
1 权西瑞;云环境下数据版权保护方法的研究[D];西安建筑科技大学;2015年
2 向兵;中药颗粒调剂设备中辅助硬件及自动封口机的设计[D];东北师范大学;2015年
3 朱跃龙;公安情报自动分类系统的设计与实现[D];电子科技大学;2015年
4 张鹏远;大数据分类存储及检索方法研究[D];西安电子科技大学;2014年
5 王梦佳;DOA下数据注册方法的初步研究与实现[D];成都理工大学;2015年
6 陈启伟;电机状态云监测系统研究与实现[D];浙江大学;2016年
7 王照清;大数据环境下数据查询优化技术应用研究[D];北方工业大学;2016年
8 贾振美;面向稀疏轨迹数据的位置预测方法研究[D];东北大学;2014年
9 雷德龙;矢量空间数据云存储与马尔可夫并行聚类算法研究[D];福州大学;2014年
10 王甜甜;国家地理大数据战略平台研究[D];中共中央党校;2016年
本文编号:1521081
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1521081.html