基于半监督集成剪枝算法的细粒度城市空气质量估计
本文关键词:基于半监督集成剪枝算法的细粒度城市空气质量估计,,由笔耕文化传播整理发布。
【摘要】:大气污染会对人类身体健康和生态系统产生不好的影响,如果人们可以掌握空间上细粒度的空气质量信息,就可以避免因在雾霾天气进行户外活动而影响身体健康。但是,由于监测站的数量往往是有限的,空间上细粒度的空气质量估计具有一定的挑战。本文提出一种空间上细粒度的城市空气质量估计方法。一方面,因为空气质量受到多种因素共同影响,如工厂废气、汽车尾气等,该方法基于多种数据开展空气质量估计,如交通、路网结构、兴趣点、社交网络的签到数据等。另一方面,稀疏的监测站导致有标注样本的数量是有限的,该方法采用改进的基于集成学习的半监督算法(Semi-EP)建立各种数据与城市空气质量之间的关系。Semi-EP首先基于有标注样本集训练多个分类器,然后这些分类器会在迭代式的协同训练过程中被重新训练。最后再应用集成剪枝技术搜索具有较大多样性的分类器组合子集。本文基于杭州市的数据集进行了大量实验,实验结果表明本文提出的方法的有效性。
【关键词】:空气质量估计 城市计算 数据挖掘 半监督学习 集成学习
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:X831
【目录】:
- 摘要5-6
- Abstract6-11
- 绪论11-17
- 1.1 研究背景及意义11-12
- 1.2 研究现状及存在问题12-15
- 1.3 研究目标和内容15
- 1.4 本文结构组织15-16
- 1.5 本章小结16-17
- 第2章 相关方法和技术17-29
- 2.1 集成学习17-20
- 2.2 半监督学习20-24
- 2.2.1 标准协同训练(Co-Training)20-22
- 2.2.2 Tri-Training22-24
- 2.3 k近邻24-25
- 2.4 条件随机场25-26
- 2.5 空气质量分指数26-28
- 2.6 本章小结28-29
- 第3章 基于城市大数据的空气质量估计方法29-39
- 3.1 网格划分29
- 3.2 框架29-32
- 3.3 特征提取32-38
- 3.3.1 交通相关特征(F_t)32-33
- 3.3.2 签到相关特征(F_c)33-35
- 3.3.3 兴趣点相关特征(F_p)35
- 3.3.4 路网结构相关特征(F_r)35-36
- 3.3.5 近邻监测站相关特征(F_g)36-38
- 3.4 本章小结38-39
- 第4章 基于集成学习和集成剪枝的半监督学习39-47
- 4.1 基于集成学习的半监督学习39-44
- 4.1.1 置信度度量41-43
- 4.1.2 过滤筛选43-44
- 4.2 基于Pareto遗传算法的集成剪枝44-46
- 4.3 本章小结46-47
- 第5章 实验评估47-60
- 5.1 数据集47-48
- 5.2 实验设置48-49
- 5.3 实验结果与分析49-59
- 5.3.1 特征评估49-50
- 5.3.2 k近邻查找VS随机选择策略50-53
- 5.3.3 基分类器的选择53-54
- 5.3.4 组合分类器大小的影响54-55
- 5.3.5 添加的伪标注样本数量的影响55-56
- 5.3.6 与其他分类方法的比较56-59
- 5.4 本章小结59-60
- 第6章 总结与展望60-62
- 6.1 总结60-61
- 6.2 展望61-62
- 参考文献62-66
- 攻读硕士学位期间主要的研究成果66-67
- 致谢67
【相似文献】
中国期刊全文数据库 前4条
1 谭光华,袁廉灼;从Na_2WO_4溶液制取中、细粒度WO_3[J];稀有金属;1989年05期
2 任晓婷;孙忠祥;曹一林;;细粒度ε-CL-20的制备及钝化[J];火炸药学报;2011年04期
3 李涛;刘明耀;闫宁;;超细粒度砂轮制备技术研究现状[J];金刚石与磨料磨具工程;2013年02期
4 ;[J];;年期
中国重要会议论文全文数据库 前5条
1 叶蕴芳;杨榆;罗鑫;徐国爱;;Appfuse系统中细粒度权限控制的研究与实现[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 江伟玉;高能;刘泽艺;林雪燕;;一种云计算中的多重身份认证与授权方案[A];第27次全国计算机安全学术交流会论文集[C];2012年
3 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
4 李俊青;谢圣献;刘广亮;陈晨;;P2P网络基于蚁群优化的动态细粒度访问控制框架[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国重要报纸全文数据库 前2条
1 赵晓涛;巡展中的三大热门[N];网络世界;2007年
2 乐天邋编译;编织一张更好的Web[N];计算机世界;2007年
中国博士学位论文全文数据库 前3条
1 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年
2 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
3 余a\;基于Simulink模型的细粒度多线程技术研究[D];浙江大学;2014年
中国硕士学位论文全文数据库 前10条
1 赵黎光;基于依存句法的句子级细粒度情感计算[D];华南理工大学;2015年
2 李星宇;一种细粒度Cloud-RAN框架与关键技术研究[D];电子科技大学;2014年
3 郦丽珍;基于Open vSwitch虚拟网络的细粒度访问控制[D];复旦大学;2013年
4 姚亮;数据访问控制中基于中间代理的用户撤销方法[D];西安电子科技大学;2014年
5 占文平;面向产品评论的情感分析技术研究[D];浙江工商大学;2015年
6 楼弘;基于深度神经网络的传感器覆盖细粒度优化研究[D];浙江工业大学;2015年
7 蔡雅雅;基于半监督集成剪枝算法的细粒度城市空气质量估计[D];浙江大学;2016年
8 何东梅;细粒度物体分类算法研究与实现[D];北京交通大学;2016年
9 张s
本文编号:433981
本文链接:https://www.wllwen.com/shengtaihuanjingbaohulunwen/433981.html