基于Stacking理论的北京二手房交易价格预测研究
发布时间:2021-05-21 18:21
随着我国经济快速发展和城市化的不断推进,我国房地产市场一片欣欣向荣,人们对房地产信息的关注度也越来越高了,然而在城市可供开发的土地越来越少,二手房的交易市场已经逐渐成了房地产交易中的重要角色,快速精确的对二手房估价的需求也变得越来越大,快速对房价做出预估,可以让政府通过制定精准的调控政策并监督中介市场,可以让中介紧跟房地产行业的发展趋势,规范化自身服务,可以让购房者根据预估结果作为参考,避免中介欺诈买家等问题。我国在房地产估价采用的方法一般包括市场法、收益法、成本法,其中市场法应用最为广泛。然而运用市场法和评估者的经验有很大关系,且受主观评估者主观因素影响,近年来,国内学者为了改善市场法的不足采用统计建模的方式进行房价预测,本文通过引入Stacking算法建立模型对二手房房价进行评估。本文通过网络爬虫抓取北京市链家网二手房网站2万余条二手房信息,其特征包括二手房的房屋户型、套内面积等33个特征,经过数据探索、数据清洗、数据变换,数据降维等过程建立了较优的指标体系,并构建了基于Stacking理论的北京二手房交易价格预测的模型,通过网格搜索调整参数对模型进行优化,最后采用五折交叉验证的方法,将SVR算法、GBDT回归算法、随机森林回归算法、多层感知机回归算法以及将将这四种算法融合的Stacking算法进行对比研究,最后通过实证得出Stacking算法比单个算法具有预测模型稳定性好、预测误差小的等优点,值得在房地产价格预估行业中推广和应用。
【学位授予单位】:辽宁科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F299.23;TP18
本文编号:2732826
【学位授予单位】:辽宁科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F299.23;TP18
文章目录
中文摘要
ABSTRACT
1.绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 房地产评估的发展概述
1.2.2 Stacking算法的应用现状
1.3 本文工作
1.4 论文框架
2.相关理论介绍
2.1 机器学习
2.2 数据预处理
2.2.1 缺失值处理
2.2.2 异常值处理
2.2.3 数据归一化处理
2.2.4 特征选择
2.2.5 特征降维
2.3 集成学习
2.3.1 Boosting算法
2.3.2 Bagging算法
2.3.3 Stacking框架
2.4 本章小结
3.北京二手房房价预测模型构建
3.1 基学习器的选取和介绍
3.1.1 GBDT算法
3.1.2 随机森林算法
3.1.3 SVR算法
3.1.4 人工神经网络算法
3.2 基于Stacking的二手房房价预测模型
3.2.1 Stacking方法简介
3.2.2 Stacking模型融合
3.3 本章小结
4.构建指标体系
4.1 数据的背景
4.2 数据的爬取
4.2.1 网络爬虫
4.2.2 爬虫框架Scrapy
4.2.3 链家数据的获取
4.3 数据探索与预处理
4.3.1 数据的基本统计
4.3.2 缺失值处理
4.3.3 异常值处理
4.3.4 数据分析和数据编码
4.4 数据归一化
4.5 特征选择和降维处理
4.5.1 特征选择
4.5.2 降维处理
4.6 本章小结
5.实验分析
5.1 模型检验方法
5.1.1 交叉验证
5.1.2 模型评价指标
5.2 机器学习模型的参数优化
5.2.1 机器学习模型的参数
5.2.2 常用的模型调参方法
5.3 仿真实验
5.3.1 支持向量机回归(SVR)
5.3.2 梯度提升决策树(GDBT)
5.3.3 随机森林(Random forest)
5.3.4 神经网络(MLPRegressor)
5.3.5 模型融合(Stacking)
5.4 实验结果分析
5.4.1 不同模型结果比较
5.4.2 Stacking算法预测结果分析
5.5 模型的稳定性
5.6 本章小结
6.结论与展望
6.1 全文总结
6.2 策略建议
6.3 研究不足及展望
参考文献
致谢
作者简介
【参考文献】
相关期刊论文 前2条
1 韦艳艳;李陶深;刘美玲;;融合DECORATE的异构分类器集成算法[J];计算机应用研究;2012年11期
2 胡六星;吴结飞;;基于灰色系统理论的两种房价预测方法比较[J];统计与决策;2010年07期
相关硕士学位论文 前5条
1 时文静;基于Lasso与数据挖掘方法的影响北京二手房价格的因素分析[D];北京工业大学;2017年
2 王灿强;基于异常值处理的随机森林和kNN模型在EEG数据中的应用[D];兰州大学;2017年
3 陈文;中文短文本跨领域情感分类算法研究[D];重庆大学;2016年
4 马忠臣;集成剪枝评估准则及PS-ELMs模型在时间序列预测中的应用研究[D];南京航空航天大学;2014年
5 岳学杰;房地产估价理论实践研究[D];郑州大学;2007年
本文编号:2732826
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/2732826.html