当前位置:主页 > 经济论文 > 经济管理论文 >

基于XGBoost算法的武汉市二手房价格预测模型的实证研究

发布时间:2020-10-24 15:55
   随着大数据和互联网技术的高速发展,房地产行业的数据越来越多,如何从复杂多样的特征中得到房价的预测模型是非常重要的。本文研究的主要问题是在大量的二手房相关的数据中找出重要的特征指标,对二手房房价建立预测模型。首先根据相关的房价理论,得出影响房价的三类特征,包括区位、建筑结构和邻里环境因素,通过网络爬虫有针对性的获取相对应的特征数据。结合国内外的相关的房价预测模型,选择出了 XGBoost算法。XGBoost算法拥有非常优秀的分类以及回归效果,算法的训练性能也很高,由于底层的原理基于梯度提升树,从而能更好的适应不平衡的数据集,同时也更不容易过拟合,泛化能力较好,在很多非线性的回归问题上也有良好的表现,适用范围很广泛。本文通过网格搜索进行模型的参数优化,最后建立好的模型与LASSO进行了比较,表现出了比较明显的预测优势。
【学位单位】:华中师范大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F299.23
【部分图文】:

技术路线图,技术路线,二手房,销售数据


图1.1技术路线??

程序流程图,程序流程,东西湖区,洪山区


图2.1爬虫程序流程??2.2.3功能实现??本文采集的数据是链家网的武汉市的二手房交易数据,采集的区域包括江岸区、??江汉区、娇口区、东西湖区、武昌区、洪山区、汉阳、东湖高新区等数据量较多的??8个区域。??1.初始UR1??初始的URL是:https://wh.lianjia.com/ershoufang/,其中每个区域的页面需要在??后面追加区域的名称,如https://wh.lianjia.com/ershoufang/jiangan/表示的是江岸区列??表的第1页。??2.各区域的分页数量??

二手房,基础数据,详情,房屋


套如周边一公里内的公交车站、咖啡厅、银行、超市等的数量,最近的地铁站距离,??这些数据通过百度地图的API服务获取;房屋所属地块等级通过武汉市国土局2014??年的规划图获取。??3.1.1基础数据??
【相似文献】

相关期刊论文 前10条

1 凌云;王建东;;浅析4~#高炉的炉缸侵蚀预测模型[J];南钢科技与管理;2007年03期

2 谷鸿秋;王俊峰;章仲恒;周支瑞;;临床预测模型:模型的建立[J];中国循证心血管医学杂志;2019年01期

3 周媛;叶烨;王新彦;周宏根;王筱蓉;;零转弯半径割草机连续翻滚特性参数化预测模型[J];农机化研究;2018年01期

4 刘洪太;郭云霞;;基于情景数据的火灾预测模型设计与实现[J];科技创新与应用;2018年26期

5 王伟卿;;灰色预测模型在预测话音网关故障中的研究与应用[J];计算机测量与控制;2016年11期

6 韩文倩;;灰色预测模型在山东省保费预测中的应用[J];保险职业学院学报;2017年01期

7 杨萌;;基于灰色预测模型的山西省批发零售业人员需求分析[J];数学的实践与认识;2017年04期

8 崔剑;巴合提努尔·巴赞;李书钦;;烧结过程SO_2排放预测模型研究[J];资源节约与环保;2017年08期

9 张春涛;关文忠;刘学飞;;混沌时间序列的2阶预测模型[J];数学的实践与认识;2016年05期

10 夏静;;建设项目环境影响评价预测模型发展现状[J];绿色科技;2016年08期


相关博士学位论文 前10条

1 李金金;天津市慢性病队列研究及风险预测模型的建立[D];天津医科大学;2018年

2 陈玲;孕期及产后压力性尿失禁风险预测模型的构建、验证及应用[D];南方医科大学;2018年

3 云科;MSM人群HIV感染风险预测模型的建立及应用[D];中国医科大学;2018年

4 林开阳;急诊经皮冠状动脉介入术后对比剂肾病的危险因素分析及风险预测模型构建[D];南方医科大学;2018年

5 支元杰;大气环境下小样本金属材料腐蚀的数据驱动预测模型[D];北京科技大学;2019年

6 冉祥栋;基于深度学习的交通时间预测模型与方法研究[D];北京科技大学;2019年

7 胡姗姗;药物互作数据的挖掘与预测研究[D];安徽大学;2019年

8 沈思鹏;基于生存结局的多组学预测模型统计学方法研究与应用[D];南京医科大学;2019年

9 徐丽华;精神病高危综合征转化的风险预测模型与神经生物学标志研究[D];上海交通大学;2017年

10 杭俊杰;胰腺癌预后相关的炎性标志物及预测模型建立[D];上海交通大学;2017年


相关硕士学位论文 前10条

1 杨晨璐;湖北省中老年人骨量异常风险预测模型的研究[D];武汉科技大学;2019年

2 白培翔;基于交通大数据的道路安全行为分析与预测[D];内蒙古大学;2019年

3 王智;空气质量预测模型研究[D];哈尔滨工程大学;2019年

4 李兰茜;基于复杂网络结构的链路预测技术研究[D];北京邮电大学;2019年

5 李敏;基于聚类的风速混合预测模型[D];兰州大学;2019年

6 肖艳杰;轨道交通客流预测模型优化及应用研究[D];武汉理工大学;2018年

7 赖众燿;城市公交到站时间实时预测研究[D];深圳大学;2018年

8 杜冰会;口服叶酸干预高同型半胱氨酸血症疗效的预测模型的建立和评价[D];郑州大学;2019年

9 窦瑞华;大数据环境下预测模型的自动化构建与优化[D];中国石油大学(华东);2017年

10 吴越;大数据环境下的消费者流失预测模型[D];厦门大学;2018年



本文编号:2854671

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2854671.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9c71f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com