基于随机森林回归模型的住房租金预测模型的研究
发布时间:2023-07-27 07:45
随着经济飞速发展和城市化进程推进,商品房价格不断上涨,租房居住的生活方式被越来越多的人所接受。在住房租赁市场中存在着房东和租客信息不对称的问题:一方面,房东不能对出租房屋的租金进行合理准确的评估;另一方面,租客很难找到满足自身居住需求的高性价比房屋,这种信息不对称在一定程度上造成了租房资源的浪费。为解决住房租赁市场这一痛点,及时把控住房租赁市场价格走势,就需要对住房租金进行分析预测,对住房租金预测模型进行研究,以期构建出具有较好预测效果且具有较大实际应用价值的住房租金预测模型。本文采用的数据集为来源于DataCastle平台的住房基本信息数据。在大数据背景下,本文首先对房屋信息数据进行预处理,将其转化成Python语言能够分析和处理的格式化数据,然后针对数据分布及数据的不同统计指标进行分析,进而得出数据本身的统计特性。通过特征工程选择出特征,用来训练和拟合模型。利用特征清洗、特征无量纲化、特征归一化、特征二值化、特征的虚拟变量编码对特征进行处理与构造;利用Python提供的的seaborn和matplotlib包等使数据可视化,绘制相关图,对各个特征进行分析;在进行特征选择的过程中,本...
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 文献综述总结
1.3 研究目标
1.4 研究内容
1.5 研究意义
1.6 论文组织结构
1.7 本章小结
第二章 研究基础
2.1 数据挖掘概述
2.1.1 数据挖掘概念
2.1.2 数据挖掘主要任务
2.1.3 数据挖掘一般过程
2.1.4 数据挖掘算法基本特征
2.2 分类算法
2.2.1 决策树算法
2.2.2 从决策树到随机森林
2.2.3 随机森林算法
2.3 回归模型
2.3.1 简单线性回归模型
2.3.2 岭回归模型
2.3.3 随机森林回归模型
2.3.4 回归模型对比
2.4 本章小结
第三章 基于随机森林回归模型的住房租金预测模型构建
3.1 数据获取与处理
3.1.1 数据获取与准备
3.1.2 数据预处理
3.2 特征工程
3.2.1 特征处理与构造
3.2.2 特征分析
3.2.3 特征选择
3.3 随机森林回归模型的构建
3.4 随机森林回归模型的优化
3.5 本章小结
第四章 实验结果与分析
4.1 实验设定
4.1.1 实验环境
4.1.2 实验数据集
4.1.3 实验评价指标
4.1.4 实验方法
4.2 实验结果分析
4.2.1 结果比较
4.2.2 参数调优
4.3 本章小结
第五章 总结与展望
5.1 回顾与总结
5.2 未来工作展望
参考文献
致谢
本文编号:3837619
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 文献综述总结
1.3 研究目标
1.4 研究内容
1.5 研究意义
1.6 论文组织结构
1.7 本章小结
第二章 研究基础
2.1 数据挖掘概述
2.1.1 数据挖掘概念
2.1.2 数据挖掘主要任务
2.1.3 数据挖掘一般过程
2.1.4 数据挖掘算法基本特征
2.2 分类算法
2.2.1 决策树算法
2.2.2 从决策树到随机森林
2.2.3 随机森林算法
2.3 回归模型
2.3.1 简单线性回归模型
2.3.2 岭回归模型
2.3.3 随机森林回归模型
2.3.4 回归模型对比
2.4 本章小结
第三章 基于随机森林回归模型的住房租金预测模型构建
3.1 数据获取与处理
3.1.1 数据获取与准备
3.1.2 数据预处理
3.2 特征工程
3.2.1 特征处理与构造
3.2.2 特征分析
3.2.3 特征选择
3.3 随机森林回归模型的构建
3.4 随机森林回归模型的优化
3.5 本章小结
第四章 实验结果与分析
4.1 实验设定
4.1.1 实验环境
4.1.2 实验数据集
4.1.3 实验评价指标
4.1.4 实验方法
4.2 实验结果分析
4.2.1 结果比较
4.2.2 参数调优
4.3 本章小结
第五章 总结与展望
5.1 回顾与总结
5.2 未来工作展望
参考文献
致谢
本文编号:3837619
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3837619.html