当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习模型的深圳市住房租金研究

发布时间:2023-01-12 18:03
  随着我国城镇化进程的推进,商品房价格不断上涨,特别是“北上广深”这些一线城市的房价更是让人望而却步。为了解决住房问题,租房居住成为了越来越多人的选择。然而我国目前的住房市场以买卖为主,租赁市场还没得到协同发展,依然存在着很多问题。其中住房租赁市场供求关系失衡、房东与租客信息不对称、市场乱象居多等问题一直阻碍着租赁市场的发展。为了解决以上存在的问题,把控住房租赁市场的价格走向是关键,因而对住房租金进行合理的定价和预测就显得尤为重要。本文结合当前的大数据背景,提出运用机器学习模型来对住房租金进行分析预测,以期构造出预测效果较好的模型来供租赁市场参考。本文通过网络爬虫技术从链家网上获取了深圳市在2019年12月的真实租房数据。并对得到的原始数据进行数据清洗然后做可视化展示,从数据的描述性统计分析中直观的获得特征之间的关系以及影响租金的主要因素。为了更好的训练数据,本文接着进行数据变换,并通过特征选择得到了用于模型训练的12个特征。本文建立了支持向量回归(SVR)、随机森林和XGBoost模型对预处理后的数据进行预测分析。为了优化模型,提高预测准确率,本文选用网格搜索法分别对模型的重要参数进行... 

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 住房租金影响因素研究
        1.2.2 住房租金预测方法研究
    1.3 研究内容
    1.4 文章结构安排
第二章 相关理论基础
    2.1 机器学习介绍
    2.2 支持向量回归(SVR)
        2.2.1 最大间隔超平面
        2.2.2 线性支持向量回归
        2.2.3 非线性支持向量回归
    2.3 随机森林
        2.3.1 随机森林储备知识介绍
        2.3.2 随机森林原理介绍
    2.4 XGBoost
    2.5 本章小结
第三章 数据的获取与预处理
    3.1 数据的获取
        3.1.1 网络爬虫介绍
        3.1.2 数据的获取背景
        3.1.3 数据爬取及指标说明
    3.2 数据的清洗
        3.2.1 缺失值处理
        3.2.2 异常值处理
        3.2.3 重复数据处理
    3.3 数据的描述性统计分析
    3.4 数据变换
        3.4.1 目标变量的正态化
        3.4.2 离散变量的编码
        3.4.3 数据的归一化
    3.5 特征选取
    3.6 本章小结
第四章 深圳市住房租金预测分析
    4.1 模型评价指标
    4.2 分析方法
        4.2.1 支持向量回归(SVR)
        4.2.2 随机森林
        4.2.3 XGBoost
    4.3 模型结果与比较
    4.4 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢



本文编号:3730243

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3730243.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa1aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com