当前位置:主页 > 经济论文 > 宏观经济论文 >

基于机器学习的房产智能自动评估模型的研究与系统实现

发布时间:2020-10-02 06:48
   自动评估模型作为房产估价的核心,应具备以下特点:1)数据质量高:数据决定了模型的上限,而且房产评估的可比案例要求可信;2)特征的选取和量化方法合理:影响房地产价值的特征因素的选取和量化需要符合中国房地产市场数据的特点;3)模型精度高:房产价格受多种因素的影响,但需要对其价格进行准确的评估。但是在现有研究中,还存在缺乏房产数据质量提升的研究、影响房产价格的特征因素体系不够完善、模型研究局限在验证单模型有效性的问题。针对以上问题,本文具体研究内容如下:1)基于多相似度估算器的房源重复记录识别模型:解决从不同房源抽取出的房产记录信息存在严重的重复房源问题;2)基于房价特征因素体系的特征提取及量化方法:解决国内房价特征因素体系不够完善,因估价人员的主观因素影响估价精度的问题;3)基于多层级模型融合的自动评估模型:解决由于房产价格受多种因素的影响,而且房产分区难以合理划分,导致模型建模复杂、精度不高的问题。基于上述研究内容,本文在已有爬虫和地址治理能力的基础上,实现了较高精度、可落地的房产批量评估系统,估价精度指标MAPE达到9.3 8%,具体包括以下模块:1)房源重复识别模块:实现了基于多相似度估算器的房源重复记录识别模型的封装和接口调用;2)特征工程模块:实现了基于房价特征因素体系的特征提取及量化,并可根据配置对特征进行预处理;3)自动评估模块:实现了基于多层级模型融合的自动评估模型的封装和接口调用。4)模型迭代模块:实现模型定期迭代更新机制,解决房价受时间因素影响的问题。
【学位单位】:北京邮电大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F293.3;TP181
【部分图文】:

混淆矩阵,概率值


图2-1混淆矩阵逡逑阵可以计算真正例率TPR和假正例率FPR两个TP逦pp逡逑TPR=逦FPR邋=邋-^ TP+FN逦FP+TN逡逑个样本预测的概率值进行排序,并依次作为阈

户型图,房源,模块系统,户型


图3-1模块系统架构逡逑通过采集房源的标题、地址、描述、面积、楼层、价格、户型、挂牌时逡逑间、房源图片等数据,输入到多相似度估算器模块中对应的相似度算法估算器逡逑中,再将相似度估算器提取到的特征输入到房源重复记录识别模型中,得到房逡逑源是否是重复记录的预测结果。逡逑

多相,特征提取,章节,模型预测


器计算得出的相似度大多取值在0?1之间,所以不用进行一些类似标准化、归逡逑—化的特征处理,只需处理特征缺失值,然后通过训练不断拟合两套房源记录逡逑的各个字段的相似度和分类结果之间的非线性关系,例如图3-3是数值范围距逡逑离特征的构建方式:逡逑步连续值范围钜离特征逡逑def邋range_diBtance(col_l,col_2):逡逑col_l邋=邋col_l.astype(float)逡逑col_2邋=邋col_2.astype{float)逡逑col_m邋=邋(col_l邋+邋col_2)/2逡逑return邋np.sqrt((np.power(col_l-col_m,2)邋+邋np.power(col_2-col_m,2))/2)/col_m逡逑rance_cols邋=邋['house_area','price_total','price']逡逑for邋col邋in邋range_cols:逡逑base_data[col]邋=邋range_distance邋raw_train[col邋+逦raw一train[col邋+邋'_y'];逡逑base_data[colJ邋=邋base_data[col].fillna(-l)逡逑base_data.loc[raw_train[pd.isnull(raw_train[col邋+邋1_x'])邋&邋pd.isnull(raw_train[col邋+邋_y'I)]-index,邋col}=-2逡逑图3-3邋MS-DEM数值范围距离特征提取逡逑本章采取网格搜索法和5折交叉验证法确定MS-DEM的最优参数

【相似文献】

相关期刊论文 前10条

1 李鑫;朱海勇;;逆向工程模型精度评价[J];科技信息;2010年27期

2 叶亮;潘尔顺;奚立峰;;模型精度对自控性能的影响及谨慎控制策略[J];计算机集成制造系统;2007年10期

3 伍艳春;一种提高灰色预测模型精度的方法[J];系统工程;1997年04期

4 李福琴;刘建国;;数据变换提高灰色预测模型精度的研究[J];统计与决策;2008年06期

5 何敏,向志民;提高Logistic生长模型精度的研究[J];辽宁林业科技;1996年06期

6 宋松科;刘泉;李军歌;;提高灰色预测模型精度的研究[J];西南公路;2010年03期

7 赵新蕖;平林英;;提高GM(1,1)模型精度的探讨[J];科技资讯;2008年33期

8 祁熙鹏;马宁果;王平;党涛;陈腾;;市政项目带状实景模型的生产与精度检核方法研究[J];市政技术;2019年04期

9 陈鹏;陈家君;;全球电离层格网模型精度影响因素分析[J];大地测量与地球动力学;2014年02期

10 王建国,陈洪涛;对提高灰色预测模型精度的探讨[J];农业系统科学与综合研究;1997年01期

相关会议论文 前8条

1 郑开峰;;基于装饰阶段对模型整合的应用研究[A];第四届全国BIM学术会议论文集[C];2018年

2 张卿川;李斐;张胜凯;雷锦韬;李文浩;;不同对流层天顶延迟模型在南极半岛地区适用性分析[A];第九届中国卫星导航学术年会论文集——S05 精密定位技术[C];2018年

3 肖曼玉;金文韬;Piotr Breitkopf;张卫红;;大规模复杂结构优化算法[A];2018年全国固体力学学术会议摘要集(上)[C];2018年

4 范泽孟;岳天祥;;资源环境综合模型精度的定量分析方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年

5 白云;雷剑梅;冯玉明;赖志达;黄雪梅;;整车电磁仿真逆向模型一致度分析[A];汽车电子和智能车辆前沿技术重庆论坛论文集[C];2014年

6 杨斌;葛超英;徐雯佳;石静;;河北海域海面温度定量遥感反演及应用研究[A];第十八届中国环境遥感应用技术论坛论文集[C];2014年

7 钱宏智;张家泉;王东柱;崔立新;魏军;李国光;李学刚;曹利;李兴才;;连铸二冷配水模型可靠性的研究[A];连铸二次冷却技术交流会论文汇编[C];2005年

8 高瑞华;;烟台地区降水量时间序列的干旱灰色预测[A];第33届中国气象学会年会 S4 干旱气象灾害监测预测及其影响与对策[C];2016年

相关硕士学位论文 前10条

1 王昕睿;基于机器学习的房产智能自动评估模型的研究与系统实现[D];北京邮电大学;2019年

2 王浩;神经机器翻译模型的实现验证及其剪枝压缩[D];南京大学;2019年

3 徐山川;基于GIS的SWMM模型在洪雅县的应用研究[D];重庆大学;2018年

4 李学燕;组合模型在网络借贷反欺诈中的应用研究[D];对外经济贸易大学;2018年

5 刘欣;基于矩阵隐特征分析的推荐模型关键技术研究[D];电子科技大学;2017年

6 郑艺;基于光能利用率模型的植被总初级生产力估算及其不确定性分析[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年

7 幸韵;山区河流一维非恒定流数学模型精度改进方法[D];重庆交通大学;2015年

8 吴磊;科学计算中的几何多态模型初探[D];合肥工业大学;2005年

9 彭丽;基于MODIS和气象数据的陕西省小麦与玉米产量估算模型研究[D];浙江大学;2014年

10 计宝鑫;基于SWMM模型的西安市城区汇水区域划分与径流特征研究[D];西安理工大学;2017年



本文编号:2832066

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/2832066.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f07f1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com