基于机器学习的房产智能自动评估模型的研究与系统实现
【学位单位】:北京邮电大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F293.3;TP181
【部分图文】:
图2-1混淆矩阵逡逑阵可以计算真正例率TPR和假正例率FPR两个TP逦pp逡逑TPR=逦FPR邋=邋-^ TP+FN逦FP+TN逡逑个样本预测的概率值进行排序,并依次作为阈
图3-1模块系统架构逡逑通过采集房源的标题、地址、描述、面积、楼层、价格、户型、挂牌时逡逑间、房源图片等数据,输入到多相似度估算器模块中对应的相似度算法估算器逡逑中,再将相似度估算器提取到的特征输入到房源重复记录识别模型中,得到房逡逑源是否是重复记录的预测结果。逡逑
器计算得出的相似度大多取值在0?1之间,所以不用进行一些类似标准化、归逡逑—化的特征处理,只需处理特征缺失值,然后通过训练不断拟合两套房源记录逡逑的各个字段的相似度和分类结果之间的非线性关系,例如图3-3是数值范围距逡逑离特征的构建方式:逡逑步连续值范围钜离特征逡逑def邋range_diBtance(col_l,col_2):逡逑col_l邋=邋col_l.astype(float)逡逑col_2邋=邋col_2.astype{float)逡逑col_m邋=邋(col_l邋+邋col_2)/2逡逑return邋np.sqrt((np.power(col_l-col_m,2)邋+邋np.power(col_2-col_m,2))/2)/col_m逡逑rance_cols邋=邋['house_area','price_total','price']逡逑for邋col邋in邋range_cols:逡逑base_data[col]邋=邋range_distance邋raw_train[col邋+逦raw一train[col邋+邋'_y'];逡逑base_data[colJ邋=邋base_data[col].fillna(-l)逡逑base_data.loc[raw_train[pd.isnull(raw_train[col邋+邋1_x'])邋&邋pd.isnull(raw_train[col邋+邋_y'I)]-index,邋col}=-2逡逑图3-3邋MS-DEM数值范围距离特征提取逡逑本章采取网格搜索法和5折交叉验证法确定MS-DEM的最优参数
【相似文献】
相关期刊论文 前10条
1 李鑫;朱海勇;;逆向工程模型精度评价[J];科技信息;2010年27期
2 叶亮;潘尔顺;奚立峰;;模型精度对自控性能的影响及谨慎控制策略[J];计算机集成制造系统;2007年10期
3 伍艳春;一种提高灰色预测模型精度的方法[J];系统工程;1997年04期
4 李福琴;刘建国;;数据变换提高灰色预测模型精度的研究[J];统计与决策;2008年06期
5 何敏,向志民;提高Logistic生长模型精度的研究[J];辽宁林业科技;1996年06期
6 宋松科;刘泉;李军歌;;提高灰色预测模型精度的研究[J];西南公路;2010年03期
7 赵新蕖;平林英;;提高GM(1,1)模型精度的探讨[J];科技资讯;2008年33期
8 祁熙鹏;马宁果;王平;党涛;陈腾;;市政项目带状实景模型的生产与精度检核方法研究[J];市政技术;2019年04期
9 陈鹏;陈家君;;全球电离层格网模型精度影响因素分析[J];大地测量与地球动力学;2014年02期
10 王建国,陈洪涛;对提高灰色预测模型精度的探讨[J];农业系统科学与综合研究;1997年01期
相关会议论文 前8条
1 郑开峰;;基于装饰阶段对模型整合的应用研究[A];第四届全国BIM学术会议论文集[C];2018年
2 张卿川;李斐;张胜凯;雷锦韬;李文浩;;不同对流层天顶延迟模型在南极半岛地区适用性分析[A];第九届中国卫星导航学术年会论文集——S05 精密定位技术[C];2018年
3 肖曼玉;金文韬;Piotr Breitkopf;张卫红;;大规模复杂结构优化算法[A];2018年全国固体力学学术会议摘要集(上)[C];2018年
4 范泽孟;岳天祥;;资源环境综合模型精度的定量分析方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年
5 白云;雷剑梅;冯玉明;赖志达;黄雪梅;;整车电磁仿真逆向模型一致度分析[A];汽车电子和智能车辆前沿技术重庆论坛论文集[C];2014年
6 杨斌;葛超英;徐雯佳;石静;;河北海域海面温度定量遥感反演及应用研究[A];第十八届中国环境遥感应用技术论坛论文集[C];2014年
7 钱宏智;张家泉;王东柱;崔立新;魏军;李国光;李学刚;曹利;李兴才;;连铸二冷配水模型可靠性的研究[A];连铸二次冷却技术交流会论文汇编[C];2005年
8 高瑞华;;烟台地区降水量时间序列的干旱灰色预测[A];第33届中国气象学会年会 S4 干旱气象灾害监测预测及其影响与对策[C];2016年
相关硕士学位论文 前10条
1 王昕睿;基于机器学习的房产智能自动评估模型的研究与系统实现[D];北京邮电大学;2019年
2 王浩;神经机器翻译模型的实现验证及其剪枝压缩[D];南京大学;2019年
3 徐山川;基于GIS的SWMM模型在洪雅县的应用研究[D];重庆大学;2018年
4 李学燕;组合模型在网络借贷反欺诈中的应用研究[D];对外经济贸易大学;2018年
5 刘欣;基于矩阵隐特征分析的推荐模型关键技术研究[D];电子科技大学;2017年
6 郑艺;基于光能利用率模型的植被总初级生产力估算及其不确定性分析[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年
7 幸韵;山区河流一维非恒定流数学模型精度改进方法[D];重庆交通大学;2015年
8 吴磊;科学计算中的几何多态模型初探[D];合肥工业大学;2005年
9 彭丽;基于MODIS和气象数据的陕西省小麦与玉米产量估算模型研究[D];浙江大学;2014年
10 计宝鑫;基于SWMM模型的西安市城区汇水区域划分与径流特征研究[D];西安理工大学;2017年
本文编号:2832066
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/2832066.html