基于数据挖掘的房地产决策支持系统的研究和开发
发布时间:2020-08-01 08:09
【摘要】:房地产是一个综合性极强的系统工程,关系到国家、集体、个人的利益,影响到国民经济的发展,其兴旺与低落从一个侧面反映了国家经济发展状况。 随着我国房地产业与互联网的迅猛发展,房地产信息系统的不断完善,房地产业的业务数据与互联网WEB数据积累得越来越丰富。如何利用海量的数据中有效的知识,是本论文研究的重点。房产信息集团为适应当前企业面临的竞争压力,将决策支持系统提高到一个重要的位置,构建适用于本企业的房地产决策支持系统,以提高企业的竞争力。 本论文通过对企业的信息系统建设现状的分析,根据业务需求和功能需求构建了基于数据挖掘的房地产决策支持系统。 首先是构建房地产决策支持系统的总体架构,将决策支持系统架构分为三个层次,即源数据层、数据转换层和报表展示层。根据企业现有的业务,将业务数据与WEB日志数据定义为源数据;数据转换层ETL(Extract、Transformation and Load)则是将WEB日志进行清洗(清扫网络爬虫),以及将业务数据重新整合成适合于数据挖掘的数据;报表展示层是根据各部门的数据需求,将处理好的数据以各种图表的形式展现给用户。 然后是构建数据挖掘模型与层次结构,构建时间、地理(空间)层次,以及日志数据中URL的层次结构。同时结合Microstrategy的多维实体结构模型,构建多维在线分析处理即MOLAP(Multi-dimension online Analysis Processing)存储模式,自动化地实现模型层次上(包括时间、地理)的数据挖掘。 最后是在房地产决策平台的前端报表展现端,用Microstrategy与WEB开发相结合构建各部门完整的报表系统,用户以登录模式即可访问到所需报表数据,为用户和各部门决策提供强有力的数据支持,真正做到实时决策。 在完成此基于数据挖掘的房地产决策支持系统开发的同时,利用先进的数据挖掘与数据分析工具,对网络用户的行为进行分类分析,实时做好流量预警,优化网络门户的设计,以提升网络的用户粘着度,同时通过对用户行为与楼市热点的相关性进行分析,做了有关楼市热点与用户行为结合实现精准推送房源的研究,预测未来房地产业的发展方向。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP311.52
【图文】:
使得面向数据的 DSS 迅速发展。持系统持系统(DSS,Decision Supporting System),是以管理科学、运为基础,以计算机技术、仿真技术和信息技术为手段,针对决策活动的具有智能作用的人机系统[19]。它为决策者提供分策过程和方案的环境,调用各种信息资源和分析工具,帮助。机技术的不断发展,人们能利用计算机来完成很多的任务,是科学家总结了信息技术在管理活动中应用的成功和失败两个新的应用模式。系统的目的是为决策者提供决策支持,而决策支持是通过决是一个提出问题、分析问题、求解问题和评价问题的过程[20代的新型决策支持系统,大都采用数据仓库与数据挖掘技术结构如图 2-2 所示
图 4-1 房地产决策支持系统总体结构图Fig.4-1 Real Estate Decision Support System General Structure(1) 源数据层包括目前正在运行的应用,如各种基于关系数据库的事务性应用(包括每日纪人统计,经纪人在网上发布房源数,房源刷新次数,房源被热推次数等)、财方面(包括经纪人套餐购买统计,每月收益统计,业务员推广收益等)、办公自理应用等,实现日常的业务处理,这些系统所处理的数据是数据仓库的数据源。据是指网站运行产生的日志数据;线下数据是指业务系统产生的数据的统称。数类型包括关系数据库、办公数据、平面文件等。(2) 数据转换层(ETL)实现数据抽取、转换和加载过程。将原始日志通过清洗,分析转换成数据库数据,包括对线上日志及导航路径数据表的加载,以及实体维度表的加载。数据仓库由面向不同主题的数据集市构成。在本房地产决策支持系统中,数包括两个方面的主题,一是 Web 日志相关的网络用户产生的点击历史,一是业的基于经纪人的客户数据。
20图 4-2 日志文本转换成 Sql server 数据库文件Fig.4-2 Log text file transform Sql server database file4.2.2 业务逻辑数据整合—线下数据房地产信息平台线下数据一般为与业务逻辑相关联实体的属性信息,例如所登记注册的房源信息,所属经纪人或个人的身份信息,土地,开发商以及楼盘所在位置的交通信息等。在建模过程中,线下数据通过被用来建立与用户行为对象相关联的维度。由于这些业务逻辑数据在网站开发和运营过程中存在于网站后台数据库关系表中,其结构往往是按照开发逻辑而设计的,因此并没有考虑到将来数据挖掘和分析的问题。解决此问题行之有效的办法是将线下数据重新整合形成可直接聚合的事实数据和维度数据。在本系统研究与开发过程中,我们设计了另一个单独的线下数据 ETL 过程。通过这个 ETL 过程,散落在数据库冗杂的数据表中的信息被重新按照实体和事实之间的关
本文编号:2777199
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP311.52
【图文】:
使得面向数据的 DSS 迅速发展。持系统持系统(DSS,Decision Supporting System),是以管理科学、运为基础,以计算机技术、仿真技术和信息技术为手段,针对决策活动的具有智能作用的人机系统[19]。它为决策者提供分策过程和方案的环境,调用各种信息资源和分析工具,帮助。机技术的不断发展,人们能利用计算机来完成很多的任务,是科学家总结了信息技术在管理活动中应用的成功和失败两个新的应用模式。系统的目的是为决策者提供决策支持,而决策支持是通过决是一个提出问题、分析问题、求解问题和评价问题的过程[20代的新型决策支持系统,大都采用数据仓库与数据挖掘技术结构如图 2-2 所示
图 4-1 房地产决策支持系统总体结构图Fig.4-1 Real Estate Decision Support System General Structure(1) 源数据层包括目前正在运行的应用,如各种基于关系数据库的事务性应用(包括每日纪人统计,经纪人在网上发布房源数,房源刷新次数,房源被热推次数等)、财方面(包括经纪人套餐购买统计,每月收益统计,业务员推广收益等)、办公自理应用等,实现日常的业务处理,这些系统所处理的数据是数据仓库的数据源。据是指网站运行产生的日志数据;线下数据是指业务系统产生的数据的统称。数类型包括关系数据库、办公数据、平面文件等。(2) 数据转换层(ETL)实现数据抽取、转换和加载过程。将原始日志通过清洗,分析转换成数据库数据,包括对线上日志及导航路径数据表的加载,以及实体维度表的加载。数据仓库由面向不同主题的数据集市构成。在本房地产决策支持系统中,数包括两个方面的主题,一是 Web 日志相关的网络用户产生的点击历史,一是业的基于经纪人的客户数据。
20图 4-2 日志文本转换成 Sql server 数据库文件Fig.4-2 Log text file transform Sql server database file4.2.2 业务逻辑数据整合—线下数据房地产信息平台线下数据一般为与业务逻辑相关联实体的属性信息,例如所登记注册的房源信息,所属经纪人或个人的身份信息,土地,开发商以及楼盘所在位置的交通信息等。在建模过程中,线下数据通过被用来建立与用户行为对象相关联的维度。由于这些业务逻辑数据在网站开发和运营过程中存在于网站后台数据库关系表中,其结构往往是按照开发逻辑而设计的,因此并没有考虑到将来数据挖掘和分析的问题。解决此问题行之有效的办法是将线下数据重新整合形成可直接聚合的事实数据和维度数据。在本系统研究与开发过程中,我们设计了另一个单独的线下数据 ETL 过程。通过这个 ETL 过程,散落在数据库冗杂的数据表中的信息被重新按照实体和事实之间的关
【参考文献】
相关期刊论文 前6条
1 赵辉;王雪青;喻刚;;房地产投资决策支持系统研究[J];商业研究;2009年09期
2 林榕;;基于OLAP的学生就业指导数据分析[J];装备制造技术;2007年08期
3 李先光;刘颖;袁竞峰;付伟;;房地产市场分析预测中的数据挖掘技术应用研究[J];贵州工业大学学报(自然科学版);2007年01期
4 郭亮;;用CRISP-DM模型来规范企业数据中心建设[J];华北科技学院学报;2008年04期
5 王伟伟;刘希玉;范建淑;;房地产业中OLAP和数据挖掘技术的应用[J];山东师范大学学报(自然科学版);2006年04期
6 于红蕾;华庆一;刘燕玲;罗养霞;;数据仓库在电信统计分析中的应用[J];计算机技术与发展;2007年08期
相关硕士学位论文 前1条
1 崔晓冬;基于数据挖掘的社会保障决策支持系统开发[D];同济大学;2008年
本文编号:2777199
本文链接:https://www.wllwen.com/jingjilunwen/fangdichanjingjilunwen/2777199.html