当前位置:主页 > 经济论文 > 房地产论文 >

房地产交易信息搜索和匹配技术的研究与实现

发布时间:2018-01-17 15:28

  本文关键词:房地产交易信息搜索和匹配技术的研究与实现 出处:《杭州电子科技大学》2013年硕士论文 论文类型:学位论文


  更多相关文章: 主题爬虫 向量空间模型 URL知识库 蚁群算法 遗传算法


【摘要】:目前,随着国民经济的快速发展,房地产市场交易日趋活跃。信息技术的快速发展,带动了房地产行业的信息化进程。房产门户网站在市场交易中的影响愈来愈深刻,如58同城,21世纪不动产,新浪乐居等,从房产门户网站获取房屋信息进行比较选择是愈来愈多购房者的首选。而对于政府部门来说,建立一个覆盖面广、信息准确的基础房产信息数据库有着重大意义,可以有效提高税收工作的效率,防止偷税漏税、阴阳合同等现象出现。 本文通过对房地产信息特点的分析和互联网信息搜索与匹配技术的研究,实现了一个基于主题爬虫技术的房地产交易信息系统。首先,研究并提出了一种基于URL知识库的主题爬虫方案。该爬虫通过收集父网页内容、锚信息、URL内容计算得到目标网页与主题的相关度,在此基础上提取URL的特征并将其表示成一个带权重的向量来构建一个URL知识库,并对URL不断学习来动态更新URL知识库,以提高网页主题的匹配度。然后,研究并设计了基于遗传蚁群算法(GA-ACA)的信息搜索策略。GA-ACA算法主体过程运用遗传算法,利用遗传算法的随机性、快速性、全局收敛性,并结合蚁群算法的并行性、正反馈机制以及高效率的求解过程。一方面通过蚁群算法的信息素来指导遗传选择,,另一方面遗传算法的选择结果引起信息素的更新,并用于指导下一次的遗传选择,使两种算法优势互补。最后,实验表明以上方法的应用在爬虫系统的查准率、查全率上较Shark-Search算法提高了5%,比Best-First-Search算法提高了20%左右。
[Abstract]:At present , with the rapid development of national economy , the real estate market transaction is becoming more and more active . The rapid development of information technology drives the information process of real estate industry . Based on the analysis of real estate information and the research of Internet information search and matching technology , a real estate transaction information system based on URL knowledge base is implemented . First , the paper studies and proposes a kind of information search strategy based on URL knowledge base .

【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3;TP18

【参考文献】

相关期刊论文 前10条

1 郑源;任海英;;时态GIS在房屋全生命周期管理信息平台中的设计与应用[J];北京测绘;2012年03期

2 蒋玲艳;张军;钟树鸿;;蚁群算法的参数分析[J];计算机工程与应用;2007年20期

3 朱炜;王超;李俊;潘金贵;;Web超链分析算法研究[J];计算机科学;2003年09期

4 周德懋;李舟军;;高性能网络爬虫:研究综述[J];计算机科学;2009年08期

5 肖美华,薛锦云;遗传算法机理的研究及应用[J];计算机工程;2003年20期

6 欧阳柳波,李学勇,李国徽,王鑫;专业搜索引擎搜索策略综述[J];计算机工程;2004年13期

7 伍爱华;李智勇;;蚁群遗传算法的多目标优化[J];计算机工程;2008年08期

8 徐照财;程显毅;;基于多Agent系统的定题爬虫算法[J];计算机工程;2008年16期

9 曾广朴;范会联;;基于遗传算法的聚焦爬虫搜索策略[J];计算机工程;2010年11期

10 李勇;韩亮;;主题搜索引擎中网络爬虫的搜索策略研究[J];计算机工程与科学;2008年03期

相关博士学位论文 前3条

1 陈霄;DNA遗传算法及应用研究[D];浙江大学;2010年

2 杨剑峰;蚁群算法及其应用研究[D];浙江大学;2007年

3 刘波;蚁群算法改进及应用研究[D];燕山大学;2010年

相关硕士学位论文 前5条

1 彭正非;面向汽车行业的主题爬虫研究与实现[D];华中科技大学;2011年

2 刘强国;主题搜索引擎设计与研究[D];电子科技大学;2007年

3 叶勤勇;基于URL规则的聚焦爬虫及其应用[D];浙江大学;2007年

4 崔金国;基于蚁群算法的主题爬虫技术研究与实现[D];成都理工大学;2010年

5 冯思平;Web招标信息搜索及管理系统的设计[D];电子科技大学;2009年



本文编号:1436845

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/fangdichanjingjilunwen/1436845.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户102ce***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com