当前位置:主页 > 文艺论文 > 广告艺术论文 >

空间数据挖掘中PVI算法的研究与应用

发布时间:2020-03-29 14:42
【摘要】:近些年来,空间信息技术领域的高速发展使我们进入信息变革的时代。空间数据通过传感器或者其他数据收集设备源源不断地收集起来,并呈指数级增长。为了能够有效管理数据,人们发展了数据库技术,并在此基础上建立了空间信息系统。然而,空间信息系统目前仍然只能提供给我们数据,却给不了我们数据以外的信息。人们已经不再满足于数据表层的检索与查询,而是希望更深一步的认识数据,得到知识与发现。关联规则挖掘可以从庞大的数据库中发现人们感兴趣的知识,但是需要花费大量的时间与资源。在空间关联规则中引入并行计算,不但可以满足人们对空间数据不断增长的认知要求,还可以降低数据挖掘时的时间与资源的消耗,以多台微型计算机来完成大型机才能完成的工作。经典的关联规则有Apriori算法、DHP算法、Partition算法等等。它们主要应用于顾客消费分析、目录设计、广告邮件分析、销售优化、仓储规划、网络故障分析等。 通过对刘永彬于2008年提出的TP-PB算法的研究,本文提出了一种类似计算向量内积的并行关联规则算法(Parallel Vectors Inner-product,PVI算法)用于遥感数据挖掘系统。算法通过改进计算频繁项目集方法和优化数据读取,使算法寻找频繁项目集的效率大幅度提高。同时利用“廉价”的微型计算机资源,按照数据特点采用并行计算使得整个空间关联规则的挖掘效率进一步提高。经过对并行空间关联规则的研究,取得了如下研究成果: 1)简化计算频繁项集的方法。使用布尔型数据可以有效降低了PVI算法的复杂度,并且PVI算法使用类似计算向量内积的方法来计算候选频繁项集,并利用k-1阶频繁项集计算k阶频繁项集,大大简化了计算步骤,提高了算法的并行性。 2)减少扫描数据库次数。TP-PB算法发现知识时需要扫描数据库2次,而PVI算法通过计算时记录有效信息,只需扫描数据库一次,相比于TP-PB算法减少了I/O操作。数据的I/O操作会占算法开销的很大一部分,PVI算法减少了对数据库的扫描,大大提高了算法效率。 3)空间关联规则引入并行计算。PVI算法采取冗余存储与减少I/O操作来降低任务完成时间。控制机将挖掘任务分配后,并行机自行根据任务在本地读取数据,进行知识发现。其次,为了使并行机尽量不处于空闲状态,应将子任务数量划分为并行机个数的整数倍并兼顾粒度。 4)将并行的空间关联规则算法嵌入到遥感数据挖掘系统中,实现对海量遥感数据的展示与知识发现。采用B/S模式,使用户可以通过网络在网页浏览器上随时随地查看遥感数据。系统采用微软先进的图形开发工具WPF开发呈现,并可以对遥感数据进行漫游、放大、缩小、FullExtent等操作。在设置最小支持度阈值与最小置信度阈值后,提交遥感数据挖掘任务。
【图文】:

示意图,经典,体系结构,示意图


2.2.3 并行性能评价与优化给定并行算法,采用并行程序设计平台,待完成实际问题的并行算法后,我们就是,利用各并行机上运行程序,评价该并行算法的实际性能,找出并行算法的颈,使程序能够得到性能优化。性能评价和优化是完成高质量并行程序必不可少步骤。首先,我们需要弄清楚并行程序执行时间的组成。众所周知,串行程序的独享处理器资源,它的运行时间近似等于程序指令执行花费的 CPU 时间。但是程序需要分配并行任务,其执行时间应该为从并行程序开始执行,到各个进程执,,墙上时钟走过的时间,也称之为墙上时间(Wall Time)[16]。对于各个进程,墙可进一步分解为计算消耗时间、通信消耗时间、同步消耗时间、空闲进程时间。串行算法在某台并行机上代码执行时间为 ,而该程序并行化后,P 个进程在 P 机上并行执行所需要的时间为 ,则该并行程序在该并行系统上的加速比 可:

实验结果,空间关联规则,空间数据,算法


对具体的空间数据特点、地理特征我们知之甚里面存放着许多空间数据,而数据类型也多为 Polyline是以一条线一个面存在的,都是连续的。如果我们仍把我们将失去很多知识的发现;而另一方面,领域专家可哪些是互斥的,如果我们在做挖掘前将其剪枝就可以大结果及分析并行空间关联规则的算法还属于空白阶段空间关联规则,与意义不大(经典的数据挖掘无法直接搬到空间数据挖掘上、软件的环境下,把 TP-PB 算法与 PVI 算法拿来做测试比和最小置信度阈值下,两个算法执行时间比较如下图 3-7 所io 2008 开发工具 C#语言编写。
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 薛爱萍;任志国;;空间数据挖掘系统设计[J];中国市场;2011年32期

2 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期

3 杨海玲;;浅议数据挖掘在高校图书馆信息服务中的作用[J];农业图书情报学刊;2011年07期

4 辛浩;;基于关联规则的中文姓名识别方法[J];宿州学院学报;2011年05期

5 忻凌;王丽;;可视化关联规则对疾病相关因素的发现[J];医学信息(上旬刊);2011年08期

6 寿先红;;数据挖掘技术在图书借阅分析系统中的应用与研究[J];电脑知识与技术;2011年26期

7 张皓;;数据挖掘技术在构建学生成绩预警系统的应用[J];电脑知识与技术;2011年19期

8 郎振红;;网络化物业管理系统中数据挖掘的应用[J];沈阳教育学院学报;2011年04期

9 张雨真;李伟;张慧慧;颜雪松;;基于XML构建KDD框架的研究[J];武汉船舶职业技术学院学报;2011年04期

10 齐战胜;高峰;腾达;;数据挖掘技术在计算机取证中的应用研究[J];信息网络安全;2011年09期

相关会议论文 前10条

1 雷小锋;谢昆青;马修军;;一种有效的空间关联规则挖掘方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

2 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年

3 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年

4 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年

5 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

6 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

7 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

8 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年

9 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

10 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

相关重要报纸文章 前10条

1 本报记者 杨纯;裴韬:做科学要挑感兴趣的冷门[N];科技日报;2008年

2 严宁;挖掘数据寻保险商机[N];网络世界;2007年

3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年

4 南京市地方税务局信息管理处、计算机中心 明靖 朱岚;数据挖潜让业务说话[N];中国计算机报;2006年

5 本报记者 袁跃;点击七彩人生[N];财会信报;2005年

6 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年

7 贵州省移动通信公司 苏思妮;让信息去主动寻找用户[N];通信产业报;2004年

8 ;选择SIM的十大理由[N];中国计算机报;2008年

9 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年

10 陈星霖;NIDS:老树发新枝[N];网络世界;2009年

相关博士学位论文 前10条

1 方兆宝;基于空间数据挖掘的MCSs时空演变规律研究[D];中国矿业大学(北京);2004年

2 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年

3 郑向群;农产品产地污染综合知识挖掘系统的研究[D];天津大学;2009年

4 牛继强;面向土地用途分区的空间数据挖掘[D];武汉大学;2010年

5 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年

6 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年

7 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年

8 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年

9 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年

10 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年

相关硕士学位论文 前10条

1 张冬冬;空间数据挖掘中PVI算法的研究与应用[D];河南大学;2011年

2 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年

3 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年

4 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年

5 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年

6 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年

7 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年

8 吴倩;基于关联规则的零售业CRM的设计和实现[D];华东师范大学;2011年

9 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年

10 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年



本文编号:2606114

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2606114.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f55d4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com