社保联网审计中增量数据分布式处理的研究

发布时间：2017-08-28 21:03

本文关键词：社保联网审计中增量数据分布式处理的研究

【摘要】： 近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数据,往往需要定时抽取出增量数据。在目前和将来的研发中,如何快速的识别出增量数据,并进行提取、存储以及传输,将逐渐成为国内外学者关注的研究方向之一。在社会保障联网审计中,需要提取出增量数据来做为审计预警系统的源数据。增量数据的识别与提取技术是实现整个系统的关键技术之一。本文介绍了分布式系统的发展、负载均衡策略和国内外对于增量数据识别技术的研究情况,给出了基于分布式处理的增量数据处理方案,对增量数据分布式处理的数据分割、数据分配、增量识别以及数据回收等过程进行了研究,为了提高处理效率还设计了负载平衡策略,结合多线程技术进行实现,并做了性能分析和系统设计。最后,以某省的审计数据作为实验数据,在该省审计厅的曙光机群的基础上搭建了平台,并进行了仿真实验,性能测试表明该方法基本满足了联网审计业务的功能要求,完成了较高效的增量数据识别工作,审计工作的时效性得到了提高。
【关键词】：分布式计算 增量数据 负载均衡 社会保障审计
【学位授予单位】：哈尔滨工程大学
【学位级别】：硕士
【学位授予年份】：2010
【分类号】：TP311.13
【目录】：

摘要5-6
Abstract6-10
第1章绪论10-19
1.1 课题背景和意义10-11
1.2 国内外研究现状11-17
1.2.1 分布式系统的发展11-12
1.2.2 增量数据识别的研究现状12-14
1.2.3 分布式系统的负载均衡14-17
1.3 研究内容与论文组织方式17-19
1.3.1 研究内容17-18
1.3.2 论文组织方式18-19
第2章增量数据处理技术与分布式编程19-25
2.1 重复数据识别技术19-21
2.1.1 临近排序算法19-20
2.1.2 多趟邻近排序算法20-21
2.2 增量数据提取方法比较21-22
2.3 分布式编程技术22-24
2.4 本章小结24-25
第3章增量数据的分布式处理25-45
3.1 增量数据分布式处理流程25-27
3.2 提取数据分布特征27-29
3.3 数据分割29-31
3.4 数据分配31-33
3.5 增量数据识别33-36
3.6 负载均衡调度36-43
3.7 数据回收和整合43-44
3.8 本章小结44-45
第4章系统的设计方案和实施45-54
4.1 系统设计45-49
4.2 社保审计中增量数据处理算法的改进49-50
4.3 实验方案设计和性能分析50-53
4.3.1 实验方案设计50-51
4.3.2 运行结果分析51-53
4.4 本章小结53-54
结论54-55
参考文献55-59
攻读硕士学位期间发表的论文和取得的科研成果59-60
致谢60

【引证文献】

中国硕士学位论文全文数据库前1条

1 王超;面向国家审计的数据集成及关键技术研究[D];哈尔滨工程大学;2012年

，

本文编号：749454

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/749454.html

上一篇：农地城市流转前后农民福利变化研究——基于农民分化的视角
下一篇：被征地农民社会保障制度的政治学研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|