当前位置:主页 > 社科论文 > 社会保障论文 >

社保联网审计中增量数据分布式处理的研究

发布时间:2017-08-28 21:03

  本文关键词:社保联网审计中增量数据分布式处理的研究


  更多相关文章: 分布式计算 增量数据 负载均衡 社会保障审计


【摘要】: 近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数据,往往需要定时抽取出增量数据。在目前和将来的研发中,如何快速的识别出增量数据,并进行提取、存储以及传输,将逐渐成为国内外学者关注的研究方向之一。在社会保障联网审计中,需要提取出增量数据来做为审计预警系统的源数据。增量数据的识别与提取技术是实现整个系统的关键技术之一。 本文介绍了分布式系统的发展、负载均衡策略和国内外对于增量数据识别技术的研究情况,给出了基于分布式处理的增量数据处理方案,对增量数据分布式处理的数据分割、数据分配、增量识别以及数据回收等过程进行了研究,为了提高处理效率还设计了负载平衡策略,结合多线程技术进行实现,并做了性能分析和系统设计。 最后,以某省的审计数据作为实验数据,在该省审计厅的曙光机群的基础上搭建了平台,并进行了仿真实验,性能测试表明该方法基本满足了联网审计业务的功能要求,完成了较高效的增量数据识别工作,审计工作的时效性得到了提高。
【关键词】:分布式计算 增量数据 负载均衡 社会保障审计
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 绪论10-19
  • 1.1 课题背景和意义10-11
  • 1.2 国内外研究现状11-17
  • 1.2.1 分布式系统的发展11-12
  • 1.2.2 增量数据识别的研究现状12-14
  • 1.2.3 分布式系统的负载均衡14-17
  • 1.3 研究内容与论文组织方式17-19
  • 1.3.1 研究内容17-18
  • 1.3.2 论文组织方式18-19
  • 第2章 增量数据处理技术与分布式编程19-25
  • 2.1 重复数据识别技术19-21
  • 2.1.1 临近排序算法19-20
  • 2.1.2 多趟邻近排序算法20-21
  • 2.2 增量数据提取方法比较21-22
  • 2.3 分布式编程技术22-24
  • 2.4 本章小结24-25
  • 第3章 增量数据的分布式处理25-45
  • 3.1 增量数据分布式处理流程25-27
  • 3.2 提取数据分布特征27-29
  • 3.3 数据分割29-31
  • 3.4 数据分配31-33
  • 3.5 增量数据识别33-36
  • 3.6 负载均衡调度36-43
  • 3.7 数据回收和整合43-44
  • 3.8 本章小结44-45
  • 第4章 系统的设计方案和实施45-54
  • 4.1 系统设计45-49
  • 4.2 社保审计中增量数据处理算法的改进49-50
  • 4.3 实验方案设计和性能分析50-53
  • 4.3.1 实验方案设计50-51
  • 4.3.2 运行结果分析51-53
  • 4.4 本章小结53-54
  • 结论54-55
  • 参考文献55-59
  • 攻读硕士学位期间发表的论文和取得的科研成果59-60
  • 致谢60

【引证文献】

中国硕士学位论文全文数据库 前1条

1 王超;面向国家审计的数据集成及关键技术研究[D];哈尔滨工程大学;2012年



本文编号:749454

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/749454.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7dde2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com