当前位置:主页 > 经济论文 > 国际贸易论文 >

高并发下的全国零售户信息采集和应用

发布时间:2018-08-01 11:32
【摘要】:截止目前企业面向的零售户量已经突破900万,随着信息化和数据化的加深,采集零售户数据和信息也是势在必行的。面对900万的用户量,随之引起问题的是服务器的访问量急剧上升,数据量呈爆炸式增长。以企业目前的服务器等硬件设备已经无法满足高并发、大数据的需求。如果只是增加多台服务器组成服务器集群,提高硬件、软件的性能,来解决大量用户并发请求和大数据处理的问题,这显然并不是很好的办法。本文通过分析和对比传统的数据采集模式和企业业务类型,设计了一种基于移动端的数据采集模式。并详细的分析了该数据采集模型,为了满足企业的要求和用户的需求,针对新型采集模式面对的高并发、大数据处理的问题,进一步分析和研究了负载均衡调度策略,并根据基于高并发的特征和调度算法的特点,在多时间片轮询调度机制的基础上提出了基于任务请求预测的动态调整负载均衡算法。并通过分析多维Markov链和排队论对算法进行进一步的调整和改进,经过实验验证,该算法较好地提高了整体系统的性能和负载。具体研究内容如下:1)本文通过对比传统数据采集方法,根据目前企业的业务类型和数据请求特征,设计了一种基于分布式策略的新型数据采集模型,该模型将APP和微信企业号作为数据采集的入口,并且组建服务器集群对高并发业务进行调度处理。使用基于Hadoop平台的策略创建了数据中心,并对数据进行了分析和处理。其中对全国零售户请求的业务类型和提交的数据性质,对该模型进行了初步优化处理。并通过分析模型系统中的层次结构和技术要点,提出了在高并发环境下,如何高效地调度任务请求和调整服务器节点的负载的问题,并在后文进行了分析和解决。2)深入研究了基于CPU和MEM的调度算法,根据实际任务请求的特征,改进并提出了基于预测机制的负载均衡调度算法。各个服务器节点会收集其它节点的负载情况,并预测网络请求的业务类型和到达率,动态的调整请求的分发,减少请求的等待时间,并缩短服务器的闲置时间,达到资源的有效利用,最终使系统的整体负载达到均衡状态。通过实验验证,该算法在缩短响应时间方面具有良好的性能,并且比基于CPU和MEM的调度算法性能更好。3)针对基于预测机制的负载均衡算法本身存在的不足,利用排队论的知识,对网络服务器方面的负载进行了优化,合理的安排任务请求的等待、处理和挂起。通过分析多维Markov的机制,对后续网络请求的特征和联系进行预测。通过分析多时间片轮询策略,提出了基于预测的Markov排队模型。经过实验的验证和分析,该模型较好的协调各服务器节点的负载状况,合理的分发后续到达的网络请求,减小响应时间。4)根据数据采集模型和负载均衡技术,建立了一套集移动终端数据采集平台、业务处理平台、数据处理平台的三位一体的数据采集系统。并将负载均衡技术应用到数据处理中,加快了服务器处理数据的时间,并展示了数据采集系统设计实现的成果。
[Abstract]:Up to now, the number of retail customers facing the enterprise has exceeded 9 million. With the deepening of information and data, it is imperative to collect data and information of retail customers. Facing 9 million users, the problem is that the amount of access to the server is rising rapidly and the amount of data is exploding. It is obviously not a good way to solve the problem of a large number of concurrent requests and large data processing, which is obviously not a very good solution. This article analyzes and compares the traditional data collection mode and enterprise business by analyzing and comparing the problems of large number of concurrent requests and large data processing. Type, a data acquisition model based on mobile terminal is designed, and the data acquisition model is analyzed in detail. In order to meet the requirements of the enterprise and the needs of the users, the load balancing scheduling strategy is further analyzed and studied for the problems of high concurrency and large data processing in the new collection mode. On the basis of the multi time chip polling scheduling mechanism, the dynamic adjustment load balancing algorithm based on the task request prediction is proposed. The algorithm is further adjusted and improved by analyzing the multidimensional Markov chain and queuing theory. The algorithm improves the performance and negative effect of the whole system. The specific research contents are as follows: 1) in this paper, a new data acquisition model based on the distributed strategy is designed by comparing the traditional data acquisition methods, according to the business types and data request features of the current enterprise. This model takes APP and WeChat enterprise number as the entrance of data collection, and sets up a server cluster for high concurrency services. The data center is created using the strategy based on the Hadoop platform, and the data are analyzed and processed. The model is optimized for the type of business and the nature of the data submitted by the national retail customers, and the high level structure and technical points in the model system are put forward. In the concurrent environment, how to efficiently schedule task requests and adjust the load of server nodes, and analyze and solve.2 in the later text, the scheduling algorithm based on CPU and MEM is deeply studied. According to the characteristics of the actual task request, the load balancing scheduling algorithm based on the prediction machine is improved and proposed. Collect the load of other nodes, predict the type of service and the rate of arrival of the network request, dynamically adjust the request distribution, reduce the waiting time of the request, shorten the idle time of the server, achieve the effective utilization of the resource, and finally make the whole load of the system reach the balance state. The inter aspect has good performance and is better than the scheduling algorithm based on CPU and MEM). In view of the shortcomings of the load balancing algorithm based on the prediction mechanism, using the knowledge of queuing theory, it optimizes the load of the network server and arranges the waiting, processing and hanging up. By analyzing multidimensional Ma. The mechanism of rkov predicts the characteristics and connections of the subsequent network requests. Through the analysis of the multi time slice polling strategy, a prediction based Markov queuing model is proposed. Through the experimental verification and analysis, the model is better to coordinate the load status of each server node, to distribute the following network requests reasonably, and to reduce the response time.4). According to the data collection model and the load balancing technology, a set of data collection system is set up, which sets the data collection platform of the mobile terminal, the business processing platform and the data processing platform. The load balancing technology is applied to the data processing, and the time for the server to deal with the data is speeded up, and the design of the data acquisition system is demonstrated. The present results.
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F724.2

【参考文献】

相关期刊论文 前10条

1 王小戏;吴刚;王灏;;高并发高可用零售O2O交易系统的架构设计与业务实现[J];计算机与现代化;2016年04期

2 林伟;丁志刚;;基于Agent的微信平台自适应负载均衡算法[J];实验技术与管理;2015年12期

3 喜艺;;Hadoop大数据平台与传统数据仓库的协作探究[J];通讯世界;2015年17期

4 本刊编辑部;石菲;邢帆;孙杰贤;姜红德;;“两会”关键热点:信息化新阶段[J];中国信息化;2015年03期

5 王辉;李晋光;;异构网络负载均衡算法[J];工业仪表与自动化装置;2014年05期

6 苏金树;郭文忠;余朝龙;陈国龙;;负载均衡感知的无线传感器网络容错分簇算法[J];计算机学报;2014年02期

7 黄素萍;葛萌;;Hadoop平台在大数据处理中的应用研究[J];现代计算机(专业版);2013年29期

8 亓开元;韩燕波;赵卓峰;房俊;;支持高并发数据流处理的MapReduce中间结果缓存[J];计算机研究与发展;2013年01期

9 尚明华;秦磊磊;王风云;刘淑云;张晓艳;;基于Android智能手机的小麦生产风险信息采集系统[J];农业工程学报;2011年05期

10 张涛;李建;康永佳;;多任务高并发数据处理平台的技术研究[J];网络安全技术与应用;2010年03期

相关博士学位论文 前2条

1 刘晓茜;云计算数据中心结构及其调度机制研究[D];中国科学技术大学;2011年

2 王永炎;实时事务并发控制算法优化[D];中国科学院研究生院(软件研究所);2004年

相关硕士学位论文 前10条

1 邓玉林;基于hadoop大数据框架的个性化推荐系统研究与实现[D];电子科技大学;2016年

2 张慧芳;基于动态反馈的加权最小连接数服务器负载均衡算法研究[D];华东理工大学;2013年

3 王延武;基于LVS的集群动态负载均衡算法研究[D];北京化工大学;2012年

4 冯秀玲;云计算环境下的负载均衡算法的研究与设计[D];北京邮电大学;2012年

5 胡俊;构建分布式系统的关键技术研究与实现[D];南京邮电大学;2012年

6 施杨斌;云计算环境下一种基于虚拟机动态迁移的负载均衡算法[D];复旦大学;2011年

7 杨锦;异构分布式系统中的负载均衡调度算法研究[D];湖南大学;2011年

8 万勇;基于LVS的负载均衡策略算法的研究与改进[D];西南交通大学;2010年

9 刘汉玲;基于Web Service的分布式系统中动态负载均衡策略的研究与实现[D];哈尔滨工程大学;2010年

10 陈亮;集群负载均衡关键技术研究[D];中南大学;2009年



本文编号:2157441

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2157441.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e8be5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com