基于数据挖掘的服务器性能优化技术研究
本文选题:关联规则 + Apriori ; 参考:《吉林农业大学》2013年硕士论文
【摘要】:随着计算机技术的发展,互联网提供各式各样的服务,而这些服务程序在服务器上运行。有些服务器运行着多种服务,但是这些服务在一台服务器上运行是否合理,是否能提供稳定的服务值得思考。然而有些服务需要很多台服务器来支撑,如google搜索引擎需要上万台服务器来处理用户的检索请求。为了应对用户高峰,很多服务采用多服务器来应对高峰来临时提供稳定的服务,这也带来了一个值得思考的问题,在用户较少时很多服务器资源也随着浪费。 为了解决上述问题,我们采用数据挖掘技术进行分析。在研究多个服务在一台服务器上运行是否合理的问题时,我们引入关联关系分析来找出每个服务对服务器资源的使用情况,针对需要挖掘的数据维度较小的特点,提出基于字典树和倒排索引技术优化的Apriori算法,在研究集群服务器优化时,提出了一种动态加权负载均衡算法,以避免请求集中在某几个服务器的现象。 为了提供稳定的服务,我们引入了基于规则的故障预警模块,该模块可以监测服务器状态,并且根据规则分类服务器当前的危险级别,当达到指定危险级别时通知管理员,并及时处理以避免服务不稳定或服务不可用的情况。 本文最后通过实际数据分析提出一些在服务器空闲时有效提高服务器资源利用率的方法,包括单服务器和集群服务器的情况个给出建议。
[Abstract]:With the development of computer technology, the Internet provides a variety of services, and these service programs run on the server. Some servers run multiple services, but it is worth thinking about whether they work on a single server and provide stable services. However, some services need many servers to support, such as the google search engine requires tens of thousands of servers to handle users' retrieval requests. In order to cope with the peak of users, many services use multi-servers to cope with the peak to provide stable services, which also brings a problem worth thinking, when the number of users is less, a lot of server resources are also wasted. In order to solve the above problems, we use data mining technology to analyze. When we study whether it is reasonable for multiple services to run on a single server, we introduce the relational analysis to find out the usage of server resources by each service, aiming at the small dimension of data to be mined. This paper presents a Apriori algorithm based on dictionary tree and inverted index technology. In order to avoid the phenomenon that requests are concentrated on several servers, a dynamic weighted load balancing algorithm is proposed in the research of cluster server optimization. In order to provide stable service, we introduced a rule-based fault warning module, which can monitor the status of the server and classify the server's current danger level according to the rules, and notify the administrator when the specified danger level has been reached. And timely handling to avoid service instability or service unavailable situation. Finally, this paper puts forward some methods to improve the utilization of server resources when the server is idle, including the case of single server and cluster server.
【学位授予单位】:吉林农业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13
【参考文献】
相关期刊论文 前10条
1 韩芳,张红;机房服务器性能的优化技术[J];重庆工学院学报;2004年04期
2 李琪;郭敏;;基于字典树的基数排序算法[J];硅谷;2011年14期
3 王永刚;;数据挖掘研究综述及其在国土资源信息化中的应用研究初探[J];国土资源信息化;2009年02期
4 黄羿;马新强;李丹宁;;基于综合倒排索引的个性化搜索研究[J];贵州科学;2009年03期
5 赵伟;李文辉;张姝;;一种改进R-Link的空间数据检索算法[J];吉林大学学报(理学版);2008年03期
6 赵伟;张姝;李文辉;;基于K-means算法的高性能空间索引方法[J];计算机工程;2008年20期
7 李学森;李俊;奚宏生;;流媒体服务器性能评价模型[J];计算机工程;2009年10期
8 梅淑英;林亚平;周四望;许晖;;一种基于字典树的传感器节点关联规则的挖掘算法[J];计算机工程与科学;2010年04期
9 韦伟,罗翔;计算机系统集群的负载均衡原理及实现方法[J];计算机时代;2002年07期
10 叶迎宪;都思丹;;基于线性插值填充的帧内运动补偿[J];计算机应用;2008年01期
相关博士学位论文 前1条
1 冯艳玲;基于超声图像数据挖掘的HIFU无损监控关键技术研究[D];中南大学;2008年
相关硕士学位论文 前7条
1 单飞;PC机系统资源侦测软件的开发[D];苏州大学;2010年
2 张云涛;关联规则研究及在服务器智能管理中的应用[D];山东师范大学;2011年
3 侯景华;基于Apache的Web服务器性能优化和分析[D];西安电子科技大学;2006年
4 孙德全;数据库的负载自动识别及自管理技术研究[D];中国石油大学;2007年
5 马述清;数据挖掘中关联规则算法研究[D];吉林大学;2007年
6 杨磊;基于Intel Nehalem架构的CB60-G产品化测试及评估[D];中国地质大学(北京);2010年
7 张小倩;高速负载均衡算法的FPGA实现[D];电子科技大学;2010年
,本文编号:2061412
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2061412.html