一种面向大规模计算机的监控管理系统
本文关键词:一种面向大规模计算机的监控管理系统 出处:《湖南大学学报(自然科学版)》2015年04期 论文类型:期刊论文
更多相关文章: 大规模计算机系统 计算机资源管理 带外管理 分布式系统结构
【摘要】:随着超级计算机系统性能的提升,系统规模越来越大,如何高效管理这些系统成为高性能计算机亟待解决的关键问题之一.本文提出了一种针对大规模计算机的监控管理系统——MMS(Monitoring and Management System).MMS采用分布式系统结构来提高监控管理系统的效率;监控信息的精细化处理降低了监控系统对计算网络的影响同时提高了基于web的客户端的反应速度;两级异步通信机制提高了MMS系统数据采集效率.理论分析与实验结果表明MMS运行效率高、可靠性好.
[Abstract]:With the super computer system to enhance the performance of the system, increasingly large scale, how to efficiently manage these systems become one of the key problems of high performance computer needs to be solved. This paper proposes an approach for large-scale computer monitoring and management system -- MMS (Monitoring and Management System.MMS) based on distributed system structure to improve the efficiency of monitoring and management system; monitoring the meticulous treatment reduces the monitoring system for the effect of computing network and improve the response speed of web based on client; two level asynchronous communication mechanism improves the efficiency of data acquisition system MMS. Theoretical analysis and experimental results show that the MMS high efficiency, good reliability.
【作者单位】: 国防科技大学计算机学院;
【基金】:国家863高技术研究发展计划项目(2012AA01A301)
【分类号】:TP38;TP315
【正文快照】: 随着科学技术的进步与发展,高性能计算的应用领域越来越广泛.复杂科学计算、天气预报、核模拟与核应用、基因工程、石油勘探等应用对计算能力的需求越来越大.为了满足这些应用需求,高性能计算机系统规模不断扩大,性能不断提高.随着系统规模的扩大,系统的可靠性、可用性面临着
【参考文献】
相关期刊论文 前5条
1 黄伟,詹剑锋,樊建平;DCFT-Kernel:一种基于组服务的机群容错管理系统的设计与实现[J];计算机研究与发展;2005年06期
2 范勇,马梅,杨大鉴;可扩展机群资源监控系统的设计与实现[J];计算机工程与应用;2003年26期
3 陈熠,孟丹,詹剑锋,甄宁;基于联邦的数据公告的设计与实现[J];计算机工程与应用;2004年25期
4 易昭华,金正操,杜晓黎;大规模机群监控系统数据采集通信模型和通信协议的研究[J];计算机工程与应用;2004年35期
5 刘青昆;孙爱婷;;具有容错机制的机群监控系统[J];计算机工程与设计;2010年21期
【共引文献】
相关期刊论文 前10条
1 肖建桥;卢军;;基于ACE实现进程迁移技术的研究[J];光通信研究;2007年02期
2 孙成强;Yongseong Cho;Jongsun Choi;Jaeyoung Choi;;Towards delivery of situational information in distributed environments[J];Journal of Measurement Science and Instrumentation;2013年03期
3 廖朗;王鑫;刘云霞;;冶金监控云计算平台的设计与实现[J];电气应用;2014年16期
4 孟丹,詹剑锋,王磊,涂碧波,张志宏;一体化机群操作系统Phoenix[J];计算机研究与发展;2005年06期
5 黄伟,詹剑锋,樊建平;DCFT-Kernel:一种基于组服务的机群容错管理系统的设计与实现[J];计算机研究与发展;2005年06期
6 倪广宝 ,马捷 ,詹剑锋 ,张志宏 ,王磊 ,孟丹;基于机群中间件监控系统的设计和实现[J];计算机工程与应用;2005年22期
7 高春生;张守福;;煤矿水泵控制系统双机热备设计方案[J];工矿自动化;2012年03期
8 付喜春;;基于多架构PC集群监控系统结构设计[J];信息技术;2013年09期
9 吴怡风;归强;罗明宇;蔡文举;徐明;;集群计算机监控技术研究[J];计算机与现代化;2013年11期
10 朱征;于帅鹏;赵志刚;吴金龙;;基于流计算的实时监控预警架构研究及应用[J];华东电力;2014年11期
相关博士学位论文 前6条
1 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
2 黄伟;机群系统容错中间件技术研究[D];中国科学院研究生院(计算技术研究所);2005年
3 肖鹏;QoS约束下的网格资源协同分配方法研究[D];中南大学;2009年
4 徐达宇;云计算环境下资源需求预测与优化配置方法研究[D];合肥工业大学;2014年
5 乔媛媛;基于Hadoop的网络流量分析系统的研究与应用[D];北京邮电大学;2014年
6 林铭炜;面向云平台的虚拟机异常行为检测方法研究[D];重庆大学;2014年
相关硕士学位论文 前10条
1 孙爱婷;机群监控系统关键技术的研究与实现[D];辽宁师范大学;2010年
2 张琴;电信CDMA业务分布式处理子系统的设计与实现[D];哈尔滨工业大学;2011年
3 宋智礼;应用网络技术实现校园网的资源监控系统[D];北方工业大学;2004年
4 雷波;面向集群管理的“虚拟操作环境”系统的设计与实现[D];西北工业大学;2004年
5 靳京;面向用户的网格资源监控服务系统的研究[D];燕山大学;2006年
6 赵月辉;大规模机群远程监控管理关键技术及实现[D];中国科学院研究生院(计算技术研究所);2006年
7 魏光村;网格数据库关键问题研究[D];山东科技大学;2006年
8 王磊;机群操作系统高可用服务研究[D];中国科学院研究生院(计算技术研究所);2006年
9 王复盛;基于Agent的网格资源监控技术研究[D];长沙理工大学;2007年
10 吴钟琴;基于Linux/UNIX的机群监控系统的关键技术的研究与实现[D];华东师范大学;2008年
【二级参考文献】
相关期刊论文 前5条
1 徐志大,白鹏,南相浩;目录服务协议分析、比较与实现[J];计算机工程与应用;2001年03期
2 陈熠,孟丹,詹剑锋,甄宁;基于联邦的数据公告的设计与实现[J];计算机工程与应用;2004年25期
3 魏文国,张凌,董守斌,梁正友;一个可靠的集群簇/网格监控系统[J];计算机应用;2004年05期
4 刘晓洁;黄永佳;;基于Linux的双机热备系统的实现技术[J];计算机应用研究;2007年04期
5 胡小勇;余翔湛;张宏莉;;利用Heartbeat实现高可用集群系统[J];微计算机信息;2009年01期
【相似文献】
相关期刊论文 前1条
1 关忠诚,王琪,程刚;监控管理系统中的故障评估模型及应用[J];科研管理;2005年01期
相关重要报纸文章 前1条
1 本报记者 钟洪奇;联想万全慧眼:打开服务器监控的大门[N];计算机世界;2002年
,本文编号:1424474
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1424474.html