高端容错计算机系统监测平台的设计与实现
发布时间:2021-11-21 13:50
计算机系统已经广泛应用于各个领域,用户在使用计算机系统提供的强大服务的同时也非常关心系统本身的运行状况,确定系统是否存在潜在的问题。计算机系统监测正是完成这一任务。如今,计算机系统监测已发展成一个重要的研究方向。高端容错计算机硬件结构复杂,运行的操作系统庞大,提供的服务众多,无论在对其评估和测量还是日常维护过程中,系统监测都是必不可少的。本文面向高端容错计算机设计和实现了系统监测平台。采用远程监控架构,用软件监控方法进行带内监测,又利用计算机的监控硬件实施带外监测,实现对高端容错计算机系统全方位、多层级监测的目标。首先本文研究和分析了国内外现有的计算机系统监测方法和工具,针对高端容错计算机体系结构和操作系统的特点设计监测平台的功能、监测指标和总体研究方案。根据监测指标的层次,设计了三个监测工具,分别实现对高端容错计算机应用层、系统内核层和硬件部件层的监测。性能监测工具基于内核数据结构获取系统性能数据,实现对系统CPU、内存、网络、磁盘、系统进程等关键应用性能的监测。内核探测工具基于内核调试技术实现动态探测系统内核行为,能够探测CPU寄存器和全局数据结构中的数值,也能探测指定进程的内核栈...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
性能监测工具界面
.3 硬件部件监测工具设计与实现.3.1 IPMI 介绍IPMI[54]是智能平台管理接口(Intelligent Platform Management Interface缩写。是管理基于 Intel 结构的企业系统中所使用的外围设备采用的一种工准,该标准由英特尔、惠普、NEC、美国戴尔电脑和 SuperMicro 等公司制定户可以利用 IPMI 监视服务器的物理健康特征,如温度、电压、风扇工作、电源状态等。而且 IPMI 是一个开放的免费标准。智能平台管理(Intelligent Platform Management)指的是直接由平台管理和固件实现自主监控和故障恢复。其最主要的特点是存储、监控、日志和等功能与计算机的处理器、BIOS 和操作系统无关,系统关机时候依然正行。在系统管理软件和一般的“带内”管理监控无法正常提供服务的情况下然可以获得平台的状态信息和实施恢复措施。IPMI 是一套应用于服务器监控和管理系统设计的标准,它透明了服务器平台、操作系统和软件的实现细节,而抽象出统一接口,实现跨平台的管理
哈尔滨工业大学工程硕士学位论文不会错误删除数据或是读到错误的数据。“Reserve SDR Repository”就是用于设置 SDR 的使用权限,他通过软件 ID 或是硬件地址来区分不同的用户请求。该命令会返回一个“Reservation ID”,只有拥有正确的 ID,后续对 SDR 库的操作才能被执行。应用软件必须将 IPMI 命令封装成 IPMI 消息才能在 IPMI 的各种接口及总线上传递,并被 BMC 接收。IPMI 消息分为请求消息和响应消息两种,分别是命令请求和执行结果的载体。IPMI 的消息机制也是基于请求/响应协议,网络控制模块将详细说明。一个 IPMI 消息中只包含一个 IPMI 命令请求或是一个IPMI 命令的执行结果,IPMI 命令序列必须依次封装成 IPMI 消息发送至 BMC执行,前一个命令执行成功才能接着执行下一个命令,否则执行失败。IPMI overLAN 方式的消息格式定义如图 3-13 所示。
【参考文献】:
期刊论文
[1]面向CC-NUMA体系结构的事务内存冲突规避方法[J]. 王睿伯,卢锡城,卢凯,王绍刚. 计算机学报. 2011(04)
硕士论文
[1]面向安腾架构的高端容错机故障注入平台的设计与实现[D]. 刘伟娜.哈尔滨工业大学 2010
[2]面向安腾2处理器的故障注入工具设计与实现[D]. 秦磊.哈尔滨工业大学 2010
[3]Linux平台下IPMI驱动程序设计与实现[D]. 李号双.中南大学 2009
[4]基于IPMI技术的服务器管理系统的设计与实现[D]. 李娜.北京邮电大学 2009
[5]IA-64 Linux内核跟踪机制研究与实现[D]. 陈丽波.国防科学技术大学 2004
本文编号:3509626
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
性能监测工具界面
.3 硬件部件监测工具设计与实现.3.1 IPMI 介绍IPMI[54]是智能平台管理接口(Intelligent Platform Management Interface缩写。是管理基于 Intel 结构的企业系统中所使用的外围设备采用的一种工准,该标准由英特尔、惠普、NEC、美国戴尔电脑和 SuperMicro 等公司制定户可以利用 IPMI 监视服务器的物理健康特征,如温度、电压、风扇工作、电源状态等。而且 IPMI 是一个开放的免费标准。智能平台管理(Intelligent Platform Management)指的是直接由平台管理和固件实现自主监控和故障恢复。其最主要的特点是存储、监控、日志和等功能与计算机的处理器、BIOS 和操作系统无关,系统关机时候依然正行。在系统管理软件和一般的“带内”管理监控无法正常提供服务的情况下然可以获得平台的状态信息和实施恢复措施。IPMI 是一套应用于服务器监控和管理系统设计的标准,它透明了服务器平台、操作系统和软件的实现细节,而抽象出统一接口,实现跨平台的管理
哈尔滨工业大学工程硕士学位论文不会错误删除数据或是读到错误的数据。“Reserve SDR Repository”就是用于设置 SDR 的使用权限,他通过软件 ID 或是硬件地址来区分不同的用户请求。该命令会返回一个“Reservation ID”,只有拥有正确的 ID,后续对 SDR 库的操作才能被执行。应用软件必须将 IPMI 命令封装成 IPMI 消息才能在 IPMI 的各种接口及总线上传递,并被 BMC 接收。IPMI 消息分为请求消息和响应消息两种,分别是命令请求和执行结果的载体。IPMI 的消息机制也是基于请求/响应协议,网络控制模块将详细说明。一个 IPMI 消息中只包含一个 IPMI 命令请求或是一个IPMI 命令的执行结果,IPMI 命令序列必须依次封装成 IPMI 消息发送至 BMC执行,前一个命令执行成功才能接着执行下一个命令,否则执行失败。IPMI overLAN 方式的消息格式定义如图 3-13 所示。
【参考文献】:
期刊论文
[1]面向CC-NUMA体系结构的事务内存冲突规避方法[J]. 王睿伯,卢锡城,卢凯,王绍刚. 计算机学报. 2011(04)
硕士论文
[1]面向安腾架构的高端容错机故障注入平台的设计与实现[D]. 刘伟娜.哈尔滨工业大学 2010
[2]面向安腾2处理器的故障注入工具设计与实现[D]. 秦磊.哈尔滨工业大学 2010
[3]Linux平台下IPMI驱动程序设计与实现[D]. 李号双.中南大学 2009
[4]基于IPMI技术的服务器管理系统的设计与实现[D]. 李娜.北京邮电大学 2009
[5]IA-64 Linux内核跟踪机制研究与实现[D]. 陈丽波.国防科学技术大学 2004
本文编号:3509626
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3509626.html