高性能计算机的可靠性技术现状与趋势
本文关键词:高性能计算机的可靠性技术现状与趋势,由笔耕文化传播整理发布。
高性能计算机的可靠性技术现状与趋势
计算机研究与发展 J u n lo mp t rRe e r h a d De eo me t o r a fCo u e s a c n v l p n
I S 0 0 1 3/ N 1 - 7 71 S N 1 0— 2 9 C 11 7/ P r 4 () 8-9 7 4:5 9 5 4,2 1 O0
高性能计算机的可靠性技术现状与趋势 黄永勤金利峰耀刘 (南计算技术研究所江江苏无锡 21 0 3 48 ) ( q l 0@ p b WX jif . e) y h 6 1 u . .sno n t
Cu r nt iu to a Tr n o Re i b lt Te hn l g i Hi h r e S t a i n nd ed f la iiy c oo y n g Pe f r a c ro m n e Co pu e s m t r
H u n Yo g i a ̄ n q n,J n Li n, a u Y a i f g nd Li o e ( a g a n tt t f mp tn c n l g Jin n n I siu eo Co u i g Te h o o y,W u,Ji n s 1 0 3 xi a gu2 4 8 )
Ab ta t As t e s s e p ro ma c f h g e f r n e c m p t r ( sr c h y t m e f r n e o i h p r o ma c o u e s HPC) b c me i h r a d e o s h g e n hi he nd is a d r c l on i ousy i r a e g ra t h r wa e s a e c tnu l nc e s s,ho w t e lz g y r la l e a i f t e o r a ie hi hl e i b e op r ton o h s s e i r a ha l ng n t r— c l nd pe a s a e H PC e e r h a d d v l pme . Be i ng wih y t m s a g e tc le e i e a s a ea t— c l r s a c n e eo nt g nni t t r q r me t o hi h e ibiiy e hn o f o he e uie n f r g r la lt t c ol gy r m H PC, t a hor c mpl t l i t o he ut s o e e y n r duc t e he p e e t r la lt e hn o e n H PC a d a e d sgn, s h a a l v d nc r s n e ibiiy t c
ol gis i h r w r e i uc s f u ta oi a e, s a i e nd nc t tc r du a y,
d yna i e m c r dun nc da y,a nln e l c m e t n whih s a i e nd nc nc u s s c au tm a ki g nd o i e r p a e n,i c t tc r du a y i l de u h f l s n t c ol gis a pa t e nd nc e hn o e s r r du a y, da a t pa h e und nc a i f r a i r du t r d a y nd n o m ton e nda c n y, a d a i nd yn m c
r d da c nc u s s c ei biiy t c ol gis a a l e e to n i g s s e o t uc i n a e un n y i l de u h r la lt e hn o e s f u t d t c i n a d d a no i,r c ns r to nd r c ve y Com b ne ih onln e a e e e h eo r . i dw t i e r pl c m nt t c nol g o y, r d e und nc e hno o a e ty i pr ve a ytc l gy c n gr a l m o
s s e RAS ( e i b l y,a a l b l y,s r i e b t ) De a ld y a a y e s t e s e ii a p i a i n o y t m rl it a i v i it a i e vc a m y . t i l n l z d i h p cf p l t f e c c o al ki s f r la lt e h l i s n t pia BM, H P a d Cr y y t m s Fi ly dic s e s he l nd o e i biiy t c no og e i y c l I n a s s e . na l s u s d i t
f u e t e f r l biiy t c ut r r nd o e i lt e hno o n pe a s al HPC,s gg s i ha n t v l p e t o t - a l gy i t— c e u e tng t t i he de e o m n f pe a s ae c l hi p r o m a c c gh e f r n e omput r, m uc wo k ho d o u o r la lt d sgn f es h r s ul f c s n e ibii
y e i o m u t— o e lic r pr c s o a d h a lr und o e s r n t e l— o m e o y r e to m r p ot c i n, a d t s oi t d n i i p n e ou t t l de r hie t e s t ha b a a c t c ur i be e ii lt he r a ia i fm o l rz ton lr d n fca o t e l ton o du a ia i a e und nc nd o i e r pl c me f c m p e t . z a y a nln e a e nto o on n s K e r s hi h pe f m a ec m p e;r la lt y wo d g ror nc o ut r ei biiy;f ul v d nc a ta oi a e;f ul t e a e; r d da c a t olr nc e un n y;on - lne r plc m e i e a e nt
摘要
随着高性能计算机系统性能的不断提升和硬件规模的不断扩大,何实现系统的可靠运行,如是
高性能计算机尤其是 P级计算机研制中面临的重要技术挑战.高性能计算机对可靠性技术的需求出从 发,,面介绍了高性能计算机硬件设计中的可靠性技术现状,全包括避错、态冗余、态冗余和在线替换静动等技术,细分析了各种可靠性技术在典型机器中的应用情况;详最后对高性能计算机可靠性技术的发展趋势进行了深入探讨,包括多核处理器的可靠性设计、方位的内存防护技术和刀片式的冗余架构.全 关键词高性能计算机; 可靠性;错;避容错;冗余;线替换在 中图法分类号 TP 0 . 327
收稿日期: 0 8 1 l;回日期: 0 9 2 4 2 0… 0一 7修 2 0 0 2
本文关键词:高性能计算机的可靠性技术现状与趋势,由笔耕文化传播整理发布。
本文编号:152087
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/152087.html