服務(wù)器硬件故障處理幾例
硬件故障是指服務(wù)器硬件出現(xiàn)異常而導(dǎo)致的各類(lèi)錯(cuò)誤。由于服務(wù)器構(gòu)成比較復(fù)雜,因此在檢查的時(shí)候必須認(rèn)真、仔細(xì)。下面以一臺(tái)萬(wàn)全4500為例說(shuō)明。(例子,在實(shí)際問(wèn)題中如果遇到相似現(xiàn)象,也需要具體問(wèn)題具體分析,不要盲目套用)
有一臺(tái)萬(wàn)全4500,配有256M內(nèi)存,使用一個(gè)PIII XEON 500帶2M高速緩存的處理器。開(kāi)機(jī)后沒(méi)有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務(wù)器的另一種報(bào)警方式,我會(huì)在文后說(shuō)明)。這種錯(cuò)誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯(cuò)或CPU出錯(cuò)或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯(cuò),這時(shí)情況就比較復(fù)雜了,必須經(jīng)過(guò)認(rèn)真慎重的思考。因?yàn)镃PU板塊在整個(gè)服務(wù)器中,占有舉足輕重的地位,如果它出錯(cuò)服務(wù)器是會(huì)報(bào)致命錯(cuò)誤的,并且在系統(tǒng)日志中會(huì)提示致命錯(cuò)誤,但報(bào)CPU電壓錯(cuò)的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開(kāi)機(jī)后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。
這時(shí),取出CPU仔細(xì)擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開(kāi)機(jī)依然無(wú)顯示。
相對(duì)處理器壞的情況來(lái)說(shuō)處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺(tái)萬(wàn)全4500中取下一個(gè)處理器電壓模塊,安裝在此服務(wù)器中。開(kāi)機(jī)后,服務(wù)器依然沒(méi)有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時(shí)的情況就比較明顯了。于是立即從另一臺(tái)萬(wàn)全 4500中取下一個(gè)CPU安裝后,開(kāi)機(jī)正常。