資源描述:
《系統(tǒng)日常維護(hù)說(shuō)明》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、RS/6000系統(tǒng)維護(hù)說(shuō)明l維護(hù)目的?盡早發(fā)現(xiàn)系統(tǒng)及設(shè)備存在的潛在問(wèn)題,使可能的故障消除在萌芽狀態(tài)。?可以減少緊急故障發(fā)生頻率,減少對(duì)系統(tǒng)的影響。?監(jiān)測(cè)系統(tǒng)的當(dāng)前運(yùn)行狀況。?做好數(shù)據(jù)及系統(tǒng)的備份工作,減輕問(wèn)題發(fā)生時(shí)的風(fēng)險(xiǎn)和責(zé)任l一般維護(hù)的方法(RS/6000系統(tǒng))一、系統(tǒng)啟動(dòng)及關(guān)閉系統(tǒng)啟動(dòng)遵循先開(kāi)外設(shè)再開(kāi)主機(jī)的順序;系統(tǒng)關(guān)閉則先關(guān)主機(jī)再關(guān)外設(shè)。1.系統(tǒng)啟動(dòng)在開(kāi)機(jī)之前,應(yīng)檢查所有的外設(shè)(如磁盤陣列,外接磁帶設(shè)備等)已經(jīng)加電。如您的系統(tǒng)為兩臺(tái)主機(jī)+磁盤陣列并使用了HACMP軟件時(shí):請(qǐng)注意系統(tǒng)啟動(dòng)順序。正常順序如下:1、打開(kāi)磁盤陣列
2、,待磁盤陣列完全啟動(dòng)后再進(jìn)行下一步。2、打開(kāi)主控臺(tái)、外置磁帶機(jī)、帶庫(kù)、或光盤庫(kù)、打印機(jī)等外設(shè),待這些外設(shè)完全啟動(dòng)后再進(jìn)行下一步。如果雙機(jī)采用主備模式,則:3、啟動(dòng)生產(chǎn)主機(jī),待生產(chǎn)主機(jī)完全啟動(dòng)后再進(jìn)行下一步,這時(shí)在終端上應(yīng)可login。_______________________________________________________________________________Page12of121、啟動(dòng)備份主機(jī),待備份主機(jī)可以登陸時(shí)再進(jìn)行下一步。如果雙機(jī)采用互備模式或其它無(wú)優(yōu)先級(jí)別之分的雙機(jī)模式時(shí),兩臺(tái)主機(jī)啟動(dòng)的
3、順序可不分先后,或根據(jù)具體需要決定啟動(dòng)順序。2、檢查主備機(jī)的網(wǎng)絡(luò)地址、路由表(可用“netstat–in”、“netstat–rn”等),檢查文件系統(tǒng)、邏輯卷(可用“mount”、“l(fā)svg–o”等)。3、檢查各項(xiàng)業(yè)務(wù)是否工作正常。1.關(guān)閉系統(tǒng)系統(tǒng)關(guān)閉遵循以下的流程1、關(guān)閉所有應(yīng)用程序2、關(guān)閉所有數(shù)據(jù)庫(kù)3、如果安裝了如TSM的備份軟件和網(wǎng)管軟件,關(guān)閉這些程序。上述3個(gè)步驟如果已經(jīng)配置到HACMP中,則不需另外執(zhí)行4、停止HACMP(參見(jiàn)后面HACMP的維護(hù)說(shuō)明)5、關(guān)閉系統(tǒng)以root用戶登錄,?如果要關(guān)閉掉系統(tǒng),執(zhí)行:#shu
4、tdown–F等到主機(jī)前部面板上的液晶屏顯示“OK”時(shí),系統(tǒng)即告關(guān)閉完成。?如果只需要重啟機(jī)器,而不是關(guān)閉,執(zhí)行#shutdown–Fr6、關(guān)閉外設(shè)電源。一、系統(tǒng)狀態(tài)檢查和監(jiān)控2.錯(cuò)誤日志?#errpt
5、pg_______________________________________________________________________________Page12of12最簡(jiǎn)單,最基本,最常用的發(fā)現(xiàn)錯(cuò)誤的命令。我們知道其中有很多錯(cuò)誤是冗余或可以忽略的,但也的確需要注意下面這類報(bào)錯(cuò):?#errpt–dH主要列出硬件類
6、的報(bào)錯(cuò)。如果同一天大量出現(xiàn)“Diskoperationerror”,參照LVM(staled)、SSA(degraded)小節(jié),做進(jìn)一步的判斷,需要的話更換這塊硬盤。如果同一天大量出現(xiàn)“Tapeoperationerror”,首先說(shuō)明需要用清洗帶清潔磁頭,必要的話更換磁帶機(jī)。偶爾的SSA“AdapterDetectedOpenSerialLink”一般是因?yàn)楣蚕韺?duì)機(jī)關(guān)機(jī)造成的,通過(guò)判斷可以忽略。如果sysplanar0的報(bào)錯(cuò)緊跟著“errorloggingturnedon”,通常說(shuō)明機(jī)器被非正常關(guān)機(jī),例如掉電。如無(wú)持續(xù)報(bào)錯(cuò),可
7、不理會(huì)。?#errpt–aN查看來(lái)自報(bào)錯(cuò)源的詳細(xì)錯(cuò)誤信息。在AIX運(yùn)行時(shí)errdemon進(jìn)程隨時(shí)對(duì)系統(tǒng)進(jìn)行檢測(cè),當(dāng)該進(jìn)程發(fā)現(xiàn)任何異常情況時(shí)將發(fā)出錯(cuò)誤警告,這些警告記錄在錯(cuò)誤日志errlog中,其中有些錯(cuò)誤還會(huì)在終端上顯示。不能忽視這些錯(cuò)誤警告,它們很可能是您系統(tǒng)的故障隱患。系統(tǒng)管理員應(yīng)每日檢查錯(cuò)誤日志,及時(shí)處理異常情況。檢查錯(cuò)誤日志可用smit或errpt。如:#errptIDENTIFIERTIMSTAMPTCRESOURCE_NAMEDESCRIPTION22006
8、5230323111298THrmt0TAPEDRIVEFAILUREAA8AB2410323110098TOclstrmgtOPERATORNOTIFACATIONAA8AB2410323110098TOclstrmgtOPERATORNOTIFACATION其中IDENTIFIER為錯(cuò)誤編號(hào),當(dāng)需要檢查詳細(xì)信息時(shí)常會(huì)用到。TIMESTAMP為時(shí)間標(biāo)簽,它記錄的是出錯(cuò)時(shí)間,其格式為:月日時(shí)分年,如以上rmt0的錯(cuò)誤發(fā)生在98年3月23日11時(shí)12分。T是Type的縮寫,它記錄的是錯(cuò)誤類型。C是Class的縮寫,它記錄的是錯(cuò)誤
9、種類,如H:HardwareS:SftwareO:Errlogercommandmessages_______________________________________________________________________________Page12of12U