資源描述:
《ts_nim_error_stuck_錯(cuò)誤故障分析及處理》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、9113-550TS_NIM_ERROR_STUCK—錯(cuò)誤故障分析及處理2015年8月21日星期五目錄:1.故障機(jī)器:32.故障描述:33.故障分析44.故障處理步驟45.風(fēng)險(xiǎn)規(guī)避151.故障機(jī)器:M/T:9113-550S/N:659907EFW:SF240_358OS:5300-09-04-09202.故障描述:系統(tǒng)持續(xù)報(bào)出如下錯(cuò)誤:LABEL:TS_NIM_ERROR_STUCK_IDENTIFIER:3D32B80DDate/Time:TueAug1820:25:492015Sequenc
2、eNumber:283056MachineId:NodeId:Class:Type:ResourceName:00C9907E4C00OLC_1_2SPERMtopsvcsDescriptionNIMthreadblockedProbableCausesAthreadinaTopologyServicesNetworkInterfaceModule(NIM)processwasblockedTopologyServicesNIMprocesscannotgettimelyaccesstoCPUTh
3、readwhichwasblockedreceivethreadIntervalinsecondsduringwhichprocesswasblocked25Interfacenametty()1.故障分析從錯(cuò)誤Fl志來(lái)看,TS_NIM_ERROR_STUCK_錯(cuò)誤是山于UyO的心跳堵塞所導(dǎo)致的,這種錯(cuò)誤一般有以卜?幾個(gè)原因所引起:1.串口卡和串口線物理連接的問(wèn)題2.串口卡和串口線備件故障的問(wèn)題3.操作系統(tǒng)/燉文件系統(tǒng)曾經(jīng)達(dá)到過(guò)100%,雖然Z前通過(guò)清除文件或擴(kuò)大文件系統(tǒng)的方法解決了文件系統(tǒng)滿的情
4、況,但是操作系統(tǒng)沒(méi)有重啟過(guò)。4.雙機(jī)FailureDetectRate所設(shè)置的心跳檢測(cè)間隔時(shí)間過(guò)短這種錯(cuò)誤一般來(lái)說(shuō)不會(huì)引起系統(tǒng)運(yùn)行的異常,但是如果是上述的1、2、4這幾種情況導(dǎo)致的話,有可能會(huì)在雙機(jī)需要進(jìn)行切換的時(shí)候影響雙機(jī)的切換,嚴(yán)重的話,有可能會(huì)導(dǎo)致切換過(guò)程小節(jié)點(diǎn)直接宕機(jī)。第3利轄況對(duì)系統(tǒng)運(yùn)行不會(huì)有影響,但是持續(xù)的報(bào)錯(cuò),對(duì)系統(tǒng)的監(jiān)控會(huì)有一點(diǎn)的彫響。2.故障處理步驟由于下面的部分修復(fù)操作需要停止雙機(jī)和應(yīng)丿IJ,雖然不會(huì)對(duì)操作系統(tǒng)和應(yīng)川做任何操作,理論上來(lái)說(shuō),對(duì)操作系統(tǒng)和應(yīng)用是不會(huì)有影響的,但是考
5、慮到操作系統(tǒng)和應(yīng)用停止以后再次啟動(dòng)的話,還是存在一定的操作系統(tǒng)和應(yīng)用啟動(dòng)方面的風(fēng)險(xiǎn),因此建議對(duì)操作系統(tǒng)和應(yīng)用數(shù)據(jù)進(jìn)行備份,一旦出現(xiàn)問(wèn)題,可以通過(guò)備份來(lái)對(duì)操作系統(tǒng)和應(yīng)用進(jìn)行恢復(fù)。強(qiáng)烈建議做以下操作之前先對(duì)操作系統(tǒng)和應(yīng)用數(shù)據(jù)進(jìn)行備份,操作系統(tǒng)備份可使用mksysb來(lái)做。操作系統(tǒng)備份方法如下:故障的具體修復(fù)步驟如下:1.檢查兩個(gè)節(jié)點(diǎn)Z間的串口線,看看接口是不是脫落了或是松掉了。2.如果物理上連接是沒(méi)有問(wèn)題的,可以通過(guò)lsdev-Clgreptty查看狀態(tài)是不是availableo3.停止應(yīng)用(由客戶應(yīng)用
6、人員執(zhí)行相關(guān)操作)4.停止雙機(jī),具體步驟如下:a)執(zhí)行smittyclstop進(jìn)入如卜?菜單凰10.163.233.60(1)-SecureCRT文件(E)巒(£)査看(Y)選項(xiàng)(Q)WCD腳本⑸工貝(D窗口(W)群助(H)4S3?辺XI注機(jī)"It+R:一羌石咅呂冒詹丫匸廚*10.163.233.60(1)XstopclusterservicesTypeorselectvaluesUn?ntryfields?PressEnteraftermakingalldesiredchanges?Stopno
7、w,onsystemrestartorboth)pclusters^FVicesonthesenodesbroadcastclustershutdown?*SelectanActiononResourceGroups[EntryFields]now+[0bp6O]+true+BringResourceGroups>+Fl-HelpEsc+5=ResetEsc+9=ShellF2-RefreshEsc+6=commandEsc+0=ExitF3-CancelEsc+7=EditEnter=DoF4-
8、ListEsc+8=lmagessh2:AES-256-CTR&5524行,80列VT100b)通過(guò)F4或ESC+4選擇需要停止的雙機(jī)節(jié)點(diǎn),在這里把兩個(gè)節(jié)點(diǎn)全選犬寫(xiě)數(shù)宇就緒圍10.163.233.60⑴?SecureCRT文件(f)??(E)8S(y)選項(xiàng)9)傳搖(D腳本⑸ia(L)窗口⑷W?J(H)ssh2:AES-256-CTR19,624行,80列VT100IC3
9、
10、B11^3^C)按回車(chē)確認(rèn)執(zhí)行凰10.163.233.60⑴?SecureCRT文件(E)竭輯(E)M(V)選