資源描述:
《rac集群cssd無法啟動的解決方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、rac集群cssd進程無法啟動的解決方法dtqh雙節(jié)點RAC集群其中一個節(jié)點的ocssd進程,不管通過什么手段都無法啟動,通過手工去可以強行啟動evmd、ocssd、crsd三個進程,但是過一段時間后除了CRSD進程是活著的外其它進程就全掛掉了,通過“ps–aux
2、grepd.bin”命令查看只能看到CRSD進程了,查看操作系統(tǒng)日志/var/log/messages文件,其中確實有CSSD進程的啟動信息,但是到最后就是異常終止了,文件中也只是提示詳細信息去查看rac進程的日志。此問題折騰了一天多
3、的時間從網(wǎng)上找各種資料,也嘗試了各位網(wǎng)友說的方法試了無數(shù)的方法就是拿它沒辦法,因此下面主要是展出現(xiàn)這個問題時的所有日志信息,同時列出網(wǎng)上各位網(wǎng)友列舉出來的方法,以及自己最終的解決辦法。日志信息展示/u01/app/oracle/product/10.2.0/crs/log/dtsndb1目錄中的alterdtsndb1.log日志文件的日志記錄只輸出如下圖所的內(nèi)容就結(jié)束了/u01/app/oracle/product/10.2.0/crs/log/dtsndb1/crsd/crsd.log日志文
4、件在出現(xiàn)問題期間不管采取何種啟動方式,得到的全時如下圖的錯誤信息/u01/app/oracle/product/10.2.0/crs/log/dtsndb1/crsd/cssd/ocssd.log日志文件在出現(xiàn)問題期間不管采取何種啟動方式,得到的全是如下圖的錯誤信息,特別是第二張圖片的內(nèi)容占了整個日志輸出的大部分/u01/app/oracle/product/10.2.0/crs/log/dtsndb1/crsd/cssd/oclsomon目錄下的所有日志文件在出現(xiàn)問題期間得到的全是如下圖的內(nèi)容
5、/u01/app/oracle/product/10.2.0/crs/log/dtsndb1/evmd/evmd.log日志文件在出現(xiàn)問題期間得到的全是如下圖的內(nèi)容首先要排除以下情況1、保證節(jié)點間的心跳線通暢,節(jié)點之間互拼一段時間,確保拼的這段時間內(nèi)數(shù)據(jù)包丟失率接近于02、確保所有節(jié)點的防火墻都已關(guān)閉,使用“serviceiptablesstatus”命令查看3、檢查所有節(jié)點的/etc/oracle/ocr.loc文件確保OCR磁盤應(yīng)用正確,如下圖所示客戶OCR注冊信息用的磁盤經(jīng)確認沒問題1、經(jīng)
6、確認客戶現(xiàn)場正常啟動節(jié)點的表決磁盤沒有什么問題2、確認所有節(jié)點的共享磁盤設(shè)備權(quán)限是否正確如ocr、votedisk、數(shù)據(jù)文件磁盤設(shè)備的權(quán)限都正常,保證問題節(jié)點與正常節(jié)點的認到的磁盤設(shè)備及權(quán)限都一致;測試ocr及votedisk用到的磁盤讀寫是否正常3、確保問題節(jié)點的/tmp/和/var/tmp/目錄權(quán)限正確,正常情況下這兩個目錄的權(quán)限應(yīng)該是這樣的,如果權(quán)限不對的話RAC在啟動的時候無法往這兩個目錄中寫入相關(guān)信息,會影響css正常啟動,因為啟動腳本“/etc/init.d/init.cssd”中的
7、變量CRSCTLOUT引用了此目錄4、在啟動RAC的時候確保/tmp/.oracle、/var/tmp/.oracle、$CRS_HOME/log/sid/文件夾權(quán)限正確,/etc/init.d/init.cssd啟動不管失敗成功都會往此文件夾中輸出日志信息,如果權(quán)限不對日志信息無法正常寫入那么CSS啟動就會有故障。以下是正常啟動后的一些輸出文件,重啟RAC或者系統(tǒng)之前將此(/tmp/.oracle和/var/tmp/.oracle)目錄中的所有文件全部刪除,否則也有可能會引起CSSD無法正常啟
8、動5、檢查/etc/sysctl.conf文件添加如下兩個參數(shù)6、檢查本地磁盤的可用空間是否已滿,如果磁盤可用空間不足那必然也會導(dǎo)致CSSD無法正常啟動的所有以上的方法及問題點都經(jīng)檢查沒問題,后來實在沒招了就直接運行了此腳本“?/u01/app/oracle/product/crs/root.sh”,讓它重新生成相關(guān)啟動腳本及rac相關(guān)注冊信息,然后神奇的是客戶的rac都正常了,連續(xù)重啟都能正常啟動,rac相關(guān)的所有日志信息全部進行排查都提示rac啟動正常,估計是客戶系統(tǒng)中rac相關(guān)的文件被他們
9、誤損壞了。參考文獻http://www.dbifan.com/200906/crs-cannot-start.htmlhttp://blog.csdn.net/tianlesoftware/article/details/6048651http://www.itpub.net/thread-1198953-5-1.html