資源描述:
《Linux操作系統(tǒng)死機(jī)處理方法總結(jié)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、hanscLinux操作系統(tǒng)死機(jī)處理方法總結(jié)Linux操作系統(tǒng)死機(jī)處理方法總結(jié)D*Rc,z1`????通常在出現(xiàn)系統(tǒng)崩潰后,大家會(huì)擔(dān)心再次出現(xiàn)故障,但是發(fā)現(xiàn)系統(tǒng)各日志中并沒(méi)有記錄到任何死機(jī)前后的信息,無(wú)法分析故障原因,認(rèn)為已經(jīng)無(wú)藥可救。但是,實(shí)際上,Linux*D!W8V'PX1o;v%F????有多種機(jī)制來(lái)保證發(fā)生系統(tǒng)崩潰后,可以獲取有價(jià)值的信息用以分析問(wèn)題。確定是硬件故障,還是應(yīng)用程序bug導(dǎo)致的。+y"U&ykRS@n'}$Y???? Linux中,有如下幾種方法來(lái)獲取各種崩潰時(shí)產(chǎn)生的信息。6t0aVf&[b8A{
2、???? 1.Coredump1n,
3、r%J?s???? Coredump通常用來(lái)調(diào)試應(yīng)用程序錯(cuò)誤,當(dāng)某些應(yīng)用程序運(yùn)行出現(xiàn)異常崩潰時(shí),可以開(kāi)啟系統(tǒng)的coredumpiY^a`/y+u!s????功能,來(lái)得到一個(gè)程序崩潰時(shí)的內(nèi)存信息,用來(lái)分析崩潰原因:*vyKpg(a/?P???? 在/etc/profile里加上(或者修改)一條:}M^ABc???? ulimit-c0?-{!SNAu;^~oZ???? 運(yùn)行命令:sysctl-w"kernel.core_name_format=/core
4、dump/%n.core"Ti&F8MFd*s???? 該命令意思是指core文件放在/coredump目錄下,文件名是進(jìn)程名+.core%wq.Z$n-`???? 2.DiskdumpX-BIdH)]av&xB+E???? diskdump工具提供了在單機(jī)上創(chuàng)建和采集vmcore(kernel7t)M#y/b`s]c????dump)的能力,而無(wú)須使用網(wǎng)絡(luò)。當(dāng)內(nèi)核本身出現(xiàn)崩潰的時(shí)候,當(dāng)前的內(nèi)存和CPU狀態(tài)以及相關(guān)的信息都會(huì)被保存到一個(gè)支持diskdump的磁盤(pán)上的保留分區(qū)上。在下一次重新啟動(dòng)的時(shí)候,當(dāng)系
5、統(tǒng)重新啟動(dòng),diskdump的初始化腳本會(huì)從保留分區(qū)中讀取保存的信息并創(chuàng)建一個(gè)vcore文件,然后這個(gè)文件被再次存放到/var/crash/目錄下,文件名為127.0.0.1-:ye7h:vwS*kZlR???? 如下是一個(gè)配置HPSCSI設(shè)備上啟用diskdump的過(guò)程,如果不是HPSCSI設(shè)備(即設(shè)備名為:r#yJA`2@B'`6r????/dev/sdX的形式),則無(wú)須執(zhí)行第三、四兩個(gè)步驟。但需要在第一步前先執(zhí)行命令:modprobe8k_2{X5
6、???? diskdumpx/ifzq7X????
7、 第一步:編輯/etc/sysconfig/diskdump文件,將一個(gè)空白分區(qū)的設(shè)備名填入后保存退出,例如:GH+H1bHj2Cj1q???? DEVICE=/dev/cciss/c0d0p2naF*c(_8ebp1O???? 第二步:初使化dump設(shè)備sO!cYNwsA,n??? #servicediskdumpinitialformat1Of&F3Krs.Y???? 警告:該分區(qū)的所以數(shù)據(jù)會(huì)丟失。"pd&A!fSRC???? 第三步:使用cciss_dump模塊替換當(dāng)前的cciss模塊:
8、6Z},D;lq&x???? 在/etc/modprobe.conf找到如下行:t'?J+^/IF%Go5o???? aliasscsi_hostadapterccissS6~WDAuhtK???? 修改為:
9、}tK7vs3lob6l???? aliasscsi_hostadaptercciss_dump7pPI7HK1PK*?u???? 再增加一行:R:r'y]r!U?s???? optionscciss_dumpdump_drive=1P~e7XO'M*g????
10、 注:假設(shè)diskdump文件中配置的為/dev/cciss/c0d[#a]p[#b],請(qǐng)?jiān)O(shè)置為:optionscciss_dumpdPI7I*g+V3ep????dump_drive=[#a]uZF4ku#T8T&Pd???? 第四步:重建initrd文件:ZfZq-C/Bpq???? #mv/boot/initrd-`uname-r`.img/boot/initrd-`uname-r`.img.old1~is;f!hr$wn3r){???? #mkinitrd/boot/initrd-`uname-r`
11、.img`uname-r`j#mL8Kn
12、6Cgk???? 第五步:設(shè)置diskdump服務(wù)能夠開(kāi)機(jī)自啟動(dòng):UY9if2`7h+t???? #chkconfig