資源描述:
《ibm紅皮書上翻譯的hacmp原理2》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、2.3.??????HACMP心跳和其他許多類型的集群一樣,心跳用來檢測網(wǎng)絡(luò)接口,通信設(shè)備,IP標(biāo)簽(服務(wù)的,非服務(wù)的,永久性的IP)以及節(jié)點(diǎn)本身的可用性。從HACMPV5.1開始,心跳是專有的,基于RSCT拓?fù)涞姆?wù)(這樣,HACMPV5.1僅有的增強(qiáng)的可擴(kuò)展性,經(jīng)典的通過網(wǎng)絡(luò)模塊的心跳,直接被集群管理后臺(tái)控制)心跳是通過集群中每兩個(gè)節(jié)點(diǎn)間的每個(gè)通信設(shè)備傳遞和交換的信息(?;顢?shù)據(jù)包)。每一個(gè)集群中的節(jié)點(diǎn)定時(shí)的間隔發(fā)送心跳信號(hào)到其他節(jié)點(diǎn),并且預(yù)期的接受心跳信號(hào)從相應(yīng)的節(jié)點(diǎn)。如果接受的信號(hào)中斷了,RSCT認(rèn)可這一個(gè)錯(cuò)誤并告訴H
2、ACMP,HACMP將執(zhí)行合適的恢復(fù)動(dòng)作。心跳信息可以通過兩種網(wǎng)絡(luò)傳送:???????TCP/IP網(wǎng)絡(luò)???????點(diǎn)到點(diǎn)非IP網(wǎng)絡(luò)為了避免HACMP集群的分離,HACMP必須能區(qū)分節(jié)點(diǎn)故障和TCP/IP網(wǎng)絡(luò)故障。TCP/IP網(wǎng)絡(luò)可以因?yàn)椴煌昝赖木W(wǎng)絡(luò)元素(交換機(jī),集線器和電纜等)而發(fā)生故障,當(dāng)這種情況發(fā)生時(shí),集群中的節(jié)點(diǎn)不能通過IP發(fā)送心跳信號(hào),所以每個(gè)節(jié)點(diǎn)考慮到對(duì)方節(jié)點(diǎn)故障而都去嘗試獲得資源,這將導(dǎo)致一個(gè)潛在數(shù)據(jù)問題,特別是使用了并發(fā)的資源組時(shí)。非IP網(wǎng)絡(luò)是在兩個(gè)節(jié)點(diǎn)間直接的點(diǎn)對(duì)點(diǎn)連接,不再使用IP進(jìn)行心跳信號(hào)的交換,也因
3、此減少了IP網(wǎng)絡(luò)的故障帶來的問題。假如這樣的網(wǎng)絡(luò)類型使用了,那么當(dāng)IP網(wǎng)絡(luò)故障時(shí),節(jié)點(diǎn)仍然可以交換信息,可以判定網(wǎng)絡(luò)故障而不會(huì)發(fā)生資源組的接管操作。為了避免HACMP被分開,我們推薦配置冗余的網(wǎng)絡(luò)(IP網(wǎng)絡(luò)和非IP網(wǎng)絡(luò)),同時(shí)使用這兩種網(wǎng)絡(luò)。建議使用的兩個(gè)節(jié)點(diǎn)的群集參見Figure2-3。2.3.1.??????通過磁盤的心跳信號(hào)通過磁盤的心跳是HACMPV5.1的新特性,提供了對(duì)防止集群分割和單個(gè)非IP網(wǎng)絡(luò)的附加的保護(hù),特別是當(dāng)RS-232和tmssa、tmscsi等連接太復(fù)雜或無法實(shí)現(xiàn)時(shí)。這種類型的網(wǎng)絡(luò)可以使用許多類型的
4、共享磁盤存儲(chǔ)(光纖通道,SSA和SCSI等),磁盤用來交換KA信息的一段只是作為AIX增強(qiáng)并發(fā)卷組的一部分,它不是排外性的僅作為這個(gè)目的使用,它們?nèi)匀豢梢杂脕泶尜A應(yīng)用共享的數(shù)據(jù)??蛻粜枰褂媚繕?biāo)模式的光纖通道連接,但是對(duì)于異構(gòu)的FC環(huán)境(adapter,存儲(chǔ)子系統(tǒng),SAN交換機(jī)),這將很難實(shí)施和支持。使用共享磁盤來交換信息是更可靠的非IP網(wǎng)絡(luò),并且不依賴于特定的硬件。此外,在一個(gè)SAN環(huán)境中,當(dāng)使用光纖連接設(shè)備,非IP網(wǎng)絡(luò)的光纖的長度僅僅是SAN的限制,因此允許非常長的點(diǎn)對(duì)點(diǎn)的網(wǎng)絡(luò)。當(dāng)定義一個(gè)磁盤作為增強(qiáng)的并發(fā)卷組,這個(gè)磁盤
5、的一部分(一部分扇區(qū))將不能給lvm使用,將用來在兩個(gè)節(jié)點(diǎn)間交換信息。使用基于磁盤的心跳的詳細(xì)說明如下:???????一個(gè)磁盤可以用來做兩個(gè)節(jié)點(diǎn)間的一個(gè)網(wǎng)絡(luò),這個(gè)磁盤在兩個(gè)節(jié)點(diǎn)上使用相同的唯一的特定的標(biāo)識(shí)的PVID。???????推薦在一個(gè)存儲(chǔ)范圍內(nèi)的一對(duì)節(jié)點(diǎn)間(或者一個(gè)磁盤柜)的一個(gè)磁盤配置磁盤心跳網(wǎng)絡(luò)。???????該磁盤需要是增強(qiáng)并發(fā)卷組的一部分,雖然并不要求卷組激活或者是資源組的一部分。僅僅的限制是VG必須同時(shí)定義在兩個(gè)節(jié)點(diǎn)上。注意:集群中并發(fā)卷組的鎖機(jī)制不再需要保留磁盤的一部分來通信,而是以RSCT組服務(wù)替代。2.
6、3.2.??????通過IP別名的心跳對(duì)于IP網(wǎng)絡(luò),引入了一個(gè)新的心跳機(jī)制:通過IP別名的心跳。這使得集群不再需要或者可能再改變通信接口基本IP地址。在IP別名上的心跳信號(hào)是配置在當(dāng)HACMP服務(wù)啟動(dòng)時(shí)已經(jīng)存在的IP地址上的。用來做這個(gè)的IP地址子網(wǎng)必須和已存在的每一個(gè)IP子網(wǎng)都不相同,并且不被定義在(/etc/hosts,BIND等)名稱解析中。這樣的配置不需要一個(gè)附加的可路由的子網(wǎng)。作為基礎(chǔ)和引導(dǎo)IP地址交換心跳信息的替代,RSCT使用HACMP定義的IP別名去完成每一個(gè)通信接口的通信組(心跳環(huán))。注意:當(dāng)使用了IP別名
7、的心跳,基本/引導(dǎo)IP地址不再被RSCT拓?fù)浞?wù)監(jiān)控,將通過分配的IP別名去監(jiān)控這些通信接口。雖然有這些技術(shù),HACMP仍然需要所有接口可以和其他接口通信(可以看到節(jié)點(diǎn)的每一個(gè)MAC地址)。IP別名使用的子網(wǎng)掩碼和服務(wù)IP之一的掩碼一致。當(dāng)定義用來做心跳的IP地址時(shí),你必須保證有足夠的子網(wǎng)可用并不會(huì)沖突。例如:在三個(gè)網(wǎng)卡每節(jié)點(diǎn)的三節(jié)點(diǎn)集群中,你需要三個(gè)非路由的子網(wǎng)。參考圖2-4和2-5。假定每一個(gè)節(jié)點(diǎn)有三個(gè)網(wǎng)卡(en0,en1,en2),網(wǎng)絡(luò)掩碼是255.255.255.0,那么分配給每一個(gè)接口的別名如下表:adapter/
8、node??????????node1????????????????node2????????????????node3en0????????????????172.16.100.1??????172.16.100.2??????172.16.100.3en1??????????????