資源描述:
《大型網(wǎng)站架構(gòu)演變與知識體系》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、大型網(wǎng)站架構(gòu)演變和知識體系第一步:物理分離webserver和數(shù)據(jù)庫由于網(wǎng)站具備了一定的特色,吸引了部分人訪問,逐漸你發(fā)現(xiàn)系統(tǒng)的壓力越來越高,響應(yīng)速度越來越慢,而這個時候比較明顯的是數(shù)據(jù)庫和應(yīng)用互相影響,應(yīng)用出問題了,數(shù)據(jù)庫也很容易出現(xiàn)問題,而數(shù)據(jù)庫出問題的時候,應(yīng)用也容易出問題,于是進入了第一步演變階段:將應(yīng)用和數(shù)據(jù)庫從物理上分離,變成了兩臺機器,這個時候技術(shù)上沒有什么新的要求,但你發(fā)現(xiàn)確實起到效果了,系統(tǒng)又恢復(fù)到以前的響應(yīng)速度了,并且支撐住了更高的流量,并且不會因為數(shù)據(jù)庫和應(yīng)用形成互相的影響。這一步架構(gòu)演變對技術(shù)上的知識體系基本沒有要求。第二步:增加頁面緩存好景不長,隨著訪問的人
2、越來越多,你發(fā)現(xiàn)響應(yīng)速度又開始變慢了,查找原因,發(fā)現(xiàn)是訪問數(shù)據(jù)庫的操作太多,導(dǎo)致數(shù)據(jù)連接競爭激烈,所以響應(yīng)變慢,但數(shù)據(jù)庫連接又不能開太多,否則數(shù)據(jù)庫機器壓力會很高,因此考慮采用緩存機制來減少數(shù)據(jù)庫連接資源的競爭和對數(shù)據(jù)庫讀的壓力,這個時候首先也許會選擇采用squid等類似的機制來將系統(tǒng)中相對靜態(tài)的頁面(例如一兩天才會有更新的頁面)進行緩存(當(dāng)然,也可以采用將頁面靜態(tài)化的方案),這樣程序上可以不做修改,就能夠很好的減少對webserver的壓力以及減少數(shù)據(jù)庫連接資源的競爭,OK,于是開始采用squid來做相對靜態(tài)的頁面的緩存。這一步涉及到了這些知識體系:前端頁面緩存技術(shù),例如squid
3、,如想用好的話還得深入掌握下squid的實現(xiàn)方式以及緩存的失效算法等。第三步:增加頁面片段緩存增加了squid做緩存后,整體系統(tǒng)的速度確實是提升了,webserver的壓力也開始下降了,但隨著訪問量的增加,發(fā)現(xiàn)系統(tǒng)又開始變的有些慢了,在嘗到了squid之類的動態(tài)緩存帶來的好處后,開始想能不能讓現(xiàn)在那些動態(tài)頁面里相對靜態(tài)的部分也緩存起來呢,因此考慮采用類似ESI之類的頁面片段緩存策略,OK,于是開始采用ESI來做動態(tài)頁面中相對靜態(tài)的片段部分的緩存。這一步涉及到了這些知識體系:頁面片段緩存技術(shù),例如ESI等,想用好的話同樣需要掌握ESI的實現(xiàn)方式等;第四步:數(shù)據(jù)緩存在采用ESI之類的技術(shù)
4、再次提高了系統(tǒng)的緩存效果后,系統(tǒng)的壓力確實進一步降低了,但同樣,隨著訪問量的增加,系統(tǒng)還是開始變慢,經(jīng)過查找,可能會發(fā)現(xiàn)系統(tǒng)中存在一些重復(fù)獲取數(shù)據(jù)信息的地方,像獲取用戶信息等,這個時候開始考慮是不是可以將這些數(shù)據(jù)信息也緩存起來呢,于是將這些數(shù)據(jù)緩存到本地內(nèi)存,改變完畢后,完全符合預(yù)期,系統(tǒng)的響應(yīng)速度又恢復(fù)了,數(shù)據(jù)庫的壓力也再度降低了不少。這一步涉及到了這些知識體系:緩存技術(shù),包括像Map數(shù)據(jù)結(jié)構(gòu)、緩存算法、所選用的框架本身的實現(xiàn)機制等。第五步:增加webserver好景不長,發(fā)現(xiàn)隨著系統(tǒng)訪問量的再度增加,webserver機器的壓力在高峰期會上升到比較高,這個時候開始考慮增加一臺we
5、bserver,這也是為了同時解決可用性的問題,避免單臺的webserverdown機的話就沒法使用了,在做了這些考慮后,決定增加一臺webserver,增加一臺webserver時,會碰到一些問題,典型的有:1、如何讓訪問分配到這兩臺機器上,這個時候通常會考慮的方案是Apache自帶的負載均衡方案,或LVS這類的軟件負載均衡方案;2、如何保持狀態(tài)信息的同步,例如用戶session等,這個時候會考慮的方案有寫入數(shù)據(jù)庫、寫入存儲、或同步session信息等機制等;3、如何保持數(shù)據(jù)緩存信息的同步,例如之前緩存的用戶數(shù)據(jù)等,這個時候通常會考慮的機制有緩存同步或分布式緩存;4、如何讓上傳文件
6、這些類似的功能繼續(xù)正常,這個時候通常會考慮的機制是使用共享文件系統(tǒng)或存儲等;在解決了這些問題后,終于是把webserver增加為了兩臺,系統(tǒng)終于是又恢復(fù)到了以往的速度。這一步涉及到了這些知識體系:負載均衡技術(shù)(包括但不限于硬件負載均衡、軟件負載均衡、負載算法、linux轉(zhuǎn)發(fā)協(xié)議、所選用的技術(shù)的實現(xiàn)細節(jié)等)、主備技術(shù)(包括但不限于ARP欺騙、linuxheart-beat等)、狀態(tài)信息或緩存同步技術(shù)(包括但不限于技術(shù)、UDP協(xié)議、狀態(tài)信息廣播、所選用的緩存同步技術(shù)的實現(xiàn)細節(jié)等)、共享文件技術(shù)(包括但不限于NFS等)、存儲技術(shù)(包括但不限于存儲設(shè)備等)。第六步:分庫享受了一段時間的系統(tǒng)訪
7、問量高速增長的幸福后,發(fā)現(xiàn)系統(tǒng)又開始變慢了,這次又是什么狀況呢,經(jīng)過查找,發(fā)現(xiàn)數(shù)據(jù)庫寫入、更新的這些操作的部分數(shù)據(jù)庫連接的資源競爭非常激烈,導(dǎo)致了系統(tǒng)變慢,這下怎么辦呢,此時可選的方案有數(shù)據(jù)庫集群和分庫策略,集群方面像有些數(shù)據(jù)庫支持的并不是很好,因此分庫會成為比較普遍的策略,分庫也就意味著要對原有程序進行修改,一通修改實現(xiàn)分庫后,不錯,目標達到了,系統(tǒng)恢復(fù)甚至速度比以前還快了。這一步涉及到了這些知識體系:這一步更多的是需要從業(yè)務(wù)上做合理的劃分,以實現(xiàn)分庫,