資源描述:
《linux 進(jìn)程的內(nèi)存布局》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、內(nèi)存管理模塊是操作系統(tǒng)的心臟;它對(duì)應(yīng)用程序和系統(tǒng)管理非常重要。今后的幾篇文章中,我將著眼于實(shí)際的內(nèi)存問題,但也不避諱其中的技術(shù)內(nèi)幕。由于不少概念是通用的,所以文中大部分例子取自32位x86平臺(tái)的Linux和Windows系統(tǒng)。本系列第一篇文章講述應(yīng)用程序的內(nèi)存布局。????在多任務(wù)操作系統(tǒng)中的每一個(gè)進(jìn)程都運(yùn)行在一個(gè)屬于它自己的內(nèi)存沙盤中。這個(gè)沙盤就是虛擬地址空間(virtualaddressspace),在32位模式下它總是一個(gè)4GB的內(nèi)存地址塊。這些虛擬地址通過頁表(pagetable)映射到物理內(nèi)存,頁表由操作系統(tǒng)維護(hù)并被處理器引用。每一個(gè)進(jìn)程擁有一套屬
2、于它自己的頁表,但是還有一個(gè)隱情。只要虛擬地址被使能,那么它就會(huì)作用于這臺(tái)機(jī)器上運(yùn)行的所有軟件,包括內(nèi)核本身。因此一部分虛擬地址必須保留給內(nèi)核使用:這并不意味著內(nèi)核使用了那么多的物理內(nèi)存,僅表示它可支配這么大的地址空間,可根據(jù)內(nèi)核需要,將其映射到物理內(nèi)存。內(nèi)核空間在頁表中擁有較高的特權(quán)級(jí)(ring2或以下),因此只要用戶態(tài)的程序試圖訪問這些頁,就會(huì)導(dǎo)致一個(gè)頁錯(cuò)誤(pagefault)。在Linux中,內(nèi)核空間是持續(xù)存在的,并且在所有進(jìn)程中都映射到同樣的物理內(nèi)存。內(nèi)核代碼和數(shù)據(jù)總是可尋址的,隨時(shí)準(zhǔn)備處理中斷和系統(tǒng)調(diào)用。與此相反,用戶模式地址空間的映射隨進(jìn)程切換
3、的發(fā)生而不斷變化:色區(qū)域表示映射到物理內(nèi)存的虛擬地址,而白色區(qū)域表示未映射的部分。在上面的例子中,F(xiàn)irefox使用了相當(dāng)多的虛擬地址空間,因?yàn)樗莻髡f中的吃內(nèi)存大戶。地址空間中的各個(gè)條帶對(duì)應(yīng)于不同的內(nèi)存段(memorysegment),如:堆、棧之類的。記住,這些段只是簡單的內(nèi)存地址范圍,與Intel處理器的段沒有關(guān)系。不管怎樣,下面是一個(gè)Linux進(jìn)程的標(biāo)準(zhǔn)的內(nèi)存段布局:當(dāng)計(jì)算機(jī)開心、安全、可愛、正常的運(yùn)轉(zhuǎn)時(shí),幾乎每一個(gè)進(jìn)程的各個(gè)段的起始虛擬地址都與上圖完全一致,這也給遠(yuǎn)程發(fā)掘程序安全漏洞打開了方便之門。一個(gè)發(fā)掘過程往往需要引用絕對(duì)內(nèi)存地址:棧地址,庫函
4、數(shù)地址等。遠(yuǎn)程攻擊者必須依賴地址空間布局的一致性,摸索著選擇這些地址。如果讓他們猜個(gè)正著,有人就會(huì)被整了。因此,地址空間的隨機(jī)排布方式逐漸流行起來。Linux通過對(duì)棧內(nèi)存映射段、堆的起始地址加上隨機(jī)的偏移量來打亂布局。不幸的是,32位地址空間相當(dāng)緊湊,給隨機(jī)化所留下的空當(dāng)不大,削弱了這種技巧的效果。進(jìn)程地址空間中最頂部的段是棧,大多數(shù)編程語言將之用于存儲(chǔ)局部變量和函數(shù)參數(shù)。調(diào)用一個(gè)方法或函數(shù)會(huì)將一個(gè)新的棧楨(stackframe)壓入棧中。棧楨在函數(shù)返回時(shí)被清理。也許是因?yàn)閿?shù)據(jù)嚴(yán)格的遵從LIFO的順序,這個(gè)簡單的設(shè)計(jì)意味著不必使用復(fù)雜的數(shù)據(jù)結(jié)構(gòu)來追蹤棧的內(nèi)容
5、,只需要一個(gè)簡單的指針指向棧的頂端即可。因此壓棧(pushing)和退棧(popping)過程非常迅速、準(zhǔn)確。另外,持續(xù)的重用棧空間有助于使活躍的棧內(nèi)存保持在CPU緩存中,從而加速訪問。進(jìn)程中的每一個(gè)線程都有屬于自己的棧。通過不斷向棧中壓入的數(shù)據(jù),超出其容量就有會(huì)耗盡棧所對(duì)應(yīng)的內(nèi)存區(qū)域。這將觸發(fā)一個(gè)頁故障(pagefault),并被Linux的expand_stack()處理,它會(huì)調(diào)用acct_stack_growth()來檢查是否還有合適的地方用于棧的增長。如果棧的大小低于RLIMIT_STACK(通常是8MB),那么一般情況下棧會(huì)被加長,程序繼續(xù)愉快的運(yùn)
6、行,感覺不到發(fā)生了什么事情。這是一種將棧擴(kuò)展至所需大小的常規(guī)機(jī)制。然而,如果達(dá)到了最大的??臻g大小,就會(huì)棧溢出(stackoverflow),程序收到一個(gè)段錯(cuò)誤(SegmentationFault)。當(dāng)映射了的棧區(qū)域擴(kuò)展到所需的大小后,它就不會(huì)再收縮回去,即使棧不那么滿了。這就好比聯(lián)邦預(yù)算,它總是在增長的。動(dòng)態(tài)棧增長是唯一一種訪問未映射內(nèi)存區(qū)域(圖中白色區(qū)域)而被允許的情形。其它任何對(duì)未映射內(nèi)存區(qū)域的訪問都會(huì)觸發(fā)頁故障,從而導(dǎo)致段錯(cuò)誤。一些被映射的區(qū)域是只讀的,因此企圖寫這些區(qū)域也會(huì)導(dǎo)致段錯(cuò)誤。在棧的下方,是我們的內(nèi)存映射段。此處,內(nèi)核將文件的內(nèi)容直接映射到
7、內(nèi)存。任何應(yīng)用程序都可以通過Linux的mmap()系統(tǒng)調(diào)用(實(shí)現(xiàn))或Windows的CreateFileMapping()/MapViewOfFile()請(qǐng)求這種映射。內(nèi)存映射是一種方便高效的文件I/O方式,所以它被用于加載動(dòng)態(tài)庫。創(chuàng)建一個(gè)不對(duì)應(yīng)于任何文件的匿名內(nèi)存映射也是可能的,此方法用于存放程序的數(shù)據(jù)。在Linux中,如果你通過malloc()請(qǐng)求一大塊內(nèi)存,C運(yùn)行庫將會(huì)創(chuàng)建這樣一個(gè)匿名映射而不是使用堆內(nèi)存?!髩K’意味著比MMAP_THRESHOLD還大,缺省是128KB,可以通過mallopt()調(diào)整。說到堆,它是接下來的一塊地址空間。與棧一樣,堆
8、用于運(yùn)行時(shí)內(nèi)存分配;但不同點(diǎn)是,堆用于存儲(chǔ)那些生存期