資源描述:
《基于模型驅(qū)動數(shù)據(jù)挖掘的低阻油層識別方法.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、大慶石油學(xué)院學(xué)報第34卷第4期2010年8月JOURNALOFDAQINGPETROIEUMINSTITUTEVo1.34No.4Aug.2010基于模型驅(qū)動數(shù)據(jù)挖掘的低阻油層識別方法朱麗萍,李雄炎。,李洪奇。(1.中國石油大學(xué)(北京)計算機(jī)科學(xué)與技術(shù)系,北京102249;2.中國石油大學(xué)(北京)油氣資源與探測國家重點(diǎn)實驗室,北京102249;3.中國石油大學(xué)(北京)地球探測與信息技術(shù)北京市重點(diǎn)實驗室,北京102249)摘要:基于多參數(shù)信息的低阻油層的識別屬于高維、非線性的模式識別問題.結(jié)合研究工區(qū)低阻油層儲層特征,
2、分析研究工區(qū)構(gòu)造和沉積特征,以數(shù)據(jù)挖掘方法為基礎(chǔ),確定模型驅(qū)動數(shù)據(jù)挖掘的理論框架;以測井、巖心和試油的相關(guān)信息為源數(shù)據(jù),利用聚類和關(guān)聯(lián)分析獲取敏感參數(shù);以敏感參數(shù)為核心,采用決策樹、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)方法獲得多參數(shù)組合的預(yù)測模型,并結(jié)合參數(shù)的物理含義和低阻油層的實際特征,對預(yù)測模型進(jìn)行修正,改進(jìn)預(yù)測模型的實用性.結(jié)果表明:利用模型驅(qū)動數(shù)據(jù)挖掘方法得到的最優(yōu)預(yù)測模型,預(yù)測研究工區(qū)的低阻油層的識別準(zhǔn)確率為9O.05%.關(guān)鍵詞:模型驅(qū)動;數(shù)據(jù)挖掘;低阻油層;儲層預(yù)測;特征參數(shù);預(yù)測模型;識別中圖分類號:T
3、EI9文獻(xiàn)標(biāo)識碼:A文童編號:1000一i89I(201O)O4—0030一O50引言20世紀(jì)9O年代以來,由于低阻油層分布廣、儲量大、評價難、易遺漏,一直受到普遍的關(guān)注,是老井復(fù)查、二次開發(fā)、多次開發(fā)、高成熟精細(xì)勘探階段的主要目標(biāo)_】j.根據(jù)區(qū)塊地質(zhì)特征,定義低阻油層,形成基于低阻油層成因機(jī)理研究的低阻油層識別方法l_2,同時分類歸納算法中的支持向量機(jī)在低阻油層的識別中也有不同程度的應(yīng)用].由于實際地質(zhì)特征的復(fù)雜性和測井曲線的模糊性,使得基于成因機(jī)理的測井解釋模型存在較大依賴性,反映在方法上是誤差較大、評價及識別的
4、準(zhǔn)確率較低.由于算法單一,基于支持向量機(jī)的識別方法僅考慮數(shù)據(jù)驅(qū)動,沒有與地質(zhì)和地球物理背景有效結(jié)合完善預(yù)測模型.因此,盡管支持向量機(jī)對小樣本具有較強(qiáng)的學(xué)習(xí)和泛化能力,獲得較高的識別率,但對未知領(lǐng)域低阻油層的發(fā)現(xiàn)缺乏指導(dǎo)意義.?dāng)?shù)據(jù)挖掘技術(shù)在油藏管理和油藏描述、提高采收率、精細(xì)勘探、地學(xué)數(shù)據(jù)處理等方面有不同程度的應(yīng)用[。,可是沒有形成系統(tǒng)的挖掘思路,受數(shù)據(jù)源的有限性和方法的單一性制約,并未在地質(zhì)和地球物理背景下取得實質(zhì)性的挖掘成果.筆者考慮模型驅(qū)動,形成模型驅(qū)動數(shù)據(jù)挖掘的理論框架,根據(jù)研究工區(qū)低阻油層的特征,以系統(tǒng)挖掘作
5、為指導(dǎo),最大限度地獲取各種屬性之間的內(nèi)在聯(lián)系,生成預(yù)測低阻油層的模型,這對研究工區(qū)低阻油層的勘探開發(fā)具有一定的理論和實踐意義.1基本原理1.1模型驅(qū)動數(shù)據(jù)挖掘’數(shù)據(jù)挖掘(DataMining)出現(xiàn)于2O世紀(jì)8O年代后期,是從海量數(shù)據(jù)中獲取正確的、新穎的、潛在有用的、最終可理解的模式的非平凡過程口.在數(shù)據(jù)挖掘的早期研究中,算法的高效性和工具的靈活性是人們熱衷的對象,但是現(xiàn)實世界中的各種限制被忽略了,致使考慮數(shù)據(jù)驅(qū)動所獲取的知識大部分不具有實用性.為了克服數(shù)據(jù)挖掘算法和工具的“高效”與所獲取知識的“低能”之間的矛盾,“領(lǐng)
6、域驅(qū)動數(shù)據(jù)挖掘(Do—main—DrivenDataMining)”被提出l1,即將相關(guān)領(lǐng)域的先驗知識作為附屬條件,使其參與挖掘過程,利收稿日期:2OlO一03—26;審稿人:袁滿;編輯:任志平基金項目:國家高新技術(shù)研究發(fā)展計劃863項目(2009AA062802)作者簡介:朱麗萍(1973),女,碩士,副教授,主要從事數(shù)據(jù)挖掘、計算機(jī)網(wǎng)絡(luò)方面的研究·3O·第4期朱麗萍等:基于模型驅(qū)動數(shù)據(jù)挖掘的低阻油層識別方法用該條件的限制作用,對所獲取知識的實用性進(jìn)行檢驗,確保最終挖掘所得知識對于目標(biāo)事物具有足夠的有效性.對儲層評
7、價和流體識別領(lǐng)域,各種解釋和評價模型蘊(yùn)含著豐富的領(lǐng)域知識,因此傳統(tǒng)的解釋和評價模型可以作為儲層評價和流體識別領(lǐng)域的背景知識,參與和限制整個挖掘過程,將其有效地融合于數(shù)據(jù)挖掘的理論框架中,即“模型驅(qū)動數(shù)據(jù)挖掘”,其主要方法有聚類分析、關(guān)聯(lián)分析和分類歸納等算法.1.1.1聚類分析將物理或抽象對象的集合分成相似的對象類的過程稱為聚類,它是一種在無監(jiān)督的情況下根據(jù)對象問的相似程度自動地將其分割為一組有意義的類的處理過程口.無監(jiān)督是指待分類對象沒有預(yù)先給定的類標(biāo)識;有意義是指聚類的結(jié)果應(yīng)該反映原始數(shù)據(jù)的自然結(jié)構(gòu)特征.聚類分析的
8、三要素為相似性測度、聚類準(zhǔn)則和聚類算法.對單一屬性,聚類分析可以通過聚類而間接實現(xiàn)連續(xù)型數(shù)據(jù)的離散化,是一種數(shù)據(jù)歸約的形式,即以區(qū)間的形式分割數(shù)據(jù);對多個屬性,聚類分析按不同的試油結(jié)論進(jìn)行聚類,可以間接獲取不同參數(shù)組合對目標(biāo)儲層的敏感性.1.1.2關(guān)聯(lián)分析關(guān)聯(lián)分析是發(fā)現(xiàn)無明確因果關(guān)系的屬性之間內(nèi)在聯(lián)系最有效的方法之一,以支持度和置信度為主、提升