資源描述:
《多重共線性論文:高維多重共線性數(shù)據(jù)的變量選擇問題》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、多重共線性論文:高維多重共線性數(shù)據(jù)的變量選擇問題【中文摘要】變量降維問題一直在統(tǒng)計研究學習以及實際應用領域起到至關重要的作用,對于存在多重共線性問題的數(shù)據(jù),一般的最小二乘方法基本失效。本文介紹了一般的共線性變量選擇方法包括懲罰的似然方法,如嶺估計,橋估計和一些降維方法,如主成分回歸,偏最小二乘回歸以及高維數(shù)據(jù)降維方法ElasticNet方法。本文從新的角度來解釋嶺回歸的懲罰作用,借助于這個方法我們?yōu)镋lasticNet方法l2懲罰部分增加了權重,本文也提供了兩種選擇權重的方法,在保證了變量選擇的有效性下,通過對實際數(shù)據(jù)以及模型的模擬驗證了其有效地減小了預測誤差
2、?!居⑽恼縑ariablesselectionplaysapivotalroleinthecontemporarystatisticallearn-ingandpracticalbackgrounds.Forcollinearity,ordinaryleastsquareregressiontendstobeinefficient.Somedimensionreductionmethodsareintroduced,suchaspenalizedlikelihoodridgeestimator,bridgeestimator,principalcompon
3、entre-gression,partialleastsquareregressionandhigh-dimensionalvariablesselectionmethodelasticnetmethod.Bygivinganewexplainationonridgepenalty,weaddtheweighttol2penaltyofelasticnetmethodandtwokindsofweightselectionmethodsareproposed.Therealdataperformanceandnumericalstimulationsin-di
4、catethatmeanpredictionerrorontheweightedelasticnetcanbeimproved.【關鍵詞】多重共線性嶺估計主成分回歸權重選擇ElasticNet【英文關鍵詞】collinearityridgeregressionprincipalcomponentregressionweightselctionElasticNet【目錄】高維多重共線性數(shù)據(jù)的變量選擇問題摘要8-9Abstract91引言10-151.1變量選擇方法的歷史回顧101.2高維變量選擇方法的回顧10-131.3多重共線性問題以及危害13-141.4文章
5、的結(jié)構14-152一般共線性的變量選擇方法15-222.1嶺估計15-182.1.1嶺估計的引入152.1.2嶺估計的新角度解釋15-172.1.3嶺估計與貝葉斯方法的聯(lián)系172.1.4嶺估計變量選擇的方法17-182.2主成分回歸與偏最小二乘方法18-202.2.1主成分回歸的提出與計算18-192.2.2偏最小二乘方法19-202.3BridgeEstimator20-222.3.1BridgeEstimator的提出202.3.2參數(shù)選擇方法20-212.3.3BridgeEstimator與貝葉斯方法的聯(lián)系21-223高維共線性數(shù)據(jù)參數(shù)估計以及變量選擇
6、方法22-293.1ElasticNet定義與解22-233.2與lasso的等價性23-243.3組效應24-253.4處理共線性問題25-263.5與貝葉斯方法的聯(lián)系26-273.6適應性的elasticnet方法及其大樣本性質(zhì)27-294實證分析與數(shù)值模擬29-354.1實證分析-前列腺癌樣本29-324.2數(shù)值模擬32-35參考文獻35-38致謝38-39學位論文評閱及答辯情況表39