資源描述:
《多重共線性和非線性回歸及解決方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、多重共線性和非線性回歸的問題?????(1)多重共線性問題???????我們都知道在進(jìn)行多元回歸的時(shí)候,特別是進(jìn)行經(jīng)濟(jì)上指標(biāo)回歸的時(shí)候,很多變量存在共同趨勢(shì)相關(guān)性,讓我們得不到希望的回歸模型。這里經(jīng)常用到的有三種方法,而不同的方法有不同的目的,我們分別來看看:???????第一個(gè),是最熟悉也是最方便的——逐步回歸法。??????逐步回歸法是根據(jù)自變量與因變量相關(guān)性的大小,將自變量一個(gè)一個(gè)選入方法中,并且每選入一個(gè)自變量都進(jìn)行一次檢驗(yàn)。最終留在模型里的自變量是對(duì)因變量有最大顯著性的,而剔除的自變量是與因變量無顯著線性相關(guān)性的,以及與其他自變量存在共線性的。用逐步回歸法做的多元回歸分析,通常自變量
2、不宜太多,一般十幾個(gè)以下,而且你的數(shù)據(jù)量要是變量個(gè)數(shù)3倍以上才可以,不然做出來的回歸模型誤差較大。比如說你有10個(gè)變量,數(shù)據(jù)只有15組,然后做擬合回歸,得到9個(gè)自變量的系數(shù),雖然可以得到,但是精度不高。這個(gè)方法我們不僅可以找到對(duì)因變量影響顯著的幾個(gè)自變量,還可以得到一個(gè)精確的預(yù)測(cè)模型,進(jìn)行預(yù)測(cè),這個(gè)非常重要的。而往往通過逐步回歸只能得到幾個(gè)自變量進(jìn)入方程中,有時(shí)甚至只有一兩個(gè),令我們非常失望,這是因?yàn)樽宰兞亢芏喽即嬖诠簿€性,被剔除了,這時(shí)可以通過第二個(gè)方法來做回歸。?????第二個(gè),通過因子分析(或主成分分析)再進(jìn)行回歸。?????這種方法用的也很多,而且可以很好的解決自變量間的多重共線性。首
3、先通過因子分析將幾個(gè)存在共線性的自變量合為一個(gè)因子,再用因子分析得到的幾個(gè)因子和因變量做回歸分析,這里的因子之間沒有顯著的線性相關(guān)性,根本談不上共線性的問題。通過這種方法可以得到哪個(gè)因子對(duì)因變量存在顯著的相關(guān)性,哪個(gè)因子沒有顯著的相關(guān)性,再從因子中的變量對(duì)因子的載荷來看,得知哪個(gè)變量對(duì)因變量的影響大小關(guān)系。而這個(gè)方法只能得到這些信息,第一它不是得到一個(gè)精確的,可以預(yù)測(cè)的回歸模型;第二這種方法不知道有顯著影響的因子中每個(gè)變量是不是都對(duì)因變量有顯著的影響,比如說因子分析得到三個(gè)因子,用這三個(gè)因子和因變量做回歸分析,得到第一和第二個(gè)因子對(duì)因變量有顯著的影響,而在第一個(gè)因子中有4個(gè)變量組成,第二個(gè)因子
4、有3個(gè)變量組成,這里就不知道這7個(gè)變量是否都對(duì)因變量存在顯著的影響;第三它不能得到每個(gè)變量對(duì)因變量準(zhǔn)確的影響大小關(guān)系,而我們可以通過逐步回歸法直觀的看到自變量前面的系數(shù)大小,從而判斷自變量對(duì)因變量影響的大小。?????第三個(gè),嶺回歸。?????通過逐步回歸時(shí),我們可能得到幾個(gè)自變量進(jìn)入方程中,但是有時(shí)會(huì)出現(xiàn)自變量影響的方向出現(xiàn)錯(cuò)誤,比如第一產(chǎn)業(yè)的產(chǎn)值對(duì)國民收入是正效應(yīng),而可能方程中的系數(shù)為負(fù)的,這種肯定是由于共線性導(dǎo)致出現(xiàn)了擬合失真的結(jié)果,而這樣的結(jié)果我們只能通過自己的經(jīng)驗(yàn)去判斷。通常我們?cè)谧鲇绊懸蛩嘏袛嗟臅r(shí)候,不僅希望得到各個(gè)因素對(duì)因變量真實(shí)的影響關(guān)系,還希望知道準(zhǔn)確的影響大小,就是每個(gè)自變
5、量系數(shù)的大小,這個(gè)時(shí)候,我們就可以通過嶺回歸的方法。???????嶺回歸是在自變量信息矩陣的主對(duì)角線元素上人為地加入一個(gè)非負(fù)因子k,從而使回歸系數(shù)的估計(jì)稍有偏差、而估計(jì)的穩(wěn)定性卻可能明顯提高的一種回歸分析方法,它是最小二乘法的一種補(bǔ)充,嶺回歸可以修復(fù)病態(tài)矩陣,達(dá)到較好的效果。在SPSS中沒有提供嶺回歸的模塊,可以直接點(diǎn)擊使用,只能通過編程來實(shí)現(xiàn),當(dāng)然在SAS、Matlab中也可以實(shí)現(xiàn)。做嶺回歸的時(shí)候,需要進(jìn)行多次調(diào)試,選擇適當(dāng)?shù)膋值,才能得到比較滿意的方程,現(xiàn)在這個(gè)方法應(yīng)用越來越普遍。在07年的時(shí)候,我的一個(gè)老師還覺得這個(gè)方法是他的看家本領(lǐng),但是現(xiàn)在很多人都會(huì)這個(gè)方法,而且用的越來越多了,得到
6、的結(jié)果也非常合理。??????????特別提醒的是:多重共線性說的是變量之間線性關(guān)系,和非線性不要混淆了。多組變量之間兩種極端的關(guān)系是完全多重共線性關(guān)系和完全非線性關(guān)系,即完全是平行直線的關(guān)系和完全無規(guī)則的曲線關(guān)系(是什么形狀,還真不好形容,自己悟去吧^_^)。當(dāng)然解決多重共線性問題的方法還有,比如差分微分模型,應(yīng)用的很少,我估計(jì)是非常專業(yè)的人才會(huì)用的吧,呵呵,反正我不會(huì)這個(gè)方法。接下來說說非線性回歸。??????(2)非線性回歸的問題。??????非線性回歸,顧名思義自變量和因變量是非線性的關(guān)系,比如平方、次方等等,但是大多數(shù)的非線性方程都可以轉(zhuǎn)換成線性的方程,比如我們通常知道的二次函數(shù):y
7、=a0+a1*x+a2*x^2,這里就可以轉(zhuǎn)換成線性方程,首先將x^2計(jì)算得到x1,方程就變成y=a0+a1*x+a2*x1,而這個(gè)方程就是我們一般見到的多元線性回歸,直接進(jìn)行線性擬合就可以了。??????這里需要特別提醒的是:我說的可以轉(zhuǎn)換成線性的非線性方程,是一元非線性方程,而不是多元非線性方程。我們知道在SPSS回歸分析中有單獨(dú)一個(gè)模塊叫曲線估計(jì),它里面提供的11個(gè)非線性模型都是可以轉(zhuǎn)換成線