回歸分析回歸診斷

回歸分析回歸診斷

ID:25144102

大?。?.29 MB

頁(yè)數(shù):120頁(yè)

時(shí)間:2018-11-18

回歸分析回歸診斷_第1頁(yè)
回歸分析回歸診斷_第2頁(yè)
回歸分析回歸診斷_第3頁(yè)
回歸分析回歸診斷_第4頁(yè)
回歸分析回歸診斷_第5頁(yè)
資源描述:

《回歸分析回歸診斷》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、回歸模型的診斷通過(guò)簡(jiǎn)單回歸和多元回歸模型可以有了計(jì)算結(jié)果。這些結(jié)果能做推斷,需要建立在一些概述性統(tǒng)計(jì)量的基礎(chǔ)之上,這些統(tǒng)計(jì)量由數(shù)據(jù)來(lái)計(jì)算。而只有當(dāng)標(biāo)準(zhǔn)的回歸假定滿足時(shí),所做的推斷才有可能是合理的,有意義的。而對(duì)假定的核定,可以用圖形的方法,也可以用嚴(yán)格的數(shù)值去檢查。數(shù)據(jù)也需要考慮還有模型的設(shè)定標(biāo)準(zhǔn)的回歸假定:1,關(guān)于模型設(shè)定的假定2,關(guān)于誤差的假定3,關(guān)于預(yù)測(cè)變量的假定非隨機(jī)的其取值是誤差取得的,但幾乎不可能。測(cè)量誤差將影響到誤差方差,相關(guān)系數(shù),復(fù)相關(guān)系數(shù)及回歸系數(shù)的估計(jì),其影響程度的大小取決于多個(gè)因素。是線性無(wú)關(guān)的4,

2、關(guān)于觀測(cè)的假定所有觀測(cè)是同樣可靠性數(shù)據(jù)的診斷異常值強(qiáng)影響點(diǎn)假定是否滿足 模型的診斷6線性回歸模型中的異常點(diǎn)分析異常點(diǎn)的識(shí)別與處理,是統(tǒng)計(jì)診斷中很重要的一項(xiàng)內(nèi)容。異常點(diǎn)的出現(xiàn)會(huì)影響分析結(jié)果的可信度。異常點(diǎn)的存在往往蘊(yùn)涵著重要的信息。在有些情況下,異常點(diǎn)的出現(xiàn)是因?yàn)橛行率挛锍霈F(xiàn)或者新情況發(fā)生,比如經(jīng)濟(jì)模型中某種經(jīng)濟(jì)政策的出臺(tái)等,都能表現(xiàn)出異常,這通常是我們的研究興趣所在。在另外一些情況下,異常點(diǎn)的出現(xiàn)是由于人為差錯(cuò)或者儀器的故障所引起的。在我們需要根據(jù)樣本對(duì)模型進(jìn)行參數(shù)估計(jì)或者根據(jù)模型對(duì)將來(lái)進(jìn)行預(yù)測(cè)與控制的時(shí)候,異常點(diǎn)的出現(xiàn)

3、會(huì)對(duì)我們的工作產(chǎn)生很強(qiáng)的影響,這樣的結(jié)果是令人懷疑的。因此,異常點(diǎn)的研究受到了廣大研究者的重視,自Bernoulli首次提出了異常點(diǎn)的概念,接下來(lái)對(duì)異常點(diǎn)的概念、類(lèi)型以及處理問(wèn)題的討論一直沒(méi)有停止過(guò)。異常點(diǎn)的成因與處理為什么會(huì)出現(xiàn)異常點(diǎn)?對(duì)這個(gè)問(wèn)題的回答大致可以歸結(jié)為以下三種情況:整體模型變化、局部模型變化和自然變異。在前兩種情況下,異常點(diǎn)出現(xiàn)的多而且連續(xù),往往蘊(yùn)涵著機(jī)制的變化、新事物的出現(xiàn)或者新局面的形成,大量而且連續(xù)的異常點(diǎn)可以用新的模型來(lái)擬合。對(duì)于整個(gè)數(shù)據(jù)集,實(shí)質(zhì)上已經(jīng)成為一個(gè)混合模型。而第三種成因更為常見(jiàn),偶爾的

4、人為差錯(cuò)或者儀器的故障都可以引起異常。對(duì)于由不同的原因引起的異常點(diǎn),它們的處理方法是不同的。在進(jìn)行統(tǒng)計(jì)診斷時(shí),判斷異常點(diǎn)的成因是很重要的,是對(duì)異常點(diǎn)進(jìn)行正確處理的先決條件。通常對(duì)異常值的處理方法有兩種。一種是把異常點(diǎn)作為工作重點(diǎn),目標(biāo)就是發(fā)現(xiàn)異常點(diǎn)并確定是否要作進(jìn)一步的研究,這樣的異常點(diǎn)往往含有很重要的信息。這時(shí)不僅要判斷出異常點(diǎn)的存在與否,還要確定異常點(diǎn)出現(xiàn)的位置以及影響大小。這是統(tǒng)計(jì)診斷中一個(gè)重要內(nèi)容,圍繞此類(lèi)問(wèn)題出現(xiàn)了大量的統(tǒng)計(jì)量檢驗(yàn)方法及影響分析研究。對(duì)于由第三種成因引起的異常點(diǎn),發(fā)現(xiàn)之后可以進(jìn)行刪除,以免影響參

5、數(shù)估計(jì)等以后的工作效果。另外一種方法就是對(duì)于異常點(diǎn)采取容忍的態(tài)度,把整個(gè)數(shù)據(jù)集作為研究的基礎(chǔ),對(duì)于一定比例的壞數(shù)據(jù)或者遠(yuǎn)離數(shù)據(jù)中心的數(shù)據(jù)采取一定的容忍或適應(yīng)政策回歸系數(shù)一般采用“最小二乘估計(jì)”(leastsquaresestimator,LSestimator)求解,但是在應(yīng)用中容易忽視的問(wèn)題是LS估計(jì)只有在數(shù)據(jù)滿足相應(yīng)條件的情況下才會(huì)具有統(tǒng)計(jì)描述和推斷的優(yōu)良性質(zhì),如要求誤差服從正態(tài)分布、總體方差相同且相互獨(dú)立等。當(dāng)實(shí)際數(shù)據(jù)沒(méi)有近似滿足這些假定時(shí),就會(huì)出現(xiàn)一些異常點(diǎn)(outliers)、杠桿點(diǎn)(leveragepoint

6、)及影響點(diǎn)(influentialobservations),使分析結(jié)果變得不可靠,不能發(fā)現(xiàn)數(shù)據(jù)中的真實(shí)結(jié)構(gòu),從專業(yè)上難以解釋結(jié)果,甚至得到完全錯(cuò)誤的結(jié)論。尤其是隨著統(tǒng)計(jì)軟件的日漸普及,我們傾向于簡(jiǎn)單地將數(shù)據(jù)交給軟件來(lái)分析,而不注意具體方法的應(yīng)用條件,盡管采用了SAS、SPSS這些國(guó)際標(biāo)準(zhǔn)軟件,但是輸出結(jié)果有時(shí)卻與專業(yè)解釋相悖。異常點(diǎn)在統(tǒng)計(jì)診斷中的地位異常點(diǎn)(outlier)是統(tǒng)計(jì)診斷中很重要的一個(gè)概念。統(tǒng)計(jì)診斷(StatisticalDiagnostics)就是對(duì)從實(shí)際問(wèn)題中收集起來(lái)的數(shù)據(jù)、提煉出來(lái)的模型以及由此出發(fā)所

7、作的推斷方法的合理性進(jìn)行深入而細(xì)致的分析,并通過(guò)一些診斷統(tǒng)計(jì)量來(lái)檢查數(shù)據(jù)、模型及推斷方法中可能存在的毛病,進(jìn)而提出治療方案,進(jìn)行模型或者推斷方法的改進(jìn)。統(tǒng)計(jì)診斷主要包括異常點(diǎn)識(shí)別、殘差分析、影響分析和數(shù)據(jù)變換等內(nèi)容,異常點(diǎn)的識(shí)別是處理統(tǒng)計(jì)診斷的重要內(nèi)容之一,它進(jìn)行的好壞通常影響到整個(gè)過(guò)程的診斷。異常值有時(shí)一個(gè),有時(shí)多個(gè)在回歸模型中,異常點(diǎn)是指對(duì)既定模型偏離很大的數(shù)據(jù)點(diǎn)。但究竟偏離達(dá)到何促程度才算是異常,這就必須對(duì)模型誤差項(xiàng)的分布有一定的假設(shè)(通常假定為正態(tài)分布)。目前對(duì)異常點(diǎn)有以下兩種較為流行的看法:異常點(diǎn)把異常點(diǎn)看成是

8、那些與數(shù)據(jù)集的主體明顯不協(xié)調(diào),使得研究者大感驚訝的數(shù)據(jù)點(diǎn)。這時(shí),異常點(diǎn)可解釋為所假定的分布中的極端點(diǎn),即落在分布的單側(cè)或雙側(cè)分位點(diǎn)以外的點(diǎn),而通常取很小的值(如:0.005),致使觀察者對(duì)數(shù)據(jù)中出現(xiàn)如此極端的點(diǎn)感到意外。把異常點(diǎn)視為雜質(zhì)點(diǎn)。它與數(shù)據(jù)集的主體不是來(lái)自同一分布,是在絕大多數(shù)來(lái)自某一共同分布的數(shù)據(jù)點(diǎn)中摻入的

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。