資源描述:
《多元線性回歸模型.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第四章多元線性回歸模型在一元線性回歸模型中,解釋變量只有一個(gè)。但在實(shí)際問(wèn)題中,影響因變量的變量可能不止一個(gè),比如根據(jù)經(jīng)濟(jì)學(xué)理論,人們對(duì)某種商品的需求不僅受該商品市場(chǎng)價(jià)格的影響,而且受其它商品價(jià)格以及人們可支配收入水平的制約;影響勞動(dòng)力勞動(dòng)供給意愿(用勞動(dòng)參與率度量)的因素不僅包括經(jīng)濟(jì)形勢(shì)(用失業(yè)率度量),而且包括勞動(dòng)實(shí)際工資;根據(jù)凱恩斯的流動(dòng)性偏好理論,影響人們貨幣需求的因素不僅包括人們的收入水平,而且包括利率水平等。當(dāng)解釋變量的個(gè)數(shù)由一個(gè)擴(kuò)展到兩個(gè)或兩個(gè)以上時(shí),一元線性回歸模型就擴(kuò)展為多元線性回歸模型。本章在理論分析中以二元線性回歸模型為例進(jìn)行。一、預(yù)備知識(shí)(一
2、)相關(guān)概念對(duì)于一個(gè)三變量總體,若由基礎(chǔ)理論,變量和變量之間存在因果關(guān)系,或的變異可用來(lái)解釋的變異。為檢驗(yàn)變量和變量之間因果關(guān)系是否存在、度量變量對(duì)變量影響的強(qiáng)弱與顯著性、以及利用解釋變量去預(yù)測(cè)因變量,引入多元回歸分析這一工具。將給定條件下的均值(4.1)定義為總體回歸函數(shù)(PopulationRegressionFunction,PRF)。定義為誤差項(xiàng)(errorterm),記為,即,這樣,或(4.2)(4.2)式稱為總體回歸模型或者隨機(jī)總體回歸函數(shù)。其中,稱為解釋變量(explanatoryvariable)或自變量(independentvariable);稱
3、為被解釋變量(explainedvariable)或因變量(dependentvariable);誤差項(xiàng)解釋了因變量的變動(dòng)中不能完全被自變量所解釋的部分。在總體回歸模型(4.2)中參數(shù)是未知的,是不可觀察的,統(tǒng)計(jì)計(jì)量分析的目標(biāo)之一就是估計(jì)模型的未知參數(shù)。給定一組隨機(jī)樣本,對(duì)(4.1)式進(jìn)行估計(jì),若的估計(jì)量分別記為,則定義(4.3)式為樣本回歸函數(shù)()(4.3)注意,樣本回歸函數(shù)隨著樣本的不同而不同,也就是說(shuō)是隨機(jī)變量,它們的隨機(jī)性是由于的隨機(jī)性(同一組可能對(duì)應(yīng)不同的)、各自的變異、以及之間的相關(guān)性共同引起的。定義為殘差項(xiàng)(residualterm),記為,即,這樣
4、,或()(4.4)(4.4)式稱為樣本回歸模型或者隨機(jī)樣本回歸函數(shù)。樣本回歸模型中殘差項(xiàng)可視為總體回歸模型中誤差項(xiàng)的估計(jì)量。(二)多元線性回歸模型的矩陣表示多元線性回歸模型的參數(shù)估計(jì)比一元線性回歸模型要復(fù)雜得多,為了便于計(jì)算和分析,便于將結(jié)果由三變量總體推廣到一般的多變量總體,引入矩陣這一工具簡(jiǎn)化計(jì)算和分析。設(shè)是取自總體的一組隨機(jī)樣本。在該組樣本下,總體回歸模型(4.2)式可以寫(xiě)成方程組的形式利用矩陣運(yùn)算,可表示為(4.5)記,,,則在該組樣本下,總體回歸模型的矩陣表示為(4.6)記,則樣本回歸模型的矩陣表示為(4.7)(三)模型假定假定1回歸模型是參數(shù)線性的,并
5、且是設(shè)定正確的。假定2隨機(jī)誤差項(xiàng)與解釋變量不相關(guān)。即,。如果解釋變量是非隨機(jī)的,則該假設(shè)自動(dòng)滿足。假定3零均值假定。即,假定4同方差假定。即,假定5無(wú)自相關(guān)假定。即兩個(gè)誤差項(xiàng)之間不相關(guān),,假定6解釋變量與之間不存在完全共線性,即兩個(gè)解釋變量之間無(wú)確切的的線性關(guān)系。假定7正態(tài)性假定。即~,(四)參數(shù)估計(jì)與估計(jì)量的分布系數(shù)向量的OLS估計(jì)為(4.8)其中,為的轉(zhuǎn)置矩陣。在隨機(jī)誤差項(xiàng)服從正態(tài)分布的假定下,系數(shù)向量的估計(jì)量也服從正態(tài)分布,即~(4.9)記的第j個(gè)主對(duì)角元素為,則~(4.10)有了系數(shù)估計(jì)量的分布,就可以對(duì)總體參數(shù)做假設(shè)檢驗(yàn)。與雙變量總體相同,總體誤差是不可
6、觀察的,因而其方差是未知的。若用的無(wú)偏估計(jì)量代替,則OLS估計(jì)量服從自由度為的t分布,而不是正態(tài)分布,即~(4.11)其中,,。(五)預(yù)測(cè)原理回歸分析的目的之一是利用回歸模型預(yù)測(cè)因變量。假設(shè)三變量總體的回歸模型為(4.2),即(4.2)在一組隨機(jī)樣本下,利用OLS求得樣本回歸函數(shù)為(4.3)()(4.3)給定樣本外一點(diǎn),則因變量的點(diǎn)預(yù)測(cè)為(4.12)點(diǎn)預(yù)測(cè)的標(biāo)準(zhǔn)誤為(4.13)因變量的置信度為的區(qū)間預(yù)測(cè)為[,](4.14)二、案例[案例1]Woody餐館的選址分析Woody餐館是一家價(jià)位適中、24小時(shí)營(yíng)業(yè)的家庭連鎖店,公司邀請(qǐng)你決策下一家連鎖店的選址問(wèn)題。你決定建
7、立一個(gè)回歸模型來(lái)解釋每一家連鎖餐館的毛銷售額Y(thegrosssalesvolume),通過(guò)文獻(xiàn)的閱讀,你認(rèn)為以下變量對(duì)毛銷售額的影響較大,N=競(jìng)爭(zhēng)變量:餐館位置半徑2里以內(nèi)市場(chǎng)直接競(jìng)爭(zhēng)者的數(shù)量;P=人口:餐館位置半徑3里以內(nèi)人口的數(shù)量;I=收入:餐館位置半徑3里以內(nèi)家庭平均收入。并且通過(guò)調(diào)研,你獲得了33家Woody餐館連鎖店的數(shù)據(jù)。[案例2]經(jīng)濟(jì)形勢(shì)和實(shí)際工資對(duì)人們工作意愿的影響在第三章,我們根據(jù)勞動(dòng)經(jīng)濟(jì)學(xué)理論,分析了經(jīng)濟(jì)形勢(shì)對(duì)人們工作意愿的影響存在兩種效應(yīng):受挫工人效應(yīng)和增加工人效應(yīng);并且利用1980-2002年的數(shù)據(jù)實(shí)證了受挫工人效應(yīng)占主導(dǎo)地位。但根據(jù)勞
8、動(dòng)經(jīng)濟(jì)學(xué)理