資源描述:
《生物統(tǒng)計第七章 擬合優(yōu)度檢驗》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、擬合優(yōu)度檢驗一、一般原理(一)什么是擬合優(yōu)度檢驗?擬合優(yōu)度檢驗(goodnessoffittest)是用來檢驗實際觀測數(shù)據(jù)與依照某種假設(shè)或模型計算出來的理論數(shù)之間的一致性,以便判斷該假設(shè)或模型是否與觀測數(shù)相配合。(二)主要內(nèi)容和注意事項1.主要內(nèi)容1)一致性檢驗根據(jù)某一假設(shè)或模型檢驗觀測數(shù)與理論數(shù)的一致性。例如:A:判斷按照回歸方程的預測值與實際值之間的符合程度。B:某一組數(shù)據(jù)的正態(tài)性檢驗。2)獨立性檢驗根據(jù)檢驗兩組數(shù)據(jù)之間的關(guān)聯(lián)性或差異性來判斷事件之間的獨立性——沒有假設(shè)和理論值。如:A:遺傳學中檢驗子二代花色分離差異性檢驗。B:對照和處理之間的差異性檢驗。2.注意事項1)對上
2、述兩種類型的檢驗均用χ2檢驗來實現(xiàn)。注意與顯著性檢驗時的χ2檢驗的區(qū)別。2)χ2檢驗主要應用于次數(shù)資料的檢驗。3)χ2檢驗也會出現(xiàn)兩種類型錯誤。K.Pearson根據(jù)的定義,根據(jù)屬性性狀資料的分布,推導出用于次數(shù)資料分析的公式上式中O為觀察次數(shù),E為理論次數(shù),自由度為df.(三)χ2統(tǒng)計量的計算卡方分布~圖7-1幾個自由度的概率分布密度曲線由于分布是連續(xù)性的分布,而次數(shù)資料則是間斷性的,所以用上式計得的值總是偏大,尤其當自由度df=1時,這種偏差會較大,故在計算時需要用的連續(xù)性矯正公式:當自由度大于1時,這時,可不作連續(xù)性矯正,但要求各組內(nèi)的理論次數(shù)不小于5。若某組的理論次數(shù)小于
3、5,則應把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止。(三)擬合優(yōu)度檢驗的一般程序1.分組2.計算理論值3.估計參數(shù)4.判斷理論數(shù)的數(shù)目5.計算自由度:df=k-1-α6.假設(shè)7.計算統(tǒng)計量,作出判斷四、適合性檢驗檢驗實得次數(shù)資料的次數(shù)與假設(shè)的理論次數(shù)是否相互符合的檢驗稱為適合性檢驗。在適合性檢驗中,理論次數(shù)和自由度的計算:Ei=npidf=k-m在適合性檢驗中,無效假設(shè)為H0:實際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說;備擇假設(shè)為HA:實際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說。并在無效假設(shè)成立的條件下,按已知屬性類別分配的理論或?qū)W說計算各屬性
4、類別的理論次數(shù)。因所計算得的各個屬性類別理論次數(shù)的總和應等于各個屬性類別實際觀察次數(shù)的總和,即獨立的理論次數(shù)的個數(shù)等于屬性類別分類數(shù)減1。也就是說,適合性檢驗的自由度等于屬性類別分類數(shù)減1。(一)適合性檢驗的基本步驟1、建立假設(shè)。即無效假設(shè)和備擇假設(shè):H0:符合假設(shè)的總體分布,HA:不符合假設(shè)的總體分布。2確定顯著水平3計算。在無效假設(shè)為正確的前提下,計算值。與查表得的值進行比較4結(jié)論,如果<接受H0,否定HA(二)次數(shù)資料的適合性檢驗1、k=2組次數(shù)資料的適合性檢驗這種資料僅分成2組,即k=2,其總體分布為二項總體分布。無效假設(shè)H0:符合假設(shè)的二項分布,對HA:部符合假設(shè)的二項
5、分布。由于受到理論總次數(shù)等于實際總次數(shù)這一條件的限制,即∑Ei=N,因而約束條件數(shù)m=1,自由度df=2-1=1.故需用矯正公式。例8.1海棠種子發(fā)芽試驗的結(jié)果列于下表,試檢驗該樣本所屬的二項總體與假設(shè)發(fā)芽率p=0.90的二項總體分布之間有無顯著差異分組實際次數(shù)理論概率理論次數(shù)種子發(fā)芽種子不發(fā)芽352480.900.1036040合計4001.00400(1)直接法統(tǒng)計假設(shè):H0:符合假設(shè)p=0.90的二項分布;HA:不符合假設(shè)p=0.90的二項分布顯著水平:α=0.05檢驗計算:=1.5625df=2-1=1查分布表得右尾臨界值=3.84推斷:因=1.5625<=3.84故接受
6、H0,否定HA,即該批海棠種子發(fā)芽試驗的結(jié)果所屬的二項分布與假設(shè)發(fā)芽率p=0.90的二項總體之間無顯著性差異。(2)簡算法對于k=2的次數(shù)資料O1和O2,欲檢驗其是否屬于r:s的總體二項分布時,可以省略理論次數(shù)的計算,簡化公式如本例==1.56252、k≥3組次數(shù)資料的適合性檢驗這種資料分3組以上,即k≥3,其總體分布為多項分布。無效假設(shè)H0:符合假設(shè)的多項分布。HA:不符合假設(shè)的多項分布。這種分布亦受理論次數(shù)等于實際總次數(shù)即∑E=N這一條件的限制。自由度df=k-1≥2,不用矯正公式。例8.2用乳白色和紅色金魚草雜交F2代的實驗結(jié)果列于下表。試檢驗該樣本所屬的總體分布與假設(shè)理論
7、比率為1:2:1的多項分布之間有無顯著性差異。分組實際次數(shù)理論概率理論次數(shù)乳白色粉紅色紅色2555200.250.500.25255025合計1001.00100(1)直接法統(tǒng)計假設(shè):H0符合1:2:1對HA不符合1:2:2顯著水平α=0.05計算:=1.5df=k-1=2查表得右尾檢驗臨界值=5.99推斷:因=1.5<=5.99故接受H0,否定HA,即金魚草雜交F2代的試驗結(jié)果所屬的總體分布與假設(shè)理論比率為1:2:1的多項分布之間無顯著差異。2)簡算法對于k≥3的次數(shù)資料,有下