資源描述:
《多元分析概述1》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第一章多元分析概述第一節(jié)引言第二節(jié)應(yīng)用背景第三節(jié)計算機(jī)在統(tǒng)計分析中的應(yīng)用第一節(jié)引言多元統(tǒng)計分析是運用數(shù)理統(tǒng)計方法來研究解決多指標(biāo)問題的理論和方法。近30年來,隨著計算機(jī)應(yīng)用技術(shù)的發(fā)展和科研生產(chǎn)的迫切需要,多元統(tǒng)計分析技術(shù)被廣泛地應(yīng)用于地質(zhì)、氣象、水文、醫(yī)學(xué)、工業(yè)、農(nóng)業(yè)和經(jīng)濟(jì)等許多領(lǐng)域,已經(jīng)成為解決實際問題的有效方法。機(jī)遇與挑戰(zhàn)隨著Internet的日益普及,各行各業(yè)都開始采用計算機(jī)及相應(yīng)的信息技術(shù)進(jìn)行管理和決策,這使得各企事業(yè)單位生成、收集、存儲和處理數(shù)據(jù)的能力大大提高,數(shù)據(jù)量與日俱增,大量復(fù)雜
2、信息層出不窮。在信息爆炸的今天,人們已經(jīng)意識到數(shù)據(jù)最值錢的時代已經(jīng)到來。顯然,大量數(shù)據(jù)在給人們帶來方便的同時也帶來一系列問題。信息量過大,超過了人們掌握、消化的能力;一些信息真?zhèn)坞y辯,從而給信息的正確應(yīng)用帶來困難;信息組織形式的不一致性導(dǎo)致難以對信息進(jìn)行有效統(tǒng)一處理這種變化使傳統(tǒng)的數(shù)據(jù)庫技術(shù)和數(shù)據(jù)處理手段已經(jīng)不能滿足要求.網(wǎng)絡(luò)的迅猛發(fā)展也使得網(wǎng)絡(luò)上的各種資源信息異常豐富,在其中進(jìn)行信息的查找如大海撈針。這樣又給多元統(tǒng)計分析理論的發(fā)展和方法的應(yīng)用提出了新的挑戰(zhàn)。多元統(tǒng)計分析發(fā)展的歷史起源于上世紀(jì)初
3、,1928年Wishart發(fā)表論文《多元正態(tài)總體樣本協(xié)差陣的精確分布》,可以說是多元分析的開端。20世紀(jì)30年代R.A.Fisher、H.Hotelling、S.N.Roy、許寶騄等人作了一系列的奠基性工作。20世紀(jì)40年代在心理、教育、生物等方面有不少的應(yīng)用,但由于計算量大,使其發(fā)展受到影響,甚至停滯了相當(dāng)長得時間。20世紀(jì)50年代中期,隨著電子計算機(jī)的出現(xiàn)和發(fā)展,使多元分析方法在地質(zhì)、氣象、醫(yī)學(xué)、社會學(xué)等方面得到廣泛得應(yīng)用。20世紀(jì)60年代通過應(yīng)用和實踐又完善和發(fā)展了理論,由于新的理論、新的
4、方法不斷涌現(xiàn)又促使它的應(yīng)用范圍更加擴(kuò)大。20世紀(jì)70年代初期在我國才受到各個領(lǐng)域的極大關(guān)注,并在多元統(tǒng)計分析的理論研究和應(yīng)用上也取得了很多顯著成績,有些研究工作已達(dá)到國際水平,并已形成一支科技隊伍,活躍在各條戰(zhàn)線上。在20世紀(jì)末與本世紀(jì)初,人們獲得的數(shù)據(jù)正以前所未有的速度急劇增加,產(chǎn)生了很多超大型數(shù)據(jù)庫,遍及超級市場銷售、銀行存款、天文學(xué)、粒子物理、化學(xué)、醫(yī)學(xué)以及政府統(tǒng)計等領(lǐng)域,多元統(tǒng)計與人工智能和數(shù)據(jù)庫技術(shù)相結(jié)合,已在經(jīng)濟(jì)、商業(yè)、金融、天文等行業(yè)得到了成功的應(yīng)用。本課程重點介紹多元正態(tài)總體的參
5、數(shù)估計和假設(shè)檢驗以及常用的統(tǒng)計方法。這些方法包括判別分析、聚類分析、主成分分析、因子分析、相應(yīng)分析、典型相關(guān)分析、多維標(biāo)度法以及多變量的可視化分析等。我們將利用SPSS統(tǒng)計軟件來實現(xiàn)實證分析。許寶騄(1910.09.01-1970.12.18),字閑若,數(shù)學(xué)家,1910年出生于北京,原籍浙江杭州,祖父曾任蘇州知府,父親曾任兩浙鹽運使,系名門世家。在中國開創(chuàng)了概率論、數(shù)理統(tǒng)計的教學(xué)與研究工作。在奈曼-皮爾遜理論、參數(shù)估計理論、多元分析、極限理論等方面取得卓越成就,是多元統(tǒng)計分析學(xué)科的開拓者之一。統(tǒng)
6、計方法是科學(xué)研究的一種重要工具,其應(yīng)用頗為廣泛。特別地,多元統(tǒng)計分析方法常常被應(yīng)用于自然科學(xué)、社會科學(xué)等領(lǐng)域的問題中。第二節(jié)應(yīng)用背景一、統(tǒng)計學(xué)的生命力在于應(yīng)用(一)統(tǒng)計學(xué)產(chǎn)生于應(yīng)用統(tǒng)計學(xué)的發(fā)展過程中可以看出統(tǒng)計學(xué)產(chǎn)生于應(yīng)用,在應(yīng)用過程中發(fā)展,它的生命力在于應(yīng)用。300多年前,威廉·配第(1623-1687)寫的《政治算術(shù)》,從其研究方法看,被認(rèn)為是一本統(tǒng)計學(xué)著作。政治算術(shù)學(xué)派的統(tǒng)計學(xué)家將統(tǒng)計方法應(yīng)用于各自熟悉和感興趣的研究領(lǐng)域,都還是把其應(yīng)用對象當(dāng)作肯定性事物之間的聯(lián)系來進(jìn)行研究的。他們確信,事
7、物現(xiàn)象存在著簡單明了的數(shù)量關(guān)系,需要用定性與定量的方法將這種關(guān)系(規(guī)律)揭示或描述。使人們能夠更具體、真切地認(rèn)識世界。數(shù)理統(tǒng)計學(xué)派的奠基人凱特勒在統(tǒng)計學(xué)中引入了概率論,把它應(yīng)用于自然界和社會的許多方面.在應(yīng)用中對發(fā)展統(tǒng)計方法貢獻(xiàn)顯著的當(dāng)推生物統(tǒng)計學(xué)派的戈爾登(1822-1921)、皮爾遜(1857-1936)和農(nóng)業(yè)實驗學(xué)派的孟德爾(1822--1884)、戈塞特(1876-1937)等。戈爾登六年中測量了近萬人的“身高、體重、闊度、呼吸力、拉力和壓力、手擊的速率、聽力、視力、色覺及個人的其他資料
8、”。在探究這些數(shù)據(jù)內(nèi)在聯(lián)系的過程中提出了今天在自然科學(xué)和社會科學(xué)領(lǐng)域中廣泛應(yīng)用的“相關(guān)”思想。將大量數(shù)據(jù)加以綜合描述和比較,從而能使他的遺傳理論建立在比較精確的基礎(chǔ)上,為統(tǒng)計學(xué)引入了中位數(shù)、四分位數(shù)、分布、回歸等極為重要的概念和方法。皮爾遜在檢驗他老師戈爾登的“祖先遺傳法則”和自然選擇中“淘汰”對器官的相關(guān)及變異的影響中,引入了復(fù)相關(guān)的概念和方法。在討論生物退化、反祖、遺傳、隨機(jī)交配等問題中,展開了回歸與相關(guān)的研究,并提出以卡方檢驗作為曲線擬合優(yōu)度的一種度量的思想。農(nóng)業(yè)實驗學(xué)派的孟德爾和戈塞特同