資源描述:
《你不能不懂統(tǒng)計常識.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、你不能不懂的統(tǒng)計常識班級:219班座號:01姓名:丁哲浩前言我們常聽別人說:「數(shù)字會說話?!沟?,傳播媒體所說的,有時信以為真,只會讓人更為困惑。減肥中心大打廣告:「本中心的全體學員一個月『平均』減重三公斤」是不是因此讓許多女性也想一同加入呢?相撲選手從200公斤減至100公斤,可以說他的體重「縮減一倍」嗎?咖啡喝多了,會引發(fā)心臟性的疾病,真的是因為多喝咖啡,裡面的化學物質(zhì)引發(fā)心臟疾病嗎?許多常常出現(xiàn)在報章媒體之中的「會說話數(shù)據(jù)」,或許看一看,馬上就將它拋至九霄雲(yún)外,但信以為真的聽眾,卻可能一步步被媒體牽著鼻子走。本書作者鄭惟厚教
2、授運用淺顯易懂的敘述,引用生活中的報導,分析數(shù)據(jù)取得和實驗研究中的謬誤,讓讀著能擁有基本的統(tǒng)計常識。從《你不能不懂的統(tǒng)計常識》裡,作者主要針對以下幾點做了說明:壹、平均的真面目貳、機率迷思參、隨機抽樣肆、如何正確比較伍、有無因果關係陸、邏輯問題壹、平均的真面目一看到平均數(shù)據(jù),大家常常信以為真,覺得他就是該篇訊息的一切準則。但很明顯的,平均值只是一個數(shù)值,它只能說一個事物的大概,真正的樣本和其餘枝枝節(jié)節(jié),無可避免的,只能含糊帶過。要破解平均值,就是把每個參與平均的數(shù)值一一列出,個別化的結果,才能精確掌握資訊。作者舉一例:一家減重公司
3、,學員只有五人,其中一人減重19公斤,其餘反而增胖1公斤,結果業(yè)者欲蓋彌彰,針對平均值的弱點,廣告「本減肥中心平均一人得減重3公斤」,其實它雖然說了實話,但消費者想知道的「其餘4者不減反增」卻並未說出。再舉一個例子:一家小型公司宣稱員工平均月收入為57,000元,對於現(xiàn)今經(jīng)濟不緊氣的市井小民來說,「平均」月入57,000元的確十分優(yōu)渥,但看了下面的圖表,可能就打消之前的想法。一個公司有老闆、有基層員工,但運用平均數(shù)的盲點,出現(xiàn)57,000的數(shù)字,其實用中位數(shù),結果為30,000元,似乎必較接近真正大家想要的數(shù)字;而眾數(shù)則是基層員工
4、的20,000元。針對樣本數(shù)不足,或是極端值足以抗衡整個平均值時,使用中位數(shù)、眾數(shù)、裁剪平均數(shù)(等量消去前後極端值,再除以平均)都可以讓讀者想要得到的真正資訊。其實,國中所學習的盒鬚圖(boxplot)就是一個統(tǒng)計學的好例子,找出四分位數(shù)(quartile)、算術平均數(shù)、最大值和最小值更可以一次讓讀著得到想要的資訊。壹、機率迷思樂透彩剛發(fā)行的時候,頭六次開獎中,39號出現(xiàn)了4次,當時頗受大眾一番討論。但經(jīng)過了作者機率計算之後,似乎就覺得平常而非異事。42個號碼中任一個號碼六次中中四次的機率:接近20%的機率,由此可見在媒體吵得沸沸
5、揚揚的時候,我們應該是保持冷靜從容的心,找出事中的端倪。另外,即使如果無法算出上面的正確機率,也應當有個概念,咱們的樣本僅有六個。在《如何用數(shù)字唬人》中則充分解釋了此奇特現(xiàn)象。作者投擲印幣90次,每30次為一次記錄,結果發(fā)現(xiàn)連續(xù)出現(xiàn)人頭或數(shù)字竟可高達6次,本來機率僅是顯示一個事物出現(xiàn)的常態(tài),但真實生活,它們好比波浪一般,高低起伏,39號的出現(xiàn)好比遇到了浪的波峰,如果未來六百次中竟然還出現(xiàn)四百次時,那麼我們才能大膽懷疑彩球是否有錯誤?;貧w至平均數(shù)(regressiontothemean)說明了當一個數(shù)字達到了至高點或最低點時,接下來
6、他將會趨近於一個平均數(shù),類似一地區(qū)車禍發(fā)生次數(shù)或患有癌癥的人等等,常常在短時間出現(xiàn)層出不窮時,大眾就想要找出一個藉口(例如:道路彎曲嚴重或附近因為電磁波太多等等),填補事出原因?!甘鲁霰赜幸颉褂袝r未必在討論機率時適用,短暫而大量的出現(xiàn)可能只是個波峰的出現(xiàn)。壹、隨機抽樣在進行任何一項統(tǒng)計時,我們無法得知全體人民或青少年等等大範圍的每個人的意見,唯一可做得是抽取幾個人代替全體,但如何隨機抽樣,才能使得出來的統(tǒng)計值最接近實際值?把握兩大原則:隨機抽樣及在各方面許可的狀態(tài)下,人數(shù)愈多愈好。隨機選擇的結果,最大的好處是排除主觀的意見,減少數(shù)
7、據(jù)的誤差;人數(shù)大量的情況下,個人的意見只能代表全體中的小意見,不會變成像第壹點中減肥中心所舉出的例子。另外,當此項統(tǒng)計想要做多次調(diào)查時,顯然一定會和前幾次有所誤差,但只要把多次得來的數(shù)據(jù)結果,在一次平均,得到的估計值都將會更加準確。但有時調(diào)查,雖然經(jīng)過隨機,仍會有明顯的誤差。常常在大選期間進行候選人民調(diào),如果在其中顯示自己為何家媒體或候選人辦公處等等,常常受訪者會因為期望給予訪問者較為期望的答案,而左右了真心想法;此外,身心健康調(diào)查,受測者可能儘管常吃甜食和根本不運動,但卻在回答時,打個折扣,給予訪問員一個對自己較為滿意的答案,這
8、些無形中都會影響統(tǒng)計出來的正確。抽樣調(diào)查,最基本應有的態(tài)度,就如作者說的:一切要隨機。比較多的老人、年輕人、婦女、失業(yè)者、吸菸者、宗教人士等等,都可能嚴重產(chǎn)生偏差;設計的問題,也要思考應對之人是否有心存顧忌的可能性。儘管在多的受訪者,仍然會有誤差,