兩學期課時的第二學期包括建模、多元迴歸分析推斷、Logistic 迴歸、試驗設計和方差分析: 第六部分:分析資料:迴歸方法和模型的建立第七部分:試驗設計與方差分析
•vili•序育著重解釋而不是計算在初等統計課程中,標準的做法是定義一個統計方法,給出該統計方法的計算形式,然後利用這個計算形式進行資料分析。然而,我們發現這樣做對於大型資料的分析十分不利。進一步說,學生按照這種統計方法的計算形式進行手頭計算要花費太多時間,而計算形式本身卻不能從直觀上表明為何如此計算。所以,我們提供例題和練習,以便學生能夠學習如何依據統計方法的定義形式去計算統計估計量和檢驗統計量的值。當學生對該統計方法所反映的資料的特徵熟悉以後,我們再強調在分析大型資料集時,運用計算機軟體做計算的好處。我們給出了一些主要統計軟體包的輸出結果:SAS,Minitab, Stata, Systat,JMP 和 SPSS。我們發現這樣做使學生有了用定義計算統計方法中各量值的體會,從而學到了每-一統計方法背後的基本知識。在統計課程以外大多數的場合下,學生應利用計算機軟體進行計算,不儀方便而且計算準確。在許多練習和例題中,利用計算機使得我們有更多的時間用於強調對計算結果的解釋,而不是把大量的時間和精力花費在實際的計算上。 透過例了和習題,我們揭示了假設檢驗以下諸方面的重要性: 1.假設的陳述,即透過概括研究者的目標形成關於總體引數的假設; 2.選擇最合適的檢驗統計過,包括許多統計方法中的樣本址計算; 3.在討論統計假設檢驗的結果時,考慮第I類和第1I 類錯誤(a和B)的必要性; 4.既考慮檢驗結果的統計意義也考慮其實際意義,即我們闡明瞭估計效用大小和建立總體引數的置信區間的重要性; 5.除“拒絕 H。”和“不能拒絕H。”外,用非統計方面的專業術語來陳述統計結果。 我們用醒目的方式排印有關一個假設檢驗的內容,包括原假設、備擇假設、檢驗統計量、拒絕域及使得此假設檢驗有效的條件。當假設檢驗所需要的條件沒有得到滿足時,則建議可供選擇的其他檢驗統計量。例如,第五章中有如下所示的醒目的排印: 正態總體(已知)或大樣本容量時!的統計檢驗假設: 情形1.HO:ASAI H: ≥ 0(右側檢驗) 情形2.Hn: ≥10 Ha: < n(左側檢驗) 情形3.Hn:p Ho H:從 (雙邊檢驗) T.S.(檢驗統計量):2=”興 a//n R.R:對於犯第一類錯誤的機率。
序言•ix, 情形1.如果z≥2 則拒絕 H。 情形2. 如果x≤-2a 則拒絕 Ho 情形3.如果|z|≥2c/2 則拒絕 Ho 注意:如果總體是。已知的正態分佈,則這些方法是適用的。在大多數情況下,如果n≥30,由中心極限定理知,在總體非正態分佈時,也可用這些方法。 同樣,如果n≥30,那麼,我們可以用樣本標準差:來代替a。n<30的情形在這章的後面再討論。 新版的變化 •大多數章節中的案例幫助學生理解應用統計在解決實際問題時所扮演的角色。倒重點放在闡明從資料處理中學習的步驟。 •書中強調了統計方法所基於的假定的重要性。我們透過計算機模擬來討論和說明許多估計和檢驗方法是穩健的或不穩健的。在許多例題和練習中,我們給出了一些方法以說明如何考察一項研究是否滿足這些必要的假定。另外,在許多問題中,我們還給出丫當這種假定不滿足時可供選擇的其他方法。 •強調從練習題和例題所包含的研究中學習解釋結果和總結結論。 •在用小資料集講清了如何透過確定的方式來進行相應的統計計算後,我們鼓勵大家利用計算機來做大部分計算。 •大部分例題都有資料的圖示,計算機的使用使得我們利用複雜的圖形工具來描述統計結果極為方便。 •提供了樣本量及:檢驗和F 檢驗中犯第二類錯誤的機率的計算技巧。 •我們擴充和更新了練習題,而且習題和例題涉及眾多學科,其中包括許多實用的、現實生活中的問題。這些練習可為學生運用求知於資料的四個步驟積累一些經驗。 •在有關試驗和研究的設計的新一章中,討論了一些在資料收集之前需要考慮的重要因素。我們強調了如何防止在設計階段因沒考慮所有因素而導致不能回答研究者所關心的重要問題這種事情的發生。 • 關於線性迴歸和相關分析的兩章已被合併成一章。 •儘管把表達和撰寫資料分析結果放在最後一章,但我們在全書中利用案例使其中許多思想得以體現。 •網站:http://www.Suxbury.com上有所有習題的資料集。 •精選練習題的答案同樣也可在該網站得到。
•x•序言前幾版中保留下來的一些特點 • 書中包含了統計方法和資料分析的許多實際應用,這些應用來自農業、商業、經濟、教育、工程、醫藥、法律、政治學、心理學、環境研究及社會學。 •練習題被分成基本技巧型和應用型兩組。 •在大多數章節後都有供複習用的練習題。 • 我們在大量例子和習題中給出了 Minitab, SAS, Systat, JMP, Stata 和 sPsS 等統計分析軟體的計算機輸出結果。 •注意基本的假定。用圖示方法和檢驗方法判斷假定是否成立。 •第一章討論了“什麼是統計”,指出了學生為什麼要學馬統計,討論了幾種重要的調查問題,以說明統計在解決現實問題中的應用。 •花一定絲幅討論瞭如何進行資料整理和為資料分析做準備。 輔肋材料 •學生解題手冊(0-534-37123-X)包含了書中問題的部分解答。 •解題手冊(0-534-37121-3)為教師提供「書中所有問題的答案。 •試題庫(0-534-37122-1)包含了書中所講內容的一些試題。 • Ott/longnecker 網站資源中心包括了資料集,勘誤表和供教師和學生用的其他資源。要進入資源中心,請到 Jwww.Duxbury.com,選擇“Online Book Companions.” 致謝在原稱付梓和隨後幾版的編寫過程中,許多人提出了寶貴的、有建設性的建議。Duxbury 出版社的編輯Carolyn Creckett 在該版寫作的整個過程中一直給子我們巨大的鼓勵。同時,我們也深深的感謝喬治亞大學的 Chris Franklin,感謝她關於這版所需變動的內容作出的有創見的評論以及她對各章修訂稿的審閱。我非常感謝以下評論者富有洞察力的、建設性的評論,他們是 Deborah J.Rumsey(俄亥俄州州立大學),Larry J. Rirger(得克薩斯州A&M大學),Mosuk Chow(賓夕法尼亞州州立大學),Christine Franklin(喬治亞大學)和 Darcy P. Mays(弗吉尼亞 Commonwealth大學)。我們要特別感謝 Felicita Longnecker, Michael 之妻在準備初稿素材、校訂及列印該版初稿方面所給予的幫助。 R.L..奧特 M.朗格內克目錄上冊序言第一部分第一章什麼是統計 1.1 引官 1.2 為仕麼學習統討 1.3 當前統計的-些應用 1.4 統計學冢做什麼 1.5 質量利工序改進 1.6 學生注意• 1.7 小結補充練習第二部分 •收集資料第二章利用調查和科學研究來收集資料⋯ 2.1 引育 2.2 調查 2.3 科學研究 2.4 觀察研究 2.5 資料整理:為概括和分析準備資料⋯ 2.6 小結第三部分概拮數捉第三章 3.1 3.2 資料的描述引育計算器,計算機及軟體系統 (3) (3) (7) (7) (11) (12) (14) (15) (15) <19) <19) (20) (28) (35) (36) (40) 〈43) (43) (44)
•立• 3.3 單個變數資料的描述:圖表法⋯ 3.4 單個變數資料的描述:中心趨勢的度量 3.5 單個變數資料的描述:變異性度量 3.6 盒形圖 3.7 多變雖資料的概括 3.8 小結… 重灌公式• 補充練可 (46) €76) (88) {103) <109) 《119) (120) (120) 第四部分工具和概念第四章機率和機率分佈 4.1 如何應用機率進行推斷 4.2 確定•個事件的機率 $.3 基本的事件關係和機率法則 4.4 條件慨率和獨立性⋯ 4.5 Rayes公式 4.6 離散變黛和連續變數 4.7 離散隨機變數的機率分佈 +,8 一個常用的離散隨機變數:二項分佈 4.9 連續隨機變數的機率分佈 4.10 一個常用的連續隨機變數:正態分佈 4.11 隨機抽樣 4.12 抽樣分佈 4.13 二項分佈的正態通近 4.14 Minirab 指令 4.15 小結璽要公式⋯ 補充練習⋯ 第五部分資料分析:中心值,方差和比例第五章 5.1 5.2 5.3 5.4 5.5 關」總體中心值的推斷引言和案例的估計⋯ 估計:時樣本容量的選取⋯ 關十的統計檢驗⋯ 對於進行檢驗時樣本容量的選取, (135) (135) (138) (141) (144) (150) (155) 《157) (158) (169) (172) (184) (189) (201) (204) (205) (206) (206) (215) (215) (218) {228) (231〉 (242)
錄•注, 5.6 統讓檢驗的顯著性水平: 5.7 正態總體均值p的統計推斷,a未知 5.8 關於巾位數的推斷 5.9 小結重要公式補充練可第六章兩總體中心值的比較. 6.1 引言和案例 6.2 關於11-42的推斷:獨立樣本 6.3 非引數推斷方法:Wilcoxon 秋和檢驗 6.4 關十 1-42 的推斷:成對資料 6.5 非引數推斷方法:Wilcoxon 符號秩檢驗 6.6 推斷 .-p2 時樣本容量的選取 6.7 小結重要公式補充練習第七章關於總體方差的推斷, 7.1 引言和案例⋯ 7.2 單個總體方差的估計和檢驗⋯… 7.3 比較兩個總體方差時的估計和檢驗• 7.4 比較多個總體方差時的檢驗 7.5 小結重要公式補充練可第八章兩個以上總體的中心值的推斷 8.1 引言和案例 8.2 兩個以上總體均值的統計檢驗:方差分析 8.3 完全隨機化設計中觀測值的模型… 8.4 方差分析條件的檢 8.5 其他的分析方法:資料變換 8.6 另一種非引數方法:Kruskal-Wallis 檢驗 8.7 小結璽要公式• 補充練勻⋯⋯ 第九章多重比較 9.1 引言和案例 9.2 線性對照 9.3 控制哪個錯誤率 (248) (253) (267) {276) (277) (278) (290) (290) (294) (315) (328) (336) (343) (345) (346) (348) (371) (371) (374) (386) (397) (406) (406) (407) (413) (413) (418) (428) (431) (439) (446) (451) (452) (453) (465) (465) (469) (476)
•iv•日錄 9.4 Fisher(費)最小顯著差異法 9.5 Tukey 的W方法⋯⋯ 9.6 Student-Newman-Keuls 方法⋯ 9.7 Dunnett方法:處理組與對照組的比較 9.8 Scheffe 的 S 方法: 9.9 小結• 重要公式• 補充練習• 第十章型別資料 10.1 引畜和案例 10.2 總體比例x的推斷 10.3 兩總體比例之差 1 2的推晰• 10.4 多比例的推斷:卡方擬合優度檢驗 10.5 Poisson(泊松)分佈⋯ 10.6 劉聯表:獨文性檢驗和齊性檢驗… 10.7 相關程度的度量 10.8 機率和優比 ................---。 10.9 小結 •。 車要公式• 補充練習 (479) (483) (486) (489) (491) (498) (499) (499) ($11) (511) (513) (525) (532) {541) (546) (557) (563) {566) ($67) (568)
目錄下冊第六部分第十一章線性迴歸和相關 11.1 引言和案例 11.2 估計模型中的引數 11.3 迴歸引數的推斷 11.4 利用迴歸預測新的值 11.3 線性國歸中擬合不足的考察 11.6 逆回問題(校椎) 11.7 相關 11.8 小結重要公式補充練可第十二章多元迴歸與一般線性模型 12.1 引言和案例 12.2 一般線性模型 12.3 估計多元迴歸係數 12.4 多元迴歸中的推斷 12.5 迴歸係數子集的檢驗 12.6 用多元迴歸進行的預測 12.7 比較幾條迴歸線的斜率 12.8 logistic 迴歸 12.9 多元迴歸的一些理論結果(任選)• 12.10 小結重要公式補充練習第十三章多元迴歸續論資料分析:迴歸方法和模型的建立 ($83) (583) (592) (612) (623) (633) 〔640) (649) (660) (661) (663) (679) (679) (688) (690) (713) (726) (736) (741) (747) (756) (759) (760) (761) (781)
•i• 目錄 13.1 引言和案例 13.2 變數的桃選(第一步) 13.3 模型形式的確定(第二步) 13.4 模型假設的檢查(第三步) 13.5 小結重要公式補充練習第七部分試驗設計與方差分析第十四章試驗和研究的設計概念 14.1 引言 14.2 研究的型別 14.3 設計的試驗:術語 14.4 控制試驗誤差 14.5 試驗單元對處理的隨機化 14.6 確定重複試驗的次數 14.7 小結第十五章標準設計的方差分析 15.1 引盲和案例 15.2 單因子的完全隨機化設計 15.3 隨機化完全區組設計 15.4 拉丁方設計 15.5 完全隨機化設計中的因子處理結構 15.6 隨機化完全區組設計中的因子處理結構 15.7 處理差異的估計和處理均值的比較 15.8 小結重要公式• 補充練習第十六章協方差分析 16.1 引言和案例 16.2 具有一個協變數的完全隨機化設計 16.3 外推問題 16.4 多維協變黛和更復雜的設計 16.5 小結補充練習⋯ 第十七章一些固定效應、隨機效應和混合效應模型的方差分析 17.1 引言和案例 • (781) (784) 〔806) (840) (866) (867) (867) (923) (923) {924) (925) (929) (934) (938) (942) (948) (948) (951) (955) (974) (988) (1014) (1016) (1023) (1023) (1024) (1048) (1048) (1051) (1064) (1068) (1077) (1077) (1083) (1083)
17.2 具有隨機處理效應的單因子試驗:隨機效應模型 17.3 隨機效應模型的擴充 17.4 混合效盛模型 17.5 計算期望均方的規則 17.6 套抽樣和染區設計 17.7 小結補充練習: 第十八章重複測量與交叉設計 18.1 引言和素例 18.2 有重複觀測的單因子試驗 18.3 一個因子有重複觀測的兩因子試驗 18.4 交叉設計 18.5 小結: 補充練習第十九章一些非平衡設計的方差分析: 19.1 引言和案例 192 有一個或多個缺失觀察值的隨機化區組設計 19.3 有缺失資料的拉丁方設計 19.4 平衡不完全區組(BIB)設計 19.5 小結重要公式⋯ 補充練習第二十章分析結果的傳達和備案 20.1 引言 •. 20.2 做好傳達溝通工作所面臨的困難 20.3 傳達的障礙:圖形的歪曲 20.4 傳達的障碼:有偏抽樣 20.5 傳達的障礙:樣本容量 20.6 為統計分析準備資料 20.7 統計分析的指導原則和報告 20.8 文件和結果的儲存 20.9 小結補充練習附錄統計表: 參考文獻⋯ 索引⋯ 譯後記日錄•i• (1086) (1091) (1100) (1110) (1121) (1132) (1132) (1139) (1139) (1144) (1146) (1157) (1161) (1161) (1168) (1168) (1170) (1176) (1181) (1191) (1192) (1193) (1198) (1198) (1198) (1200) (1203) (1205) (1206) (1209) (1210) (1211) (1211) (1212) (1281) (1286) (1303)
第一部分引論第一章什麼是統計第一章什麼是統計 1.1 引言 1.2 為什麼學習統計 1.3 當前統計的一些應用 1.4 統計學家做什麼 1.5 質量桕工序改進 1.6 學生注意 1.7 小結 1.1 引言什麼是統計?它是數字的加法嗎?它是圖表,擊球手的平均得分、保送上壘的成功率、失業率嗎?總之,它是不是對社會和自然的數值描述? 統計是一套科學原理和技術,用於在可得到的資訊既有限又富子變化時,從中得出關於總體的和過程的結論。也就是說,統計是關於從資料中學習的科學。兒乎每個人,包括社閉主席、市場代理,杜會科學家、工程師、醫學研究人員,消費者, 都與資料打交道。這些資料以各種形式出現,如季銷售量、青少年犯罪的增長率、 水樣的汙染等級、經過某種治療後病人的存活率、人口普查資料,或用來幫助決定購買哪種品牌的汔車的資料等。在本書中,我們透過考慮從資料中獲取知識的四步來學習統計。這四步是:(1)設計收集資料的過程;(2)準備分析用的資料(概括、 建模);(3)分析資料;(4)報告從資料分析中得到的結論。 本書分為八個部分。這八個部分的內容與從資料中學習的各個步驟及全書各章之間的聯絡如表1.1所示。從表中可見,我們花費許多時間討論如何用基本的方法(如中心值、方差和比例)、迴歸方法稱方差分析方法來分析資料。然而,你必須記住,對幹我們要分析的每一資料集合,已經有人給出「一種收集資料的方案 (第1步)。在準備好分析用的資料(第2步)和分析完資料(第3步)後,必須有人把分析的結果以書面或口頭的形式傳達給有關人員。所有這四步對從資料中獲取知識都很重要。事實上,如果第一步執行不當,試驗或研究的目標往往會因為收集的資料集不完全或含有不恰當的資訊而實現不了。自始至終,我們將使你集中於從資料獲取知識的大圖景上。當然不時的查閱下面這張表將有助子你清楚每章在整個安排中所處的位置。
•4• 第一章什麼是統計書中各個部分表1.1 本書的編排結構從數裾獲取知識的步驟書的章節 1.引論 2. 收集資料 3. 概括資料 4. 工具和概念 S.資料分析;中心值、方差和比例 6. 資料分析:迴歸方法和模型的建立 7. 試驗設計和方差分析 8.表達和撰寫分析結果 1 2 3 3 3 4 1.什麼是統計? 2. 利用調查和科學研究來收集資料 3. 資料的描述 4. 機率和機率分佈 5.關於總體中心值的推斷 6.兩總體中心值的比較 7. 總體方差的推斷 8. 兩個以上總體的中心值的推斷 9.多重比較 10.型別資料 11.線性迴歸和相關 12. 多元迴歸和一般線性模型 13. 用診斷建立迴歸模型 14.試驗和研究的設計概念 1S.標準設計的方差分析 16. 協方差分析 17. 某些固定、隨機、及混合效應模型的方差分析 18. 重複測量和交叉設計 19.一些非平衡設計的方差分析 20. 分析結果的傳達和備案在進入統計的學習之前,讓我們考慮四個例子。在這些例子中,運用統計能幫助我們解決實際問題。 1.一燈泡廠每天大約生產50萬隻燈泡,質量控制部門必須檢驗燈泡的次品率。這個任務可以透過檢驗每一隻燈泡來完成,但是這樣做的花費巨大而且會造成每隻燈泡價格的猛漲。另一方法是從每天生產的50萬隻燈泡中選出1000只,然後檢驗這1000只燈泡。如果這1000只燈泡是以
1.1 言• 正確的方式被選出的,那麼從中檢測出的次品比例,可被用於估計全天所有產品的次品比例。我們將在以後的章節中論證被檢查的燈泡的次品率可能與全天生產的50萬隻燈泡的次品率很接近。 2. 為了調查研究“人在戒菸後體重會增加”這—斷言,研究人員選擇了一個由 400個參與者構成的樣本,他們都成功地參與了戒菸運動。每個人在活動開始前和一年後都稱量了體重。參與者體重的平均變化是增加了5磅。 研究人員由此總結說有證據表明這一斷言是正確的。我們將在後續章節介紹一些方法,並用之說明這個變化是真由於戒菸造成的而不是由於隨機函素造成的。 3. 為了研究氮肥對小麥產量的影晌,研究人員一共可以利用15塊田地。他隨機地選擇3塊田分配給五種被考察的氨肥中的一種。在所有這15塊田中種上同種小麥。所有這些田都以同樣的方式耕作,直到收穫的季節,記錄下這15塊田的畝產城。試驗者想決定任何麥田的最佳氮肥施肥量,但顯然他只能在有限的一些田塊中做試驗。當得出使試驗田有最大產量所需的氮肥量後,研究人員斷言,這個施肥量對於與試驗田具有相同特徵的麥田也適用。試驗者做出這樣的結論有足夠的理由媽? 4. 紐約時報(New York Times)/哥倫比亞廣播公司新聞(CBS News)、華盛頓郵報 (Washington Post)/全美廣播公司新聞(ABC News)、有線新聞網 (CNN)、哈里斯和蓋洛普(Gallup)民意調查機構等頻繁地使用統計,也使我們想起統計的類似應用。民意調查人員如何判斷19 S00多萬具有選舉權的美國人的意見?他們當然不會接觸每一個潛在的美國選民。相反, 他們調查一小部分,比如1 500個潛在選民的意見,然後據此估計整個國家所有具有選舉權的人的意見。令人驚訝的是,被訪人中持有特定觀點的人的比例與整個總體在那個特殊時刻持有相同觀點的人的比例會很接近。在以後的章節中我們將提供令人信服的有力的證據來支援這個論斷這些問題都說明了從資料中學習的四個步驟。首先每個問題都涉及設計一個試驗或調查。質量控制小組必須決定需要檢測多少燈泡,如何從所有的產品中選山1,000個燈泡樣本以得到正確的結果。民意調查組織必須決定為得到能夠代表全部選民的資訊,須調查多少選民以及如何挑選這些選民。類似地,在體重是否會增加的研究中必須認真設計需要選擇多少參與者,如何從所有這樣的參與者中選擇這些人。另外,研究人員應該測量每一參與者的什麼量?是不是有必要知道每一參與者的年齡,性別,健康狀況及其他與鍵康相關的量,還是隻測量體重?如果被研究的參與者中許多人都有特的健康狀況,則研究結果可能就不適用於一般
•6• 第章什麼是統討總體。在小麥試驗中,為了得到可以推廣到試驗田以外的結果,測謝田塊的土壤特徵和環境條件(如溫度和降雨量)很重要。 最後,收集、概括、分析完資料後,用清楚的措辭向有關的人報告你的結果也是很重要的。對於燈泡的例子,管理人員和技術人員需要知道他們成批產品的質量狀況。基於這些資訊,他們將決定是杏有必要對生產做出相應的調整。因而,統計分析的結果不可以用模稜兩可的術語表達,必須基於已知的知識做出判決。戒菸後是否增重的研究結果,對那些有病人參與戒菸運動的醫生來說是感興趣的。如果紀錄表明那些戒菸的個人體重明顯增加,那麼醫生可能不得不向他們提出飲食建議,免得以前吸菸的人從一種健康問題(吸菸)轉向另一健康問題(由於過重而血壓升高》。在報告中有關參與者的仔細描述如年齡、性別積其他與健康有關的資訊是很關鍵的。在小麥試驗中,試驗者要給農民提供一些可以幫助他們選擇對自己的田塊最經濟、最佳的施氮肥量的資訊。所以,報告中必須包括有關他們所研究的用地的溼度和土壤型別的資訊。否則,有關最優小麥產量的結論將可能無益於那些在截然不同的條件下種植小麥的農民。 為了使調查結果能夠適用於比被調查的部分更大的群體,我們必須仔細地定義總體的概念(參見定義1.1),把問題歸結為對於這個總體的推斷問題,設計一個調查並依之從該總體中恰當地選擇樣本(參見定義1.2)。我們將在第二章討論這些問題。 定義1.1 總體是樣本收集人員感興趣的所有測量值的集合(見圖1.1)。 所有測量值的集合:總體從總體中選出來的溯量值集合:樣本定義1.2 圖1.1 樣本和總體樣本是選自總體的任何子集(見圖1.1)。
1.3 當前統訃的些應用•7• 1.2 為什麼學習統計我們可以為學習統計入門課程想出兩條好的理由。一條是你需要知道如何去評價公開發表了的用數字說明的事實。我們的周圍充斥著生產廠家對其產品的聲明;充斥著有關社會問題的、消費的、政治的民意測驗結果;充斥著出版了的科研結果。其中許多結果都是基於樣本做出的推斷,有些推斷是正確的,有些是不正確的;有些是基於足夠大的樣本望,有些不是。然而,所有這些出版的結論都帶著真理的光環。有些人(尤其是統計學家)說統計可用於支援幾乎任何東西,也有一些人說用統計很容易造假。兩種說法都對。在把抽樣的結論應用於沒有獲得資訊的範圍時,很容易有意或無意地利用統計歪曲事實。 學習統計的第二條理由,是你的職業或工作可能要求你解釋抽樣的結果(如調查或試驗),或者運用統計分析法做出推斷。例如,開業醫生得到許象廣告,描述新藥的優點。這些廣告經常給出新藥和舊藥比較試驗的資料結果。這樣的資料是否真的意味著新藥更有效,結果中觀察到的差別是個是僅僅是試驗中測量值的隨機變動引起的呢? 在法庭審判中,最近的趨勢表明,在評定證據的真實性時運用機率統計推斷的方法在增加。在社會、生物、物理科學中運用統計是必然的,因為這些科學都要利用抽樣調查或試驗獲得的對自然現象的觀察來發展和檢驗新的理論。統計方法在商業中的運用體現在用抽樣資料來預測銷售額和利潤。另外,統計還用於工程和製造業的產品質址監督。賬目的抽樣還可以支援主管會計進行賬目的稽查。由此可以看出,統計在科學、商業、工業等幾乎所有領域中都扮演著重要的角色。在這些領域中的工作人員需要了解統計的基本慨念、威力和侷限性。 1.3 當前統計的一些應用酸雨:對我們環境的一種戚脅普適接受的酸雨的成因是硫酸和硝酸。爾中這些酸性成分的來源是碳氫化合物燃料,當它們燃燒後把硫、氮氧化物釋放到大氣中去。酸雨有許多危害,下面是其中的幾種: •當酸雨出現在春天雪融期時,會侵入許多魚類的繁殖地區阻礙成功繁殖。 許多依賴池塘、湖泊的生物種類由於池塘或湖泊受到酸雨汙染而逐漸消失。 •在森林中,酸雨會削弱一些樹種的抵抗力,使他們更容易遭受昆蟲的侵害和罹病。
•8. 第一意什麼是統計 •在被受酸雨影響的水包圍的地方,主要養分將從土壤中分離出去。 •人工建築物也受到酸雨的影響。美國的專家估計酸雨給房屋或其他建築物造成的損失至今已達15億美元左右。 解決與酸雨相關的問題並不容易。美國國家科學基金會(NSF)建議我們努力減少50%的氧化硫排放量。說來容易做來難。因為含硫高的煤是主要的排放源,但在一個依靠煤提供能源的國家轉用含硫量低的煤並不總是可能的。相反,必鬚髮明更好的過濾裝置,從燃燒過程中把這些有汙染的氧化物在它們排入大氣之前除掉。內燃機所用的油料也是酸雨中硫氧化物的主要來源。顯然,需要對汽車和卡車的排放進行更好的控制。 要減少燃煤鍋爐和內燃機交通工具氧化物的排放量,需要大量使用現有的過濾器和排放控制裝置,並開發新的技術使我們能利用可利用的能源。開發可替代的、更清潔的能源對我們達到 NSF提出的預定目標也是很重要的。統計和統計學察將在監察大氣狀況,檢驗排放控制裝置的有效性,以及發展新的控制技術和替代能源中擔當舉足輕重的角色。 判定新藥的療效預防小兒麻痺症的脊髓灰質炎疫苗的發明和檢驗為說明統計是如何被用於解決實際問題提供了一個極好的例子。大多數父母和1954年以前出生的孩子都能想起那個夏天由於小兒麻痺症爆發而導致的恐慌。儘管每年患小兒麻痺症的孩子相對較少,但是由於該病的爆發不可預測而且由於該病會導致癱瘓甚至是死亡而被引起極大的關注。如今的年輕人很少有人昕說過小兒麻痺症,這一事實表明疫苗及其投放市場之前所做的檢驗工作的巨大成功。 確定一種藥品療效的通常做法是在人身上進行試驗(常稱為臨床試驗)。對於某些臨床試驗,藥物隨機地分配給參與試驗的人,其中一半人真正獲得藥品,其餘半人獲得不含該藥的溶液或藥片(稱為安慰劑)。統計問題之一是確定臨床試驗參與者的總數。這一問題在脊髓灰質炎疫苗檢驗試驗中尤為重要,因為以往年份的資料表明小兒麻痺症的發病率為每10萬個孩子中不足50例。這樣,為了測出接受疫苗的人和得到安慰劑的人之間發病率的差異,臨床試驗必須包括大量的參與者。 在統計學家的幫助下,確定該疫苗的臨床試驗需要共40萬個孩子參與。以往從沒嘗試做過由如此多人參與的臨床試驗。試驗從 1954年開始。在這些參與者中隨機地抽取了一半人分配了疫苗,其餘的人給以安慰劑。透過公立學校的接種活動,對這 40 萬參與者進行了處理(接種疫苗或安慰劑),然後經過一個夏天的觀察得出患小兒麻痺症的人數。儘管臨床試驗中的40萬人只出現了不到 200例的小兒麻痺症,但其中獲得安慰劑的患病人數是獲得疫苗的患病人數的3倍還要多。 這些結果加上一些統計計算,足以說明疫苗的效果。然而,如果沒有統計學家和科
1.3 當前統計的一些應用•9• 學察計劃和指導這樣龐大的臨床試驗,那麼,這樣的結果是不可能得到的。 脊縫灰質炎疫苗的開發並不是統計應用於檢驗和研製藥品的特例。近年來, 美國食品藥品管理署(FDA)一直嚴格地要求藥廠建立新藥品的療效試驗說明。 而,統計在避孕藥、風疹疫苗、癌症的化療劑和其他醫藥、食品的研製和檢驗中都發揮著重要的作用。 統計在法庭上的應用我們中的每一個人都能碰到與消費品有關的投訴事件,你可能在這樣的事件中充當原告或被告,或者你可能聽說某人被牽涉進這樣的官司。當然我們都間接地透過增加了的保險費和商品的費用幫助支付這種官司的費用。投訴中有關特定商品(如汔車、藥品等)的證詞常在很大程度上依賴十對一個或幾個有關該產品調查得到的資料的解釋,這就是為什麼統計和統計學家進入法庭的原因。 例如,流行病學家已經把統計概念用於資料來判斷一種特徵(如矽酮乳房移植中的洩露)和疾病(如自休免疫疾病)之間是否有某種統計關聯。發現這種關聯的流行病學家還得努力辨別研究所觀察到的統計聯絡是由於隨機變動引起的,還是確實反映了特徵與疾病間的真正聯絡。法庭論據中有關對這類聯絡的解釋涉及用統計概念分析資料和資料的臨床解釋。當然,還有許多其他在法院案例中利用統計模型的例子。在薪水歧視的案例中,訴訟狀聲稱某僱主基於年齡、種族、性別少付錢給僱員。統計模型被用於解釋基子許多因素如工作經驗、所受教育程度和工作表現等造成的工資差異。然後,利用根據工作表現等相關因素調整後的工資數據在年齡組或各種族之間進行比較,以決定這些調整後的L資資料之間是否還存在顯著的差異。 估計弓頭鯨的總數 Raftery 和 Zeh(1998)討論了有關弓頭鯨(Bowhead whale)的總數和增長率的問題。這種研究之所以重要是由於弓頭鯨是已經禁止商用捕提的第一種巨鯨;它們的狀況對於其他巨鯨的恢復前景具有啟示作用。此外,國際鯨調查委員會利用這一估計決定阿拉斯加的愛斯基摩人維持土著生計所需的捕鯨配額。為了獲得必要的資料,研究人員利用視覺和聲學法在簡拉斯加的巴魯角(Point Barrow)外進行了普查。然後,把統計模型和估計方法用於普查所得的資料,由此判斷在商用捕鯨停止後,弓頭鯨是增加了還是減少了。統計估計表明弓頭鯨的總數以正常的比例增長。這一結果說明,因商用需要而捕捉十分之一後餘下的巨鯨將會在捕捉終止後恢復正常。 臭氧暴露和人口密度城市周圍地區臭氧的汙染是每個國家最普遍的環境問題。雖然同溫層臭氧的誠少可能導致皮膚癌的增發,但周圍環境中高濃度的臭氧也會造成對人類呼吸系統、農作物和樹木的破壞。得克薩斯州的休斯敦是僅次於硌杉磯的第二大臭氧濃
•10• 第一章什麼是統計度超過國察周邊環境空氣質量標準(National Ambient Air Quality Standard)的地區,Carroll 等人(1997)描述瞭如何分析休斯敦的臭氧時測資料,這些資料是由設在休斯頓的9至12個監測站在1980~1993年間收集來的。除了臭氧濃度外,每一監測站還記錄了另外三個氣象量:溫度、風速及風向。 這一專案在統計方面有三個主要目標: 1. 提供有關缺失資料的總和模式的資訊(且/或提供獲得這種資訊的工具),同時提供有關臭氧水平和三個氣象變數的測量質量的資訊。 2. 建立--個有關臭氧強度的模型,由此來預測休斯頓地區1980年到1993間任何時刻任何給定的地區的臭氧濃度。 3. 運用此模型來佔計描述長期暴露或短期高濃度暴能的暴講指數。同時, 把普查資訊和不同的暴露指數相結合得到人口總體的暴鏻指數。 研究人員建立的空間一時間模型所提供的估討表明,最高濃度的臭氧水平發生在兒童人口相對較少的地方。還有,據該模型估計,從1980到1993年兒童在臭氧中的暴露減少了約20%。所得到的這一人口總體暴露的分佈蘊涵著一些方針政策上的解釋。具體說來,由此得出,如果想評估人口總體的暴露情況,那麼,現今監測站的安置並不理想。這一專案涉及從資料中獲取知識的所有四個組成部分: 設計監測站應建立在城中的何處,決定以何種頻繁的程度來採集資料以及需要記錄僕麼量;描出資料的空間-時間圖形;建立臭氧資料、氣象資料和人口資料的空間-時間模型;最後,寫一份報告以能夠幫助地區和聯邦官員制定關於降低臭氧濃度的政策。 民意測驗和偏好調查公眾意見、消費者的偏好及關於選舉的民意測驗常被用於評估一部分公民對某問題、某產品或感興趣的候選人等的觀點和偏愛。美國公眾每天都能從報紙、雜志、收音機、電視中聽到或看到這些民意測驗的結果。例如,每隔兩天當地報紙就登出有關以下問題的調查結果: •消費者對美國經濟木來前景的信心。 •對即將到來的選舉和政黨預備會議中候選人的偏愛。 •對聯邦所得稅返還中的欺騙行為的態度。 •對指定產品偏愛的調查(例如,其他國家的汽車對美國汽車;可口可樂 (Coke)對百事可樂(Pepsi);麥當勞(McDonald)對 Wendy 快餐。 •北卡羅來納(North Carolina)居民對有關菸草道德爭論的反映。 •投票者對增稅提案和閒防預算變動提案的觀點。 關於民意測驗可以提出大量的問題。假定我們考慮一個民意測驗,以瞭解公眾對於提高密歇根州所得稅的動議的意見。什麼是民意調查員所光心的總體?民意調查員對密歇根的所有居民都感興趣,還是僅對那些近來繳納所得稅的公民感
L.4 統計學家做什麼 •11. 興趣本真是抽自這個總體嗎?如果所關心的總體是所有近來繳納所得稅的人,民意調查員是否確信抽樣得到的個人都是近來納稅的人?問什麼幫的問題,摧問時如何措辭?是否問每個人同樣的問題?是不是問題的表達方式會使回答產生偏差?我們能否相信這些民意測驗的結果?這些結果代表一般公眾當前對調查問題的認識嗎? 民意測驗和偏好調查對消費者來說是重要的、看得見的應用統計的例項。我們將在第十章中更詳細地討論這個主題。我們希望等學完這些內容後,你能更好地理解這些民意測驗的結果。 1.4 統計學家做什麼統計學家是做什麼的?就從資料中學習而言,統計學象要進行試驗或調查的設計,用圖表或資料概括準備分析用的資料、分析資料及報告分析結果等所有方面的工作。收集資料的方法有好有壞。統計學家運用他們現有的有關調查技術和科學調設計的知識,或者開發新的技術為收集資料提供好的指導方法。我們將在第二章中進一步探討這些方面。 一旦資料收集完後,必須先對資料進行概括,然後才可能做出有意義的解釋。 統計學家可以建議或運用有效的方法,以圖表、表格、數字等形式來概括資料。精心設計的圖、表是瞭解資料的第一步。同時,平均值(或典型的值)和一些反映資料的極差或分散性特徵指標的量對於解釋也很有幫助。這些內容將在第三章中詳細討論。 統計學的日標在十基於從感興趣的總體抽得的岸本的測址信良礦孩總體做比! 搓街。在從資料中學習的四個階段中,推斷是在分析這一階段中進行的。例如,市場調研中只對很少一部分新產品的潛在購買者進行調查,但是,所有潛在購買者 (總體)的可能反應必須從被調查的潛在購買者(樣本)的反應中推斷出來。如果該市場調研被認真地設計並很好地執行了,那麼樣本中那些人的反應應該與總體的反應吻合得較好(但是未必嚴格一致)。之所以如此,是因為機率的基本概念允許我們對感興趣的總體做出推斷,這一椎斷包含我們對總體的最佳推測以及最佳推測可能存在的誤差。 我們透過一個例子來說明如何作出推斷。假定查賬人從一個有2.5萬多筆財務賬目的集合中隨機地選取了2,000筆,發現84(佔4.2%)份有錯。對這 25,000 多筆賬目的集合我們能說什麼?基於2,000筆賬目樣本得到的資訊,我們對 25,000筆賬目的出錯率能作出怎樣的推斷?我們將在第十章說明對賬目總體出錯率的最佳推測是4.2%(推斷),並且這個最佳推測值介丁總體賬目的實際出錯率 (未知》土0.9%之間。這個加減因子稱為推斷的可能誤差。任何人都可以對賬日
•12• 第一章什麼是統計出錯率作出推測,而機率的概念允許我們計算出這種推測可能出現的誤差。 在進行資料分析時,統計工作者可能利用現有的方法作出推斷,而有些理論統計工作者運用更高等的數學和機率的理論來發展新的方法。我們將在第四章討論有關機率的基本概念和抽樣分佈,然後從第五章開始學習分析樣本資料的方法。 最後,統計工作老要報告分析結果,這是理解資料的最後一個階段。分析結果報告的形式從非正式的談話到正式的報告多種多樣。在一個比較正式的用視覺化工具等來做的口頭講解或一份研究報告中,可以利用圖形、表格、資料圖表、以及對資料所做的分析來幫助傳達在資料中所發現的內容:而在非正式的交談中往往就做不到這一點。報告或交流應該注意向感興趣的聽眾傳達從樣本資料所能獲取的總體的倍息,並且應儘可能地用非技術性術語來表達以避免造成含糊不清。有關如何報告、解釋分析結果的更詳細的內容在第二十章中給出。在一些章節中,結合闡明統計概念的例項,我們也將指出分析報告中所應包括的重要組成部分。 值得指出的是,前而所討論的思想觀點跟每一個搞調查研究和試驗的人都是密切相關的。具有統計學學位的人相對說是較少的,許多組織機構中只有很少幾個統計工作者,有的甚至根本沒有。這樣,在許多研究中資料收集方案的設計,數據的概括和統計分析,解釋研究結果等都要由參與研究的人員在沒有或幾乎沒有真正的統計學家幫助的情況下而完成。即使統計工作者是研究小組中的活躍分子,其他的小組成員具有統計設計和資料分析概念的一般知識仍很重要。事實上, 小組中每一成員都把某一方面的專業知識和經驗帶進所面對的問題中去,因而,在如何進行調查的設計以及如何來解釋分析結果方面,可以群策群力。 1.5 質量和工序改進看到這個題目,或許有人會疑惑,我們在統計課本中怎麼會提到質量工序改進的問題呢?這樣做是為了讓讀者瞭解商業和科學領域中一些涉及求知於資料的更廣泛的內容。 第二次世界大戰後,美國商業和經濟在世界商業中處於支配地位,而且這一狀況一直持續了將近30年。那時,人們很少試圖去改變做事的方式,主要精力集中於大規模作業和完善批次生產。然開,從20世紀70年代中期至今,許多企業都必須面對來自日本,最近還有來自遠東國家,如中國和韓國等同類企業的激烈競爭。 領絲而非救已經成為消費者購買商品時主要考慮的標準,美國企業為了調整經營方式以適應這一變化而經歷了一段艱難的時刻。除非美國企業積極地改變他們的企業經營方式,否則,在這場質量革命中將會有更多的企業遭遇不幸。 日本人是第一個懂得質量至上這一理念的。他們積極地採納 Deming(1981) 等人提出的統計質量管理和工序控制的建議,並且啟動了全面質管理的程式。
1.5 質量和工序改進•13• 整個組織,從上層管理部門到下層質量管理部門,他們都有一個提高產品質量、改進生產工序的約定。他們從不滿足於現狀,不斷尋求更好、更新的方法。 許多美國公司現在開始在質量改進機構的協助下朝著好的方向發展。以下十項基本要求是成功地進行質改進的基礎: 成功實施質量改進過程的基本要求 I.以顧客為中心是該過程的最重要部分。 2.使質量改進過程作為管理系統的一部分成為管理部門的長期責任。 3. 相信總有改進的餘地。 4. 相信防止問題發生總比問題發生後再改正要好。 5.管理部門重視、領導並參與。 6.把不出任何錯誤作為工作標準(目標)。 7.全體員工或作為個人,或組成小組積極參與。 8.專注於改進工序,而不是改造人。 9.相信如果供應廠商理解你的需要,他們定會跟你合作。 10.表彰成功。 讓全公司上下都齊心協力參與質改進過程旨在於改進工序。多年來,大公司們為了擴大和改進生產,通常的做法是透過增加員工或引進技術來加速生產過程,而沒有察覺到工作流程中的不足之處。在 Michael Hammer 及 James Champy 所著的具有重大突破的 Reengineering the Cor poration (1995)一書及 Hammer 後來的Beyond Reengineering(1996)一書中,Hammer 和 Champy 指出,許多公司的商業過程在激烈的商業和技術環境變化中一直保持不變;一個公司可以透過完全重新思考他們的商業過程來實現質量、效率、效益的巨大提高。我們把一個任務定義為一個工作單元、把一個工序定義為一系列為顧客創造價值的相關任務,而 Hammer 和 Champy則建議公司把他們謀求變化的注意力集中於創造價值的活動上。 事實勝於雄辯。幾乎所有大企業—服裝業(如 Nike,耐克),化工業(如 Dupont,杜邦),計算機裝置企業(如Dell,戴爾),計算機軟體業(如 Microsoft,微軟),電子業(如 General Electrie,通用電器),食品業(如 Nestle,雀巢),日用商品業 (如WalMart),網路通訊業(如 Cisco),石油業(如 Exxon Mobil),醫藥業(如 Merck) 等等,這些企業中像部門領導這樣有競爭力的職位已經、正在或即將受到挑戰。在許多例子中,企業領導未能眼上市場中令人眼花綜亂的變化步伐。隨著管理人員和股東們對兼併能帶來市場份額的增加、成本的降低、利潤的增加抱有很高的期望,企業間的兼併激增。然而不幸的是,成功實現合併的既定目標的企業少得可憐由此可見,還應考慮其他的一些東西。Christopher Meyer 在他著的 Fast Cyle
•14• 第•章什麼是統計 Time(1993)中舉例說明了在瞬息萬變的市場條件下,只有那些能夠“持續地、可靠地和能獲利地”向消費者提供最大價值的競爭者才能獲勝。Meyer 的基本觀點是公司必須縮短整個商業迴圈週期,這個迴圈始於對消費者需求的識別,終止於消費者對公司提供的產品或服務的支付。如果一個公司能夠隨著需求和競爭環境的變化而始終做好這一環節,它就會在競爭中獲勝。 不管公司是集中於改進商業過程還是加快迴圈,變化的依據將是有關消費者需求的基本資料、當前企業的迴圈時間,以及企業中可用來比較的基準資料。那些明確他們正在努力做什麼,建立當前所需資料以用來評價消費者需求和當前公司的運作狀況,迅速及時地實現被推薦的變革並且對經驗教訓進行整理備案的企業能夠在競爭中成為勝者。這四點,與我們前面章節中討論的從資料中學習的四個步驟非常類似,能使人理解統計(從資料中學習)在商業環境中的適用性。這兒列出了許多有助於改進這些商業過程的統計工具和技術。 用於質量改進和再造工程的統計工具、技術和方法 • 直方圖 •數值描述量(均值、標準差、比例等) •散點圖 •線圖(任散點圖中用線連線各點) •控制圖: (梯本均值), (樣本極差),及s(樣本標準差) •抽樣方案 •試驗設計此處所列出的及本書中將要討論的統計工具和概念只是改進商業過程或加快迴圈時間的技術中很小的一部分。當你在本書的各個部分遇到這些工具和概念時,不要忘記它們可能對商業改進有用。質量改進、工序重新設計及加快迴圈時間顯然已成為20世紀90年代的美國企業在以競爭加劇、更加聯合、專業化程度加強為特點的世界市場中謀求發展的焦點。不管我們是作為消費者還是作為企業參與者,這些轉變將會對我們所有人帶來影響,所以我們瞭解一些作為這場革命的一部分的統計工具是有益的。最後,近年來質量控制的觀點和原則已經被用於製造業以外的其他領域。服務行業如賓館、飯店和百貨商店等已成功地把質量控制的原理用於自己的經營管理中。許多聯邦機構例如國內稅務總局(IRS)、國防部和農業部(USDA)也已採用質量控制的原理來改善他們機構的工作。 1.6 學生注意我們透過詞語和概念進行思考。統計學科的學習要求我們記憶新的術語和概念(正如學習一門外語一樣),務必記住這些定義、定理和概念。
1.7 小結•15• 勺此同時,要著眼了理解資料所包含的資訊這一大概念,不要讓細節模糊了研究物件的出資料信總反映出來的主要特徵。本書的教學目標就在於明晰和發揮這些統計的大概念。 1.7 小結統計學科及那些運用統計工具的學科研究如何從資料中獲取知識。醫學研究人員、社會學家、會計、農學家、消費者、政府領導和職業統計學寮都從事與資料收集、資料概括、資料分析和資料分析結果途釋等有關的作。 補充練習基本技能 1.1(生物)選擇合適的料來喂蝦或其他的海洋生物是海水養殖的一個重要方面。水產研究人員想估計餵了6個月指定飼料後蝦的平均重量。從一個人工挖掘的魚塘中隨機地選擇了100只蝦並稱了每一隻的重。 a. 給出研究人員感興趣的總體。 b. 給出相應的樣本。 c.研究人員對總體的僕麼特徵感興趣。 d.如果用樣本的測量值對總體的某些特徵進行推斷,為什麼說對椎斷的可靠性的度量是重要的? 1.2(環境)放射性廢料的處理及一些礦業運作中放射性材料的生產給美國的一些地區造成了嚴重的汙染問題。州衛生部官員決定對某可疑地區進行放射性水平的調查。在這個地區隨機地選擇了 200個點,並測出每個點處的放射性水平。 就這個抽樣情況,回答練習1.1中a,b,c,d四問。 1.3(社會)某城市中的某社會研究人員想得到城市家庭中接受社會福利支持的孩子個數的有關資訊。從該城市的福利卷宗中隨機地抽取了400 戶家庭進行查證,得到每戶家庭接受福利孩子的數。對這個抽樣調查回答練習1.1中a,b, c,d熙問。 1.4(調查科學)查查你們當地報紙或新聞雜誌上的一些熱點問題,找出對這些何題最近民意調查的結果。 a.說出為了獲得樣本測量值而觀察的研究物件。 b.指出對每一研究物件所進行的測量。 c.明確指出所要調查的總體。 d. 調查人員對總體的哪個或哪些特徵感興趣?
• 16• 第一章竹麼是統計 e.調查文章有沒有解釋樣本是如何抽取的? f.調查文章有沒有包括樣本中測量值的數目? 8.關於總體特徵做出了何種推斷? h.調查文章有沒有告訴你對總體特徵推斷的可信度? 1.5(政府)由於最近高中橄欖球運動員頸部受傷的數量有所增加,商業部設計了一個調查來估計高中橄欖球運動員戴的防護帽的強度。從五個近期生產防護帽的公司收集了共540個防護帽。該機構把防護帽送到一獨立檢測機構去評估防護帽的緩衝作用及面罩被扭轉時傳給頸部的衝擊力。 a.感興趣的總體是什麼? b.樣本是什麼? c.應該測量什麼量? d.關於高中運動員所戴的防護帽的安全性,這項調查有哪些主要侷限?例如,運動員頸部力量是否與傳遞到頸部的衝擊力以及運動員是否會受傷有關? 1.6(數育)一個擁有35000名學生的大學中的教員評議會正考慮把現行的評分政策由A,B,C,D,E改為加減系統-即B+,B,B-而不僅僅是B,教員評議會對學生們關於這種變化的意見感興趣,將抽取由500名學生組成的樣本。 a. 什麼是感興趣的總體? b. 什麼是樣本? c.如何抽取樣本? d.調查問卷中應包括什麼型別的問題?
第二章第二部分收集資料利用調查和科學研究來收集資料