AI 新聞與投資
統計學方法與資料分析引論

第十章說明,為了使模擬得到的機率落在真實機率的0.01 範圍內的把握為95%,

7 / 34

投擲的次數至少應該是7500,而不是我們前面所用的500次。 如果希望求出投擲2枚硬幣恰好觀察到一個硬幣正面朝上的機率,從表4.1 我們得到

4.3 基本的非件關係和機率法則•141• P(恰有…個是正面朝上)~ 17+125 = 0.484 500 這個值很接近於理論上的機率,也就是我們曾經給出的 0.5。 注意,我們可以很容易地把上面的例子進行修改,使之適用下小均勻硬幣的投擲。假定我們投擲一個加重的一分硬幣,拋一次時該硬幣正面朝上的機率是 0.70,而反面朝上的機率是0.30。我們可以指定 H這個基本緊件當取得隨機數為0,1,2,3,4,5,6之一時發生,而T這個基本事件當取得隨機數為7,8,9之一時發生。象前面一樣,執行同一個模擬程式,但我們對輸出結果所作的解釋是不同的。 練習應用 4.3(教青)假定考試由20道判斷題組成。學生在參加考試時,對每個問題猜測其答案。學生正確回答15 道題或15道題以上的機率是多少?[提示:使用模擬方法。產生多組(2000 組或更多)一位數,每組20個。每個一位數代表考試中一個問題的答案,其中偶數代表正確的回答,奇數代表錯誤的回答。確定這些組中有1.5題或15題以上答對的組的頻率。] 4.4(醫藥)4.1節中的例子考察了一項篩選檢查的可靠性問題。假定當陽性結果的機率是0.75時,我們想要模擬在一組20個檢查結果中,觀察到至少15 個陽性結果、5個陰性結果的機率。使用隨機數發生器去模擬進行20 個篩選檢查。 2. 讓一個2位數表示對一個人進行篩選檢查的結果。哪個數字代表檢查結果是陽性的?哪個數字代表檢查的結果是陰性的? b.如果我們產生2000個由20個2位數構成的集合,怎樣用模擬的結果去近似求出在20個檢查中,出現至少15 個陽性結果的機率? 4.3 基本的事件關係和機率法則一個事件,比如說事件A的機率總滿足性質 O≤P(A)≤1, 即一個事件的機率在0(該事件的發生是不可能的)到1(該事件的發生是必然的) 的範圍內。 假定A 和B代表試驗中的兩個事件,而你關心一個新的事件,即由A或B發生構成的事件。例如,假定我們擲一雙骰子並且定義下列事件: A:總點數是7

• 142• 第四章機率和機率分佈 B:總點數是11 則少件“A或B發生“是指這樣的事件:你擲一雙骰子,所得總點數是7或11。 注意,在這個例子中,事件A和B 是相互排斥的;即如果你觀察到事件A(總數是7),你就不能同時觀察到事件B(總數是11)。這就是說,如果A發生、則B 不能發生(並且反過來也是如此)。 定義4.1 在進行一次試驗時,如果一個事件A的發生排除了另一個事件B 發生的可能,稱事件 A 和B是相互排斥的。 事件的機率必須滿足的第二條性質是用件相互排斥的概念來給出的。當兩個事件相互排斥時,則“兩事件之一發生”這個事件的機率是兩個事件機率的和。 定義4.2 如果兩個事件A和B 相互排斥,則事件“A或B發生”的機率是 P(A或B)=P(A)+P(B)。 後面我們將定義兩個件的並,定義4.2是兩個事件並的一個特例。 相互排斥事件機率的可加性的定義可推廣到兩個以上的事件。例如,當我們擲一雙骰子時,骰子出現的點數的和設為S,S可取2,3,4,⋯,11,12 中任一值。 在投擲一次骰子時,我們僅能觀察到其中一值。因此,數值2,3,•,12代表了相互排斥的事件。如果我們想要得出投擲骰子得到的總點數小於或等於4的機率,這個機率是 P(S≤4) = P(2)+ P(3) +P(4) 對於這個試驗,散子的落下有36 種不同的方式,這些方式是等可能的。當我們觀察到第一個骰子1朝上,第二個骰子也是1朝上時,用符號(1,1)表示。當我行觀察到第一個骰子1朝上,第二個骰子是2朝上時,用符號(1,2)表示。換句話說,對這個試驗,可能的結果是 (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) (1,3)(2,3)(3,3)(4,3)(5,3)(6,3) (1,4) (2.4) (3,4)(4,4) (5,4) (6,4) (1,5)(2,5)(3,5)(4,5)(5,5)(6,5) (1,6) (2,6) (3,6) (4,6)(5,6)(6,6) 由此可見,其中僅有一個件(1,1)使得總點數為2。因此,在大量的重複試驗中, 我們期望總點數為2發生的機率為頻率1/36,從而我們令P(2)=1/36。如果我們觀察到結果(1,2)或(2,1),則總點數為S=3的事件發生。因此,P(3)=2/36= 1/18。同樣地,我們求出P(4)=3/36=1/12。由此得到 P(S≤4) = P(2)+P(3) +P(4) = 件機率的第三條性質關係到事件和它的補。

4.3 基本的事件關係和機率法則•143• 定義4.3 書件A的補定義為“事件A不發生”這樣一個半件。A的補用符導及表示。 出以下結論這樣,如果我們定義事件A的補作為一個新的事件,也就是“A不發生”,則得 P(A)+P(A)=1。 作為一個子,再次到擲兩枚硬幣的試驗。如果,在多次重複試驗中,你觀察到 4件 A:“2枚硬幣正面朝上“發生次數的比例是1/4,那麼這就意味著你觀察到不事件,即“2枚硬幣正面不都朝上“發生次數的比例是3/4。這樣,P(A)和P(A) 的和總是為1。 我們把事件的機率必須滿足的三條性質總結如下: 機率的性質如果在一個試驗中,A和B 是兩個相互排斥的事件,那麼 P(A)和 P(B)必須滿足下列性質: 1. O≤P(A)≤1稱O≤P(B)≤1 2. P(A或B發生)=P(A) +P(B) 3. P(A)+P(五)=1和P(B)+P(B)=1 現在我們可以定義另外兩個事件之間的關係:兩個事件的並和交。 定義4.4 兩個事件A 和B的並是包含在A或B(或兩者)中的所有基本事件的集合,表示為AUB。 定義4.5 兩個書件A和B的交是既包含在A也包含在B中的所有基本事件的集合,表示為A門B。 這些定義連同事件的補的定義一起,使一些簡單的概念公式化。當事件A不發生時,事件A 發生;當A或B發生時,AUB發生;當A和B同時發生時, AnB發生。 相互排斥事件的機率可加性,叫做相互我厭要件的加若法剛,這個法則可以推廣到一般的情形。 定義4.6 考慮事件A和B。A 和B 並的機率是 P(A UB) = P(A) + P(B)- P(AnB) 例4.1 事件和事件的機率在圖4.1 中用 Venn 《維恩)圖表示出來。使用這些圖確定下列機率: A 0.45 0.05 B 0.15 a.P(A), P(A) b.P(B),P(B) 圖4.1

• 144• 第四章機率和機率分佈 c.P(AnB) d.P(AUB) 解答從 Venn 圖,我們能得到下列機率: a.P(A)=0.5,因此 P(A)=1-0.5=0.5 b.P(B)=0.2, 因此 P(B)=1-0.2=0.8 C.P(ANB)=0.05 d.P(AUB)=P(A)+P(B)- P(AnB)=0.5+0.2-0.05=0.65 4.4 條件機率和獨立性考慮下列情況:在對很多保險索賠的分析中,根據保險的型別以及索賠是否屬於欺詐對索賠進行分類,得到的結果見表4.2。假定你負責稽核保險索賠—具體地說,是要識別出欺詐索賠-—-並且正在處理一樁索賠,那麼,事件F既“該樁索賠為欺詐索賠”的機率是多少?為了回答這個問題,你考察表4.2,並且注意到在所有的素賠中有10%是欺詐索賠。於是,假定在表中給出的各個百分比與收到特定型別的索賠的真實機率充分接近,就得出 P(F)=0.10。你會說你面對個欺詐索賠風險的機率有0.10嗎?我們想不會,因為你有一些可以影響估計 P(F)的附加資訊。這些附加資訊與你正在核審的保險單的型別(火災,汽車,或其他)有關。 型別欺詐素賠非欺詐索賠總和火災 6 14 20 表4.2 保險案賠的分類保險單的型別(%) 汔車 1 29 30 總和% 其他 3 47 50 10 06 100 假定你的附加資訊是這樁索賠與一張火災保險單有關。檢查表4.2,我們看到所有的索賠中有20%(或0.20)與火災保險單有關,有6%(或0.06)是欺詐性火實保險素賠。因此,可以得到在已知是火災保險單的情況下,該樁索賠是欺詐索賠的機率為 P(F |火險單)=欺詐火險單索賠的比例/火險單索賠的比例 0.06 = 0.20 =0.30

4.4 茶件機率和獨立性•145, 機率 P(FI火險單)稱為事件F 的親件機率——即在給定“火險單”這個出件已經發生的條件下,事件F 的機率。這告訴你所有的火險單索賠中30%是欺詐性的。任表示式 P(F|火險單)中,垂直的線代表短語“給定⋯•••”,或簡化為“給定”。 這樣,該表示式讀作“給定事件‘火險單’時,事件F的機率。” %P(F)=0.10稱為事件戶的無條件機率或邊緣機率,它給出了索賠是欺詐性索賠的次數的比例—即在非常多(無窮地多)的重複試驗(這裡,試驗指收到一項保險索賠並且確定索賠是否是欺詐性索賠)中蟲件F 發生次數的比例。與此相對,在給定索賠為火險單素賠時,F的條件機率P(FI火險單)給出的是火險單素賠是欺詐性索賠的比例。很顯然,在給定保險單的型別的條件下,F的條件機率在測定欺詐的風險時將比F的無條件機率有更大的幫助。 定義4.7 考慮兩個有非零機率 P(A)和P(B)的事件A和B,給定件BS 時事件A 的條件機率是 P(AI B)= P(AOB) P(B) 給事件A 時事件B的條件機率是 P(BIA)=PAAB) P(A) 利用條件機率的定義,我們可以給出所謂乘法法則。 定義4.8 兩個事件A 和B的交的機率是 P(ANB)= P(A)P(BIA) = P(B)P(AIB) 定義4.7和定義4.8中都包含條件機率,它們之間的惟一差別在於什麼機率是已知的,什麼機率需要計算。當交的機率 P(A門B)和事件A的機率P(A)已知時,我們可以求出P(BIA)。當我們已知 P(A)和 P(BI A)時,可以求出 P(A門B)。 例4.2 挑選2名管理員作為公司內的安全代表。已知6名管理員在研究部門,4名管理員在開發部門,並且在挑選時,每個組中的管理員被選中的機會相同。求從研究部門選擇2個管理員的機率。 解答設 A是第1個管理員從研究部門選出的事件,設B是第2個管理員也從研究部門選:的事件。顯然,我們要求出 P(A並且B)=P(A門B)=P(BIA)P(A)。 對這個例子, P(A)-郵然霹白價體處數-品管理員數

• 146• 第四章機率和機率分佈並且 P(BIA) =選出一個研究部口管理具唇的研究鴦理具數選出一個研究部門管理員後的管理員數 -ew 於是 P(A nB) = P(A)P(BIA)-品g)- 39=0.333 因此,若假定兩組中的人被選中的機會相同,則從研究部門選出2個管理員的機率是0.333。 假定事件 A的機率與事件B是杏發生無關,即設 P(AIB)= P(A) 則我們說寶件A 的發生不依賴於事件B的發生,或簡單地說事件A 和B 是相互獨立的事件。當P(A|B) P(A)時,事件A的發生依賴子事件B的發生,此時說件A和B 是相關的事件。 定義4.9 兩事件A和B 是相互獨立的事件,如果 P(A IB)= P(A)或P(B IA)=P(B) {注意:你可以證明,如果P(AIB)=P(A),則P IA)=P(B),反之亦然。) 從定義4.9可以匯出 P(AnB)的一個特殊情況。當件 A 和B相互獨立時,有 P(A n B)= P(A)P(B!A) = P(A)P(B) 相互獨立的概念在抽樣中有特別的重要性。在本書後面的章節中,我們將討論從兩個(或兩個以上)總體中抽取樣本以比較總體的均值,方差,或者其他的總體引數。對於這些應用中的大多數,在抽取樣本時,我們將使在一個樣本中的觀察值與另一個樣本中的值獨立。我們把這樣的樣本叫做獨立樣本。 練習基本技能 4.5 把一枚硬幣擲3次。在表格中列出所有可能的基本事件(第一次投擲的結果,第二次投擲的結果,第三次授擲的結果)。 4.6 在練習4.5中,假設每一個基本事件發生的機率是1/8,求下列機率: a.A:觀察到恰好有1次正面朝上; b.B:觀察到有1次或1次以上正面朝上; c.C:觀察到正面均不朝上。 4.7 對練習4.6:

4.4 條件機率和獨立性•147• 8.計算事件 A,B,C的補的機率; b.判斷事件A和B是否是相互排斥的。 4.8 對練習4.6中的事件求下列條件機率。 2,P(AIB) b.P(AIC) c.P(BIC) 4.9 參照練習 4.8。水件A 和1相互獨立嗎?解釋其原因。對件A和 C, 件B和C又如何? 4.10 滾動一枚骰子觀察其停止時朝上的數字。求下列事件的機率: a.A:觀察到的是一個6; b.B:觀察到的是一個偶數; c.C:觀察到的是一個大下2的數; d.D:觀察到的是一個比2大的偶數。 4.11 參照練習4.10。彰件 A,B 和C中哪些是相互獨立的?哪些是互相排斥的? 4.12 考慮一個試驗中的下列基本事件: 基本事件機率 I 0.20 2 0.25 3 0.15 4 0.10 5 0.30 令事件A 由基本事件1,35組成,且事件B 由基本事件4和5組成。 8. 求 P(A)和 P(B)。 b.求P(件A和B 都發生)。 c求P(事件A或B發生)。 4.13 參照續習4.12。P(事件A或B發生)=P(A)+ P(B)成立嗎?為什麼? 應用 4.14(數育)一個學生下學期必須修會計課和經濟課。假設時間表沒有衝突,如果有4個會計課課堂和3個經濟課課堂可選,描述他選擇一個會計課課堂和一個經濟課課堂的可能的基本事件。 4.I5(工程)一所醫院的急診室有2臺備用發電機,其中任何一臺能為醫院的基本運轉供應足夠的電。我們定義事件A和B如下: 件A:1號發電機工作正常事件B:2號發電機工作正常用語言描述下列事件:

• 148• 第門住機率和機率分佈 a. 件A的補; b.BIA; c.事件A 或B發生。 4.161人力資源) 透過對很多大公司的調查,得到有關對升職或調動工作的意見的水件的機率如下表所示。 已婚升職/調動未婚總利舴絕接受總利雙方有職業 0.184 0.276 0.46 一方有職業 0.0555 0.3145 0.37 0.0170. 0.1530 0.17 0.2565 0.7435 利用上述機率回答下列問題: 2. •個(隨機選擇的)專職人員接受升職的機率是多少?拒絕升職的機率是多少? b.個(隨機選擇的)專職人員為雙方均有職業的夫婦中的一方的機率是多少?夫婦雙方僅這一個人有職業的機率呢? 4.17(商業)一個機構投資者考慮對5個公司中的2個公司進行一項大的投資。假設投資者不知道S個公司中的2個公司關於新產品的開發的基礎不穩定。 a. 列出所有可能的基本事件。 b.確定從3個基礎更好的公司中選出2個公司的機率。 c.所選公司中包含1個基礎不穩定的公司的機率是多少? d.選出2個基礎最不穩定公司的機率是多少? 4.18(社會)對一個公司兩個車間的工人進行調查,調查包括下列問題:響應於工人的合理投訴的管理工作有效嗎?結果顯示如下。 已調查數字 192 248 車間1 車間2 回答是“差”的數字 48 80 設事件A 為“工人來自於1號車間”這個事件,事件B為“回答為“差”的事件。計算 P(A),P(B)和P(ANB)。 4.19 參考練習 4.16。 a. 事件A 和B 相互獨立嗎?

4.4 條件機率和獨立性•149• b.求 P(B|A)和 P(BI A)。它們相等嗎? 4.20 一家人公司為了評估其僱員在日常工作中的表現,花了相當多的時間開發出•套僱員表現等級的評估少法。這樣,可以把應當被安排在重點崗位上的人確定下來,並在需要時進行重大調整。確定重點崗位人員的關鍵是體現僱員能力的指標,即可以負荷的工作量,以及僱員所接受的正規工作訓練。 正規訓練上作量低市等無 0.01 0.05 0.10 很少 0.02 0.06 0.15 •定程度 0.12 0.17 0.16 全面 0.04 0.10 0.22 由負荷的工作量以及所接受的正規工作訓練把所有僱員分成12個類。各個類中的僱員被安排在望要崗位上的機率如表所示。下面定義了3個事件(A,B和C): A:一個僱員荷的工作量是屬於高的; B:-個僱員具有最高的(全面)正規訓練水平; C:•個僱員很少或沒有正規訓練並且工作量為中低檔。 a. 求 P(A),P(B),和P(C)。 b.求 P(AIB),P(AIB)和 P(BIC)。 c.求 P(AUB),P(AnC)和P(BNC)。 4.21(商業)某個火城市的公用事業公司發現其70%的顧客付清每月的賬單。 a.假定從所有顧客的列表中隨機選擇2名顧客。兩個顧客都付清每月賬單的機率是多少? B. 至少一個顧客付清每月賬單的機率是多少? 4.22 參照練習4.21。對公司記錄更詳細的檢查表明,付清當月帳單的顧客中,95%的顧客也會付清下一個月的賬單。沒有付清當月賬單的顧客中,僅有 10%的顧客會付清下一個月的賬單。 a.求隨機選出的一位顧客在連續的兩個月中都付清賬單的機率。 b.求隨機選出的一位顧客在連續的兩個月中都不付清賬單的機率。 c.求隨機選出的一位顧客在連續的兩個月中只付清一個月賬單的機率。

• 150)• 第四章機率和機率分佈 4.5 Bayes 公式在本節中,我們將說明如何用樣本資料,透過 Bayes(貝葉斯)公式來更新條件機率。這些“更新”了的條件機率可應用在決策過程中。這些方法的一個特殊應用是診斷檢查的評估。假定一名肉類的檢查員必須決定一個隨機選擇的肉的樣本中是公含有大腸桿菌(E.coli)。檢查員進行了一項診斷檢查。理論上,陽性結果 (Pos)意味著肉樣本中確實含有大腸桿菌,而陰性結果(Neg)意味著肉樣本中不含大腸桿菌。然而,診斷檢查偶爾有誤差。檢查的結果可能是假陽性,即檢查結果錯誤地顯示含有大腸桿菌,或假陰性,即檢查結果錯誤地顯示不含有大腸桿菌。為了評估這種診斷檢查的精確性,進行了大量的篩選檢驗。例如,在10000個肉的樣本中放入大腸桿菌(E),診斷檢查的結果是9500 個樣本呈陽性和500 個樣本星陰性;也就是說,10000 個檢查結果中有500個是假陰性。另有10000個樣本都清除了大腸桿菌(NE),並且診斷檢查結果100個樣本為陽性,9900個樣本為陰性;即在 10 000個檢查結果中有100個假陽性。我們在下表中把這些結果歸納出來: 診斷檢查結果肉祥本狀況 10 000 檢查結果的評估如下: 真實的陽性率= P(PoslE)= 2000 -0.95 假的陽性率=P(PoslNE)= 10000-0.01 真實的陰性率=P(Neg|NE)=; 990% =0.99 10000 假的陰性率=P(NegIE)=200 10000-0.05 診斷檢驗的靈敏度是真陽性率,而診斷檢驗的精確度是真陰性率。 檢查員面臨的主要問題是當檢查結果為陽性時,判斷肉樣本中出現大腸桿菌的機率,即檢查員需要知道 P(E|Pos)。如下列計算所示,Bayes 公式回答了這個問題。計算時,我們需要知道被檢查的這類肉中含有大腸桿菌的比率。在此例中, 假定在所有肉的樣本中有 4.5%的樣本含大腸桿菌,即大腸桿菌的感染率 P(E)=

4.5 Baycs 公式 • 151• 0.045。我們可以如下計算 P(ElPos): P(E I Pos) = P(E N Pos) P(ED Pos) P(Pos) = P(E N FOs) + P(NE N Pos) P(Pos L E)P(E) = P(Pos 1 E)P(E) + P(EOs NE)P(NE) (0.95)(0.045) =70.95)(0.045)+(0.01)(1-0.045) =0.817 這樣,在檢查結果為陽性的被檢樣本中,有81.7%是真正含大腸桿菌的。另外,我們也可以得出,當在肉的樣本並沒有大腸桿菌時,被檢樣本的18.3%顯示了含有大腸桿菌。 例4.3 圖書俱樂部把其成員分為三組:大量購買者、中等和少量購買者,給俱樂部成員郵寄時,對各組分開進行。總體而言,20%的成員是大購買者,30%為中等, 50%為少量購買者。成員加入俱樂部18個月以後,才給他分組,但在此之前要做一個檢驗,以考察用其前3個月的購買量來給他分組的可行性。下面是從已經被分組後的大量購買者、中等和少量購買的會員的現存記錄中得到的百分比。 前3個月購買量 0 1 2 3+ 大量 s 10 30 55 組(%) 中等 15 30 40 15 少量 60 20 15 如果一位成員在前3個月沒有購買書,該成員是少過購買者的機率是多少? 《注意:這個表的每一列的內容是“條件”百分比) 解答用表中的條件機率、各個基礎訂購量組的機率和 Bayes 公式,我們可以計算出所求的條件機率為 P(0|少基)P(少) P(少量10)=PC0 少量)P《少量)+P00| 市等)P(中莓)+P(0】 大述)P(大址) = 0.60(0. $0) + 2:5%0.:30 + 10.03)0.207

• 152• 第四章機率和機率分佈 = 0.845 上述例子說明了 Bayes 公式的基本思想。有個可能的、互相排斥的基礎事件A1,“,Ak,有時這些事件稱為自然的狀態;已知無條件的機率 P(A」),⋯ P(Ax),通常叫做先驗機率;有m個可能的、互相排斥的可觀測事件 B1,,Bm: 給定每個自然狀態下的每個可觀測事件的條件機率 P(B:| A:)也是已知的,這些機率稱為似然。問題是求後驗機率 P(A |B;)。先驗機率和後驗機率是指觀察到事件B:之前和以後的機率。 《作者這裡所說的基礎率件, 涵書 A)、A。灣足條件"0A,為必然發生的事件”——澤者注) 貝葉斯公式如果A1,•,Ak是互相排斥的自然狀態,並且如果B1,•,Bm 是m種可能的互相排斥的可觀測事件,則 P(A: 1B,)= P(B;I A,)P(A,) P(B;IAi)P(Aa) +P(B;I Az)P(Aa)+:+ P(B; I Ak)P(AA) P(B; IA.)P(A:) ZP(B; I A,)P(A:) 例4.4 在電路板的製造中,不合格板主要有三種型別。這三種型別,以及有這三種缺陷的電路板在所有電路板中佔的百分比分別是(1)不恰當的電焊範圍(D.)、 2.8%;(2) 電鍍脫層(Da),1.2%;(3)蝕刻問題(Dg),3.2%。一個電路板至多包含三種缺陷之一。用破壞性試驗肯定可以檢測出成品電路板中的缺陷,然而,要檢測電路板成品中的一個較大的百分比,這不是一個很實際的方法。開發了一種非破壞性的檢測過程,其檢測結果如下:AI,電路板僅有缺陷 D1;A2,電路板僅有缺陷 DzsA3,電路板僅有缺陷D3;AA,電路板沒有缺陷。透過對已知有三種型別的缺陷之一的大量電路板的評估,分別確定出了非破壞性測試的4種結果的似然,並由下表給出: 測試結果 AI A2 As Aa(無觖陷) 缺陷型別 0.90 0.05 0.03 0.02 D2 0.06 0.80 0.05 0.09 Da 0.02 0.06 0.82 0.10 無 0.02 0.01 0.02 0.95

4.5 Bayes 公式 • 153• 如果使用非破壞性測試方法對電路板測試,結果顯示無映陷(A4),那麼電路板沒有缺陷或陷型別為 D1,Dz,或D,的機率是多少? 設Da代表電路板沒有觖陷的狀況。 P(D, IAA) P(AA! DL)P(P,) P(Aa ID.)P(D)+P(AA D,)P(D)+ P(AA D,)P(Ds)+ P(AAI D.)P(D.) -(0.02X(0.020) +- (0.0/(0 5.#-: 03(o.0z)+ (0.3570.02) =0.00056 0.88644- 0.00063 P(D:IA4) P(A4LD2)P(Da) "P(AAIDI)P(D.)+ P(AAIDz)P(D)+ P(AAI D;)P(Ds)+ P(AAIDa)P(Da) 50.09)(0.012) = (0.02)(0.028) + (0.09)(0.012) + (0.10)(0.032)+(0.95)(0.928) 0.88644 = 0.00122 P(Dg1 AA) P(A4LD,)P(Ds) =P(AAID,)P(Di)+ P(AaID)P(D)+ P(AAI Ds)P(Ds)+ P(AAI D.)P(Da) (0.10)(0.032). = (0.02)(0.028)+ (0.09)(0.012)+ (0.10)(0.032)+(0.95)(0.928) = 0.0032 0.88644 = 0,0036 P(D4 I Aa) P(A4I PA)P(D4) =F(A』I D,)P(D.)+ P(AA T D)P(D2)+P(AAID:)P(D.) + P(ATD.)P(D.) (0.95)(0.928) = (0.02)(0.028) + (0.09)(0.012) + (0.10)(0.032) + (0.95)(0.928) = 20.8816 0.88644 = 0.9945 因此,如果新的測試表明,電路板沒有這三種型別的觖陷,那麼電路板事實上無缺陷的機率是很高的:0.9945。在練可4.25中,我們將請你評定非破壞性測試方法對三種型別缺陷測試的敏感性。

• 154• 第章機率和機率分佈練習應用 4.231商業)在一個金融公司的借貸中,有1%是違約的(沒有完全償還)。 公司通常對所有的貸款申請作信用檢查。發現違約貸款中有30%是高風險的, 40%是般風險的,30%是低風險的。不違約貸款中有10%是高風險的,40%是一•般風險的,50%是低風險的。使用Bayes 公式計算一項高風險貸款會成為違約貸款的機率。 4.24 參照練習4.23。證明,在已知貸款為一般風險貸款的條件下,違約的後驗機率等於違約的先驗機率。解釋這為什麼是合理的結果。 4.25 在例4.4中,我們描述了一個確定電路板缺陷的新測試方法。計算這種測試方法準確認定是缺陷 D1,Dz,和D 的機率,即計算 P(D.IA1),P(D21A2)和P (Ds1Ag)a 4.26 在例 4.4中,計算新測試方法不能正確識別出缺陷D1,D2和D;的概率,即計算 P(D」IA,),P(D:lA2)和P(Ds1As)。 4.27(商業)一個從事家庭保險的保險商研究由燒木頭的爐子引起的家庭火灰問題。在所有有這類爐子的家庭中,30%有第一類爐子,25%有第二類爐子, 15%有第二類爐子,30%有其他類爐子。在以後的3年中,第一類爐子的5%,第二類爐子的3%,第三類爐子的2%,和其他類爐子的4%導致了火災。如果有一個特定的家庭發生丫火災,這個家庭用的是第一類爐子的機率多少? 4.28(醫藥)1998年1 月15 日,Neve England Journal of Medicine 雜誌刊登的一篇文章中,報導了利用計算機 x線斷層攝影術(CT)作為臨床上診斷懷疑有闌尾炎的患者的檢查的效用。在有闌尾炎的患者中,至少有20%沒有正確診斷出來。另一方面,檢查時顯示闌尾正常的患者中,15%到40%是經歷過急性闌尾切除術的。為了改進對患者的治療,設計出一項研究來確定使用CT 作為診斷檢查的預期效果。研究中相繼檢查了100個懷疑有急性闌尾炎的患者,這些患者或者是被送到急診部的,或者是從某個診所轉院來的。為這100個患者做了 CT 掃描, 並請外科醫生為每個惠者是否有闌尾炎作出了診斷。最終的臨床結果是在外科通過闌尾切除手術後的闌尾病理檢查或在 CT 掃描後臨床跟蹤至少2個月得到的。 有無闌尾炎掃描的結果一定有闌尾炎(DA) 懷疑有闌尾炎(EA} 一定無闌尾炎(DNA) 已證實(C) 0.943 0.038 0.019 已排除(RO) 0.023 0.045 0.936

4.6 離散變數和連續變數•I55• 在1996年闌尾炎的發病率近似於P(C)=0.00108。 2.求闌尾炎 CT診斷的靈敏度和精確度。 b.求一個闌尾炎患者,用CT 診斷的結果為“一定有闌尾炎(DA)”的機率。 c.求一個未患闌尾炎的患者,用CT診斷的結果為“一定有闌尾炎(DA)”的概率。 d. 求一個未患闌尾炎的惠,用CT 診斷的結果為“一定無闌尾炎(D)NA)”的機率。 4.29(醫藥) 條件機率能應用於診斷疾病。假設有三種密切相關的不同疾病 《A1,Az和As),在人群中分別有25%,15%和12%的發生率。進一步,假設三種可能與這些疾病相聯絡的症狀(B1,B2和 Bs)互相排斥。經驗表明當患有疾病時,出現給定症狀的可能性P(B,1 A,)如下表所示。分別求給定症狀是B31.B2, B:和BA 時患有疾病 A2的機率。 症狀B, B. B2 Bs B-(無症狀) AI 0.08 0.18 0.06 0.68 疾病 A; Az 0.17 0.12 0.07 0.64 As 0.10 0.14 0.08 0.68 4.6 離散變數和連續變數本章中介紹的機率的基本語言用來處理許多不同型別的事件。我們既對定量件機率的計算感興趣,也對定性事件的機率的計算感興趣。例如,我們開發了一項技術,用來決定從一家大的車製造廠中隨機選擇的一名機械製造工人在8小時工作期間出現事故的機率。這樣的技術也可用來計算一名隨機選擇的機械製造 〔人無事故工作時間超過80個小時的機率。 對於這些定性和定量的事件,可以作為與定性和定量變數相聯絡的事件(或基本事件)而進行分類。例如,在汽車製造業事故研究中,對於隨機選擇的機械製造上人,其事故報告中包含下列檢查結果之一:無事故,小故,或重大事故。這樣, 在研究中100名機械製造T.人的資料是一個定性變數的觀察值,因為對於這些工人,可能的響應值之間只是事故型別不同,而不是測基數值上的區別。因為我們不

• 156• 第四章機率和機率分佈能確切地預測對於…名特定的機械製造工人會發生哪種型別的事故,故把這種變址稱為定性隨機變數。用定性隨機變數測量的其他常見的例子有:所屬黨派、社會經濟地位,在蘋果葉上發現的昆蟲的種類,以及顧客偏愛的商標。與定性變相關的可能的基本事件數是有限的(並且通常相當小)。使用本章的方法,可以計算與這些事件相關的機率。 在很多情況下,試驗中感興趣的事件是與定量隨機變數相聯絡的定量基本事件,因為可能的響應值在數值的大小上是不同的。例如,在汔車製造業事故餅究中,隨機選擇的機械製造工人連續無事故的工作日(8小時為一個工作日)這一數字就是一個定量隨機變數的觀察值。此處,感興趣的事件就是隨機選擇的機械制造工人在兩次書故之間接8小時一天算得的工作日數,它是,個定量隨機變數的觀察值。定過隨機變數的其他例子有:下一個季度每張股票的收入的變化,在癌症治療以後病人病情緩解的時間長度,小麥新品種的每畝產量和在即將來臨的選舉中有義務投票的人數。本章的方法能用來計算任何與特定的事件相聯絡的機率。 定量隨機變址有明顯的優點。對小定埜變數,其數尺度使得均和標準差悠有意義。對於定性隨機變數,本章中的方法可以用來計算各種不同事件的機率, 但基本上儀此而已。而對於定量隨機變,我們能做得更多:我們能求出平均的結果,標準偏差,並且估量隨機變數的可能誤差,等等。以後,我們用隨機變數這個術語表示定量隨機變數。 感興趣的大多數事件源於數值型觀察值或測址值。如果試驗中定量變數的測量值(或觀察值)用y表示,我們對y能取哪些值感興趣。這些值被稱為戲修習耐遊結果。在一個經過開墾改造以後的露天煤礦上,每畝種植的不同的植物種數就是一個數偵型試驗結果。在某選舉中,註冊選民中參加投票的百分比也是一個數值型試驗結果。因為在給定的試驗中的值是一個偶然的或隨機的試驗結果,定址變數y稱為隨機變數。 定義4.10 當一個定董隨機變數的觀察值只可能取可數個數值時,該變垃稱為離散隨機變數。 離散變數的例子有: 1.每棵某種轉基因蘋果樹上所結蘋果的蒲式耳數。 2. 在安裝一臺新的訊號裝置以後,某十字路口每月交通事故數的變化。 3.在中西部的一個主要城市的上次市長選舉中“死人”投票的數字。 注意,在這些例子中,每個隨機變數能夠取到的值的個數都可以計數出來。 定義4.11 當一個定量隨機變數的觀察值可以取到一個區間上的任何一個數值時,該變甘稱為連續隨機變數。此時,該隨機變數所能取到的值的個數是不可數的。 例如,在紐約州羅徹斯特地區每天的最高溫度,可以取到一個區間上所有那無

4.7 離散隨機變數的機率分佈•157• 限多個數值中的任⋯個。它可以是89.6,89.799或89.7611114。典型的連續隨機變有溫度、玉力、高度、重量和距離。 當我們尋求一個與隨機變的某個特定值有關的機率時,需要區分離散隨機變數和連續隨機變。在本章的以後章節中討論機率分佈時,進行這種劃分的必要性會看得更清楚些。 4.7 離散隨機變數的機率分佈如前所述,為了推斷從中抽出樣本的總體,我們需要求出觀察到特殊樣本值的機率。為此,我們需要知道與變基,的每個值有關的機率。按照機率的頻率解釋,這些機率產生一個理論頻率的分佈,稱之為y的機率分佈。機率分佈對於離散隨機變和連續隨機變數是不同的。對離散隨機變數,我們能計算出各個特定值發生的機率。而對連續隨機變數,取值落在一個區間的機率是要研究的物件。 鴻葳隨機建量的餐事分佈用與y的每個取值有關的機率P(y)表示。這種表示可以透過表格,圖形,或公式來表達。考慮4.2節中投擲兩枚硬幣的例子。設y 為觀察到正面朝上硬幣的個數。則鄉可取值為0,1或2。從表4.1的資料中,我們可以確定>的每個值的近似機率,如表4.3所示。我們指出,表中列出的頻率與理論機率非常接近,用機率的古典解釋可以說明,這些理論頻率分別為0.25 0.50 和0.25。如果我們投擲了2 000 000 次硬幣而不是500次,=0,1和2的頻率值與理論上的機率將是沒有區別的。 表4.3y的經驗抽樣結果:2枚硬幣的500次投擲中正面朝上的個數 } 0 1 2 頻數 129 242 129 瀕率 0.258 0.484 0.258 表4.4給出了y(即投擲2枚硬幣時正面朝上的個數)的機率分佈,並且在圖 4.2中用圖形給出了經痴直方圖。 表4.4 投擲2枚硬幣時正面朝上的個數的機率分佈 0 1 2 P(y) 0.25 0.50 0.25

• 158• 第四章機率和機率分佈 Ply) 50-,25 - 0 1 2 圖4.2 投擲2枚硬幣時正面朝上的個數的機率分佈這個簡單的離散隨機變數的機率分佈說明了離散隨機變數的3個重要的性質。 1. 取每個值的機率在0和1之同。 2.y的所有值上的機率的和等於1。 3.離散隨機變數的機率是可加的,即“y=1或2”這一事件的機率等於 P(1)+P(2)。 當討論二項隨機變數的機率分佈時,我們將強調統計推斷和機率分佈之間的關係。 4.8 一個常用的離散隨機變數:二項分佈對生意人和科學家感興趣的人群可以看成是0和1組成的一個大集合。例如,考慮美國所有成年人對如下問題的回答的集合:“你贊成開發利用核能嗎?”如果我們不允許回答“不發表意見”,那麼,所有回答將組成一個由“是”和“不”構成的集合。如果我們指定1表示“是”,0表示“不”,總體將由若干0和1組成的集合構成,其中1 的個數等於贊成開發核能的人的總數,1的個數除以美國成年人的總數將等於贊成開發核能的人數所佔的比例。 Gallup(益洛普)和 Harris(哈里斯)民意測驗就是從0和1的總體中抽樣的例子。透過對人們進行調查並記錄他們的意見,在樣本應答的基礎上,Gallup積 Harris估計總體中喜歡某種事情或擁有某些特徵的人在總體所中佔的比例。 類似的調查在生物科學,工程技術和商業中也有,但是它們可能被稱之為試驗而不是民意測驗。例如,為了確定新藥的效果,在對更大的動物直至最後對人類參與者進行試驗之前,往往先對小動物例如老鼠進行試驗。在很多這樣的試驗中,試驗者往往僅僅記錄藥物是否有效,因而這些試驗與民意調查有著顯著的相似性。

4.8 個常用的離散隨機變數:二項分佈•159• 比如,如果對300只老鼠注射一種藥物且230 個老鼠反應良好,這就像試驗者進行了一項“民意測驗”——測驗老鼠對藥物的反應,有230個“贊成”和70個“反對”。 類似的“民意測驗“被大多數製造商用來決定產品中優質產品的比例。在裝運以前收集工業產品的樣本,由公司的質量控制部門根據既定的標準對樣本中的各個樣品進行判定,看是否為“次品”或“合格品”。根據樣本中次品的個數,公司可以決定此批產品是否適合裝運。注意,如前面的那些例子一樣,在這個例子中,以基子樣本所包含的資訊對總體做出推斷為實際的目標。 公眾民意測驗、消費者偏愛調查、葯物試驗,以及工業中的次品率抽樣都是常見的二項試驗的例子。二項試驗應用於所有科學和商業領域,且各種情況之間的區別僅在於作為樣本物件的種類(人,老鼠,電燈,橘子)的不同。這樣,寵義二項試驗的特徵,對於我們把這個型別的試驗的知識應用於各種不同的抽樣試驗中將是有益的。 就各個方面的實用目的而言,二項試驗等同於前面章節中的投擲硬幣的例子。 這裡,投擲n枚不同的硬幣(或一枚硬幣投擲n次),並且我們對觀察到的正面朝上的個數感興趣。我們假設在試驗中拋一次硬幣正面朝上的機率是x(當硬幣均勻時, 等下0.50,但是在許多實際的情況中, 可以取0到1之間的其他值)。我們同樣假設任何一次拋硬幣的結果不受前面任何拋硬幣結果的影響。這些特徵可以總結如下。 定義4.12 二項試驗是一個有下列性質的試驗: 1.整個試驗由*次相同的試驗組成。 2.每次試驗的結果是兩個基本事件之一。我們把其中一種基本件記為成功,把另外一種基本事件記為失敗。 3.在一次試驗中成功的機率等十,並且在不同的試驗中的值不變。 4.各次試驗是互相獨立的;就是說,一次試驗的結果不影響任何另外試驗的結果。 5.隨機變數y是在n次試驗中觀察到的成功的次數。 例4.5 1998年3月5日 Neve England Journal of Medicine 雜誌刊登的一篇文章中, 討論了一次肺結核大爆發的問題。一個稱為指標病人的人,在1995年被診斷有肺結核。對該指標病人的232 個同事進行了肺結核的篩選檢驗。在檢驗中讀數為陽性記錄的同事的人數是要研究的隨機變數。該項研究滿足二項試驗的性質嗎? 解答為了回答這個問題,我們對二項試驗的5個性質中的每一個性質進行檢查,驗證其是否得到滿足。

• 160• 第四章機率和機率分佈 1.雙次試驗是相同的嗎?是的。這*=232個工人與指標病人的關係是近似等同的。 2.每次試驗的結果是兩個基本事件之一嗎?是的。從試驗記錄中得到的每個同事的讀數不是陽性就是陰性。 3. 不同試驗中成功的機率是一樣的嗎?是的,如果這些同事與指標病人有相同的風險因子和暴露程度。 4.試驗是互相獨立的嗎?是的。一次檢驗的結果不受其他檢驗結果的影響。 5.在232 次檢驗中成功的次數y是試驗者感興趣的隨機變數嗎?是的。在檢驗中讀數是陽性的同事的人數是要研究的變數。 所有的5條性質都滿足,因此肺結核篩選檢驗是二項試驗。 例4.6 一個經濟學家在一個100人的班中會見了75個學生,以估計在•門課程中期望獲得“C”或更好成績的學生的比例。這是二項試驗嗎? 解答檢證這個試驗不滿足二項試驗的5個性質。 1.試驗是相同的嗎?是的,會見了75個學生中的每一個。 2.每次試驗的結果是兩個基本事件之一嗎?是的。每個學生期望或不期望獲得“C”或更高的成績。 3.在不同的試驗中成功的機率相同嗎?不是,如果我們假設成功表示一個學生期望獲得“C”或更高的成績,則在不同試驗中成功的機率可能改變很多。 例如,在教授不知情的前提下,假定100個學生中有75 個學生期望獲得 “C或更高的成績。則對第一個學生會見成功的機率元是75/100=0.75。 如果這學生是失敗(不期望“C”或更高的成績),下一個學生成功的機率是 75/99=0.76。假改在會見70 個學生以後有60 個成功和10個失敗。則下一個學生(第71個)成功的機率15/30=0.50。 這個例子表明,在樣本大小佔總體大小一個相當大的比例的情況下,不同的試驗成功的機率會有巨大的改變。這樣的試驗不滿足二項試驗的性質。 注意,很少有現實生活中的情形能完全地滿足定義4.12 中陳述的要求,但在許多情形,與這些要求的不一致之處是非常小的,從而二項試驗仍然為現實提供一個很好的模型。 我們已經定義了二項試驗,並提出了幾個實際的應用,現在來考察二項隨機變量y,即n次試驗中觀察到的成功次數的機率分佈。儘管可以透過頻率的途徑來逼近 P(y),即二項試驗中與y的一個值相對應的機率,我們對二項機率可以用一個更容易的公式來計算。

4.8 一個常用的離散隨機變數:二項分佈•161• 二項試驗中計算 Ply)的公式在二項試驗中的n次試驗中,觀察y次成功的機率是 Ply)= 其中 n=試驗次數, x=單個試驗中成功的機率, 1-*=單個試驗中失敗的機率, 次試驗中成功的次數, 如上面所解釋的,記號n!(叫做n的階乘)用於表示下列乘積 n! n(1)(-2) (3)(2)(1) 對n=3 n!= 3! = (3)(3-1)(3-2) =(3)(2)(1)=6 類似地,對n=4 4! = (4)(3)(2)(1) = 24 我們也注意到O!定義為1。 為了瞭解二項機率的公式如何應用於計算y的特值的機率,考慮下列例子。 例4.7 開發出一種在高爾夫球場上使用的新草皮品種,目的是獲得85%的發芽率。 為了評估這種草皮,把20 粒種子種在一個溫室裡,並使得每粒種子被暴露在相同的條件下。如果85%的發芽率是正確的,20粒種子中有18 粒或18 粒以上種子發芽的機率是多少? P(y)= 用 =20, =0.85,3=18,19 和20代入上式,我們得 = 190(0.85)18(0.15)2 = 0.229 Ply = 19) = 19!(20- 19)1 (0.85) 9(1-0.85)20-19 = 20(0.85)"(0.15)' = 0.137 P(y = 20)= 20!(20 -20)1(0.85)20(1-0.85)20-20

• 162• 第四章機率和機率分佈 = (0.85)20 = 0.0388 P(y≥18) = P(y =18)+P(y=19)+P(y=:20)=0.405 在例4.7的計算中,儘管n僅僅是20,我們還是承擔了相當大的計算工作量。對於那些n的取值很大的情況,可以使用計算機軟體做出準確的計算。我們將在後面的章節中給出一個方法,這種方法在許多情況下,能夠獲得相當精確的結果而不需要使用計算機。 例4.8 為了估計某城市中失業的戶主的百分比,我們從所有家庭中隨機選擇出一個由多個家庭構成的樣本。為了舉例說明二項機率的計算,假定未知的百分比實際為10%,從總體中選擇出 n=5的一個樣本(我們選擇一個小樣本以便於計算)。 所有的5個家庭的戶主均有工作的機率是多少? PUy) 解答在把哪個基本事件定義為成 0.6功時,我們必須謹慎從事。對這個例子, 0soooo 我們定義有工作為成功。從總體選出一人成功的機率是 =0.9(因為失業的概率是0.1)。我們想要求出在5次試驗中 =5(所有的5個人都有工作)的機率。 P(y=5)= 5! (3-5)T (0.9)9(0.1)0 0 0 1 2 3 4 有工作的人數 5 Y 5! 5! 0T(0.9)$(0.1)0 = (0.9)$=0.590 圖 4.3 n=5, =0.9的二項機率分佈把n=5,x=0.9的二項機率分佈表示在圖4.3中。注意由5個家庭組成的樣本中5個戶主均有工作的機率也在圖中給出。 例4.9 參考例 4.8並且計算5個家庭的樣本中有一個人失業的確切的機率。一個人或更少的人失業的機率是多少? 解答因為y是5個戶主的樣本中有工作的人數,一個人失業對應於4個人有工作(y=4),於是 P(4)= 5!.0 4!(5-4)!(0.9)$(0.1)1

4.8 一個常用的離散隨機變數:二項分佈•163• = (S)(4)(3/2/(12(0.9)*(0.1) (4)(3)(2)(1) = 5(0.9)*(0.1) = 0:328 因此,在5個家庭的樣本中有4個家庭,其戶主有!作的機率是0.328, 或粗略地說有三分之一的機會。 “—-個人或更少的人失業”的事件與“4個人或5個人有工作”的基本事件相同。因為y表示被僱用的人數,我們求y=4或5的機率。因為與隨機變數相關的這些值代表互相排斥的事件,離散隨機變過的機率是可加的。丁是,我們有 P(= 4或5)= P(4)+P(5) = 0.328+0.590 = 0.918 這樣,在5個家庭組成的隨機樣本中,4個或5個戶主有工作的機率是0.918。這個高機率與我們的直覺是一致的:如果這個城市中,全部家庭的戶主90%有工作, 我們自然可以期望在樣本中有工作的人數是一個很大的數值。 與任何頻率直方圖一樣,二項機率分佈有其均值;和標準差。。儘管我們省略了推導過程,我們給出這些引數的公式如下。 二項機率分佈的均值和標準差 d= Vnx(1-m) 其中7是在給定試驗中成功的機率,n是在二項試驗中試驗的次數。 如果我們知道 x和樣本大小n,我們就能計算p和。,從而找出特定的二項的機率分佈的中心,並且描述其變異性。這樣,我們就能快速決定哪些y的取值是可能的,哪些取值是不大可能的。 例 4.10 我們以草皮種子的例子來說明均值和標準差的計算。假定生產草皮的公司為了監管種子的質量,從一般的種子中抽取了20粒種子。如果種子的發芽率保持在 85%不變,那麼在20 粒種子的樣本中種子發芽的平均數是 =8T=20(0.85)=17 標準差是 d V (1 m) V20(0.85)(1-0.85)= 1.60 假定我們記錄了大由20粒種子構成的樣本的發芽情況,並對之進行考察。 如果發芽率始終保持在85%不變,那麼每個樣本發芽種子的平均數應該接近17。 如果在某個 20粒種子的特定樣本中,僅有12 粒種子發芽,那麼我們的觀察結果與 85%的發芽率一致嗎?使用一個計算機軟體程式,我們可以產生20粒種子的樣本

• 164• 第四章機率和機率分佈中發芽種子的棵數的機率分佈,如圖4.4所示。 儘管該分佈有向左偏倚的傾向(見圖4.4),由於分佈的形狀接近於丘形,可以對之使用經驗準則。y=12粒種子比發芽種子的平均數=17減去3倍的標準差還少;送而,如果確實等於 0.85,我們在20 粒種子中僅觀測到12 粒種子發芽這種事是非常不可能的。很可能發芽率比0.85 要小很多。 0.25 0.200.15雞0100.050.00111--0OL TITT 0 1234567891011121314151617181920 發芽種子數圖4.4 =20 =0.85的二項分佈例4.11 一項民意測驗表明,在1218 位選民中有516位贊成某位政黨候選人競選連任。你認為該候選人會贏嗎? 解答要贏得選舉,候選人將需要至少50%的選票。現在我們來看一看, y=516作為y的值是否太小,以至於我們不能認為x的值(贊成該候選人的選民的比例)等於0.5或更大。如果 =0.5,則 M=MT=(1218)(0.5)= 609 d = Var(1-)=V(1218)(0.5)(0.5) V304.5 = 17.45 從而3a=52.35。 從圖 4.5 讀者可以看出, =516與 =609的距離大於3d,或52.35。事實上,如果讀者願意做進一步的檢查,可以發現如果真等於0.5的話,y=516與 =609的距離甚至大於50。這樣,如果事實上大多數選民贊成該候選人再次競選的話,那麼在選民的樣本中,贊成該候選人的選民的人數顯然太少了。因而,我們得出結論,他或她將落選。(注意這個結論基於這樣一個假定,即從中抽取樣本

4.8 一個常用的商散隨機變數:二項分佈 •165• 的選民的集合與將參加投票的選民的集合是一樣的。我們還必須假定選民的意見將在抽樣的時間和選舉的日期之間不發生變化。) 516 5$6.65 一T =609 觀察值 -30 =52.35— 圖4.5y的觀察值(516)相對的位置本節的目的是給出二項機率分佈,從而使讀者能夠了解二項機率的計算方法, 並且當n的值不大時能夠計算出二項機率。在實際中, 的值通常很大(在全國範圍的調查中,樣本容量大到1500是常見的),此時二項機率的計算是乏味的。 在本章的後面,我們將介紹一個簡單的方法,利用該方法,可以得到我們在進行推斷時所需要的機率的近似值。另有一些粗略的近似方法,透過應用經驗準則以及二項隨機變數y的均值和標準差,也可以用來計算二項分佈的機率的近似值。 本書中要討論的準一的另外一個離散隨機變數是 Poisson(泊松分佈,第十章)。我們建議感興趣的讀者從 Hildebrand 和 Ott (1998)的書和 Devore(2000)的書中獲得關於離散隨機變數的更多資訊。在下一節,我們將重點討論正態分佈。 練習基本技能 4.30 考慮下列課堂試驗:拋3枚硬幣並且觀察正面朝上的枚數y。讓每個學生重複10次試驗,結合全班的結果,構造一張»的頻率表。注意,這些頻率給出了 y=0,1,2或3的實際機率的近似值。(注意:用二項公式計算實際的機率 P(y)並與近似值相比較。》 4.31 設y是二項隨機變數,計算下列每種情況下的P(y): 8.8= 10,*=0.2, =3 b.n=4, =0.4, =2 c.8=16,7=0.7, =12 4.32 設y是二項隨機變試且n=8 和不=0.4,求下列各值: a.P(y≤4) b.P(y≥4) c.P(y≤7) d.P(y>6) 應用 4.33(商業)一家器材店一天中賣出的主要器材的個數y有如下分佈:

• 166• 第四章機率利機率分佈 …• …! 0 1 3 7 8 9 10 P(y) 0.100 0.150 0.:250 01.140 0.090 0.680 0.060 01.050 1.040 0.025 0.015 a.構造 P(y)的一張圖。 b.求 P(y≤2)。 c求P(y≥7)。 d.求 P(I≤y≤S)。 4.34(商業)一家計算機商店每週賣出某流行的文書處理程式的複製數量的機率分佈如下。 0 2 3 4 s 6 7 8 9 10 P(y) 0.06 0.14 0.16 0.14 0.12 0.10 0.08 0.07 0.06 0.04 0.03 a.在一個特定的星期內需要3個或更多複製的機率是多少? b.需要至少2個但不超過6個複製的機率是多少? <.如果商店在每個星期的開始有該程式的8個複製可用,在指定的一週需求超過供應的機率是多少?

4.8 一個常用的離散隨機變數:二項分佈•167• 4.35(生物)一位生物學家從當地的水庫隨機地選擇了10份水樣,每份水樣體積為0.1立方厘米。生物學家計數了每份水樣中的細菌數,然後用這10份水梯中細菌的數量得出水庫中每立方厘米存在細菌個數的估計。這是一個二項試驗嗎? 4.36(政治學)檢查下面的報紙剪輯。這種抽樣滿足二項試驗的特徵嗎? 民意測驗發現人們反對竊聽電話紐約—在近期的一個民意測驗中,被調查的人中以81%對13%反對在沒有法院指令的情況下竊聽他們的電話。 在調查中人們以68%對 27%反對政府對犯罪嫌疑人進行竊聽,除非有法院的指令。 這項測驗調查丫1 495個家庭,同時發現了下列結果: -調查中人們以80%對12%反對在沒有法院指令的情況下使用任何電子何諜設施。 -市民中以77%對14%反對在沒有法院指令的情況下政府拆看他們的信件。 ——他們以80%對12%反對電話公司公開他們的長途電話記錄,除非有法院的指令。 對下每個問題,調查中有少部分人沒有回答。 4.37(環境)進行一項調查,估計在一個森林裡受松樹蛾(pine shoot moth)侵害的松樹的百分比。在該森林的一張地圖上,按照25×25英尺的方形區域劃分打上格子。隨機選擇100個方形區域並記錄每個方形區域受到侵害的松樹的數字。 這是一項試驗嗎? 4.38(政治學)進行一項調查,以瞭解在美國退伍軍人管理局的醫院裡工作的護士的態度。對於一個由1000個護士組成的樣本,使用郵寄問卷的方法進行聯絡,並且記錄下贊成或反對某個論點的人數。如果我們把注意限制在護士對單個問題的回答中,這種抽樣是二項試驗嗎?如大多數郵寄調查一樣,一些護士沒有回應。在估計美國退伍軍人管理局的醫院裡全部護士中贊成某個提案的百分比時,這種沒有回應的現象會有什麼樣的影響? 4.39(環境) 在對洛杉磯市汽車的檢查中,所有的汽車中有60%汽車的排放不符合EPA標準。對一個由10輛汽車構成的隨機樣本,計算下列機率: a.所有10輛汽車都通不過檢查。 b.10 輛汽車中恰好有6輛汽車通不過檢查。 c.6 輛或更多的汽車通不過檢查。 d.所有10 輛汽車都透過檢查。

• 168• 第四章機率和機率分佈使用下列 Minitab 的輸出結果回答這些問題。注意,在Minitab 中,二項機率不用 P 表示,而二項變數y用×表示。 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 P(X=z) 0.0001 1.0016 0.0106 0.04Z5 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060 • P(X≤x) 0.0001 0.0017 0.0123 0.0548 0.1662 0.3669 0.6177 0.8327 0.9536 0.9940 1.000 4.40 參照練習 4.39。 .如果 =0.3,計算(a)〜(d)中的機率。 b.當 1000, =0.3時,你如何計算P(≤100)。 4.41(生物)用老鼠進行一項試驗,以測試一種抗凝血劑藥的效果。在試驗中使用了由4只老鼠組成的一個隨機樣本。如果該藥的製造商宣稱,藥物會對 80%的老鼠產生所希望的效果,那麼藥物對4只試驗鼠都無效的機率是多少?4 箇中只對一個有效的機率是多少?4箇中至多有一個有效的機率呢? 4.42(社會學) 犯罪學家宣稱侵佔公款的初犯者改過自新的機率是0.9。假定我們規定改過自新意味著此人在S年內不再進行犯罪。從監獄記錄中隨機選擇 3個獲得假釋的侵佔公款犯人,並且對他們釋放後5年的行為歷史記錄進行檢查。 如果犯罪學家的說法是正確的,所有3個罪犯均改過自新的機率是多少?其中至少有2個罪犯改過自新的機率呢? 4.43 考慮下列試驗:拋3個硬幣並且觀察正面朝上的個數y。重複試驗 100次,並構造一張y的頻率表。注意這些頻率給出y=0,1,2和3的準確機率值的近似。(注意:可以證明這些機率分別為1/8,3/8,3/8,和1/8。) 4.44 參照練習 4.43。應用二項機率分佈的公式,證明 P(0)=1/8,P(1)= 3/8,P(2) =3/8, 和 P(3)=1/8。

4.9 連續隨機變鼠的機率分佈•169• 4.45 假定你和另一人各拋一枚硬幣看是否匹配,共拋1000次。匹配次數的均值是多少?標準差是多少?計算區間(p士3a)(提示:拋一對硬幣匹配的機率是 =0.5。) 4.46 參照練習4.39。說明如果 n=1000, =0.6,你如何計算 P(y≤100)。 4.47(商業)一個大的跨國公司在一段很長的時期內,所有實習銷售員中有 10%被評為傑出,75%為優秀或好,10%為滿意,5%為不滿意。對一個隨機選擇的含有10個實習銷售員的樣本,求下列機率: 8.2個被評為傑出。 b.2個或2個以上被評為傑出。 c.10箇中有8個被評為傑出或優秀或好。 d.沒有銷售員被評為不滿意。 4.48(醫藥)一項新技術,即血管通栓氣球(balloon angioplasty)被廣泛地應用於開啟栓塞的心臟瓣膜和血管。把氣球透過一根導管插入心臟並且使之膨脹, 從而開啟栓塞,因此,不需要進行外科手術。未經治療的心臟瓣膜疾病患者有 50%的人在大約2年以內死亡。如果這項新技術的使用經驗表明,約有70%的人存活超過2年的時間,那麼,在一所醫院內用血管通栓氣球方法治療的下5個病人構成一個n=5, =0.70的二項試驗嗎?為什麼是或為什麼不是? 4.49(醫藥)一家處方藥公司宣稱,所有在動物試驗中表明有效的新藥物中, 僅有12%透過臨床試驗程式並且投放到市場。如果一個公司有15 種新的化合藥物在動物試驗中是有效的,求下列機率: a. 沒有一種藥物能投放市場。 b.一種或一種以上的藥物能投放市場。 c.二種或二種以上的藥物能投放市場。 4.50 練習4.49滿足二項試驗的性質嗎?為什麼? 4.51(商業)在一家大型超級市場,從大量列表中選擇了 50個價格變化的隨機樣本。如果一個價格變化被準確公佈的機率為 0.93, a.寫出3個或更少價格變化不被準確公佈的機率的表示式。 b.對(a)應做出怎樣的假設? 4.9 連續隨機變數的機率分佈離散隨機變 (例如二項分佈)的可能的取值是孤立和分散的,例如0,1,2或 3。另外一類隨機變數是連續隨機變數:他們可能的俏形成一個區間(或範圍,或連續統)。例如,一種普通股票每美元投資的1年回報可能取值為0與某個相當大的值所構成的區同中的任何值。在實踐中,實際上所有的隨機變數的取值範圍都呈

• 170• 第四章機率和機率分佈現為一個離散的集合;每一張百萬美元普通股票每美元的投資回報是1.06219423 美元或1.06219424 美元或1,06219425美元或⋯⋯然而,當隨機變數的可能值很多時,把這樣的隨機變數當作連續隨機變數來處理在數學上有時是有益的。 從理論上講,一個連續隨機變數的取值與數軸上一個區間中的無窮多個點相對應。粗略地說,我們不可能把小數值的機率分配到,的各個值上(象對離散隨機變數所做的那樣)並且保持機率的總和等於1的性質。 為了克服這個困難,我們再回到第三章中的頻率直方圖的概念,在講解這個概念時,我們討論的是y落在給定的區間內的機率。因為分類區間的個數可以變大而區間的長度可以減小,對於一個包含大量測量值的總體,其頻率直方圖幾乎是光滑的曲線。這樣,我們可以設想,透過重複觀察一個連續隨機變數得到一條光滑的曲線,並將其作為總體的頻率分佈的一個模型。所得到的曲線類似於圖4.6中給出的曲線。 fy) 面積=1 (a) 曲線下的總面積 fO) P(asy<b) a (b)機率 b 圖 4.6 連續隨機變數的機率分佈回想第三章中所講的,頻率直方圖中,頻率的大小與對應的分類區間上的面積成比例,且這些面積有其機率解釋。也就是說,如果從觀測值的集合中隨機地選取一個,那麼,該值落在一個分類區間上的機率與該區間上方對應的直方圖面積的大小成比例。由於一個總體是指全部(100%或1),我們在畫出這條光滑機率曲線時,使其下面的總面積的大小等於1。如果我們令曲線下的總面積為1,則每個區

4.9 連續隨機變數的機率分佈•171• 間上的面積恰等於相應的機率。 一個連續隨機變數的機率分佈圖如圖4.7中所示。對給定的y的值,縱座標 (即曲線的高度)用記號f(y)表示。許多人喜歡這樣說,就象 P(y)為二項隨機變量的機率一樣,f(y)是表示連續隨機變數的機率的一個量。然而,如我們以前所指出的,不可能為一個連續隨機變數的無窮多個可能的取值中的每一個指定一個機率。因此,我們只能說f(y)表示在給定的y值處,這個機率分佈的高度。 y) 0 10 20 30 40 50 60 y,考試分數 70 80 90 100 圖 4.7 假設的學生考試成績的機率分佈一個連續隨機變數落在一個區間上,比如說在2個點a和b之間的機率,可以直接從頻率直方圖(3.3節)中區間上的面積的機率解釋得出,它等於從a到b這一區間上曲線下方的面積,如圖4.6中所示。這個機率寫為P(a b)。 有許多種形狀的曲線能用來表示作為連續隨機變數的測量指標的總體頻率分布。幸運的是,對於大多數這些曲線,其下面的區間上的面積已製成表格,可供查用。這樣,如果我們知道學生的考試成績有特定的機率分佈,如圖4.7所示,並且如果曲線下的面積已製成表,那麼,我們透過查表中的面積值,能求出某個特定的學生取得80以上成績的機率,它等於圖4.7中陰影部分的面積。 圖4.8描繪了4 種重要的機率分佈,我們將在後面的章節中頻繁地使用這些分佈。對於一個特定的狀況,我們使用哪個機率分佈是很重要的,因為機率陳述由曲線下面的面積決定。如從圖4.8中所見,選取不同的分佈,將得到迥異的答案。 例如,在圖 4.8(a)和(b)的機率分佈中,隨機變數取值小於5.0 的機率實質上是 1.0,但在圖4.8(c)和(d)的機率分佈中,它的機率分別是0.584 和0.947。在某些狀況下,我們不知道在特定的研究中隨機變數的確切分佈。這時,我們可以使用隨機變數的觀察值構造頻率直方圖,它是真實機率分佈的一個樣本估計。就統計推斷而言,在許多情況中選擇一個連續隨機變數的機率分佈的準確的形狀不是關鍵的,因為我們的大部分推斷方法對機率分佈形狀的精確表述並不敏感。 我們將會發現,對於連續變數收集的資料常常有近似於鐘形的頻率分佈,如在圖4.8(a)中所看到的那樣。一個連續的變數(即正態變數)和它的機率分佈(鐘形

• 172• 第四章機率和機率分佈曲線)為這種型別的資料提供了一個良好的模型。正態分佈的變數在統計推斷中也是很重要的。我們將在下一節詳細地研究正態分佈。 0.4 0.30.30.20.1度0.2, 0.13 0.01 -2 i y,隨機變數的值 (a) 標準正態分佈的密度 2 -2 d zi Y,隨機變數的值 (b):df3)分佈的密度 4 0.150.10度密方 0.05 卡 0.05 io 1520 y,開機變數的值 (c) X(df=5)分佈的度 1.00.80.40.20.00 io y,隨機變數的值 (d) F(df-2,6) 分佈的密度圖4.8 4.10 一個常用的連續隨機變數:正態分佈許多要研究的變數,包括在以後的章節要討論的一些統計量,有丘狀的頻率分布,這些分佈能用正態曲線近似。例如,近期有重複攻擊行為歷史的門診病人按簡要精神病分級標準(brief psychiatric rating scale)所得總分數的分佈是丘狀的。丘狀分佈的其他實際的例子包括:從特定的社會經濟背景中挑選的學齡前兒童的對社會的理解能力得分,迴圈型狂燥抑鬱病患者(circuar-type manic-depressive)的精神運動延遲(psychomotor retardation)得分,特定品種的牛的牛奶產量以及一個社區的居民焦慮感覺的得分。這些丘狀的分佈都能用一條正態曲線近似。 既然正態分佈已被很好地製成表格,我們就可以使用正態曲線下的面積一它對應於機率—來近似與在試驗中要研究的變數有關的機率。因此,正態隨機變及其分佈在統計推斷中扮演一個重要的角色。

4.10 一個常用的連續隨機變數:正態分佈•173• 正態隨機變數的頻率直方圖,又叫做正態曲線或正態機率分佈,是一條光滑的鐘形曲線。圖4.9(a)中給出了一條正態曲線。如果我們用,表示正態隨機變數, 那麼在y的特定值處機率分佈的高度用 (y)表示。正態曲線下的各個機率值形成了第三章中所講的“經驗準則”的基礎。 0.4 0.4 0.3 0.3 0.2 0.2 - 0.10.1總面積是 0.6826 0.00.0H (a)正態分佈的密度 H-O H H+G (b)均值 1個標準差以內正態曲線下的面積 0.40.4 0.3 0.3 0.2 0.2 0.1總面積是 0.9544 0.1 總面積是 0.9974 0.00.0 H-20 H H+26 (c)均值2個標準差以內正態曲線下的面積 H-30 H H+30 (d)均值3個標準差以內正態曲線下的面積圖4.9 如我們從圖4.9(a)中所見,正態機率分佈是鐘形的,並且關於均值p 對稱。 儘管從理論上講正態隨機變數y可能取到從一∞到+∞的任何值,但由經驗準則我們知道,近乎所有的測量值落在,的3個標準差(3)的範圍以內。從經驗準則, 我們還知道,如果我們從一個有丘形分佈的測量值的總體中隨機選擇一個測量值, 這個測量值落在該總體均值的1個標準差範圍以內的機率近似為0.68(見圖4.9 (b))。同樣,我們知道一個值落在區間p2。內的機率近似為 0.954,而落在區間士3G 內的機率近似為 0.997(見圖 4.9(c)和(d))。然而,我們還不知道一個測量值落在其均值的1.65個標準差範圍以內的機率,也不知道它落在其均值的2.58 * 對於正態分佈,f(y)= e-0y-)1202 2mg,其中x和。分別是y值總體的均值和標準差。

• 174. 第四章機率和機率分佈個標準差範圍以內的機率。在本節餘下的部分,我們將討論計算正態曲線下一個測量值落在均值,的任何距離以內的機率。 因為有許多不同的正態曲線(取決於引數p和。),為所有的正態曲線下的面積(機率)製表似乎是一項不可能的任務,特別當每條曲線要求一張單獨的表時就更是如此。幸好不是這樣。我們只需要計算變數,落在其均值的若干倍標準差的範圍以內的機率(就象我們在使用經驗準則時所做的那樣),從而只需要一張概率表。 在附錄的表1中,給出了y值左邊正態曲線下的面積,這裡假設y的值位於偏離均值x個標準差(z0)的位置(見圖4.10)。圖4.10中陰影部分的面積即是在附錄的表1中所列出的機率。精確到十分位的。的值列在表的左手的列中,z值的百分位的數在表的頂部。為了求正態隨機變數落在其均值的右側1.65個標準差的點的左邊的機率,我們在表中查出。=1.65 所對應的表值。這個機率是 0.9505(見圖 4.11)。 0.4 0.3 0.2 0.1 0.0 表中值所表示的面積圖4.10 附錄的表1中給出的正態曲線下的面積要求一個測量值小於某個y值的機率,我們首先運用下面的公式計算鄉與均值的偏離是標準差的多少倍: a 用這個公式計算所得到。的值,有時稱為這個值的z得分。使用計算出的2 值,我們用附錄中的表1來確定所求的機率。注意我們僅是透過減去除以。對 v的值進行編碼。(換句話說, =20+Ko)圖4.12說明了y值與z值之間的對應關係。例如,低於 (x的左邊)2個標準差的y值,對應於:=-2。

4.10 一個常用的連續隨機變數:正態分佈,175• 正態密度 0.4 0.3 0.2 0.1. 0.0 0.9505 圖 4.11 F-1.65a正態曲線下落在其均值 p 的右側1.65個標準差的點的左邊的面積 fy) 或 f(z) 30 -20 M-0 -1 0H H+G 1 圖 4.12 例 4.12 考慮一個 =20和。=2的正態分佈。確定一個測量值小於23的機率。 解答面對這樣的問題,首先畫一張圖可能有利於看清所求的面積,如在圖 4.13 中所看到的。 為了求出曲線下方 y=23左邊的面積,我們首先計算y=23與均值的偏離是標準差的多少倍。 x=1- =23,20 = 1.5 這樣, =23位於 =20右側1.5個標準差。參考附錄中的表1,我們求出對應於 ~ =1.5的面積是 0.9332。這就是測量值小於23的機率。

• 176• 第四章機率和機率分佈 0.4 0.3 0.2 0.1 0.0 0.9332 H=20 23 圖4.13 從=20,a=2的正態曲線下,=23左邊的面積例4.13 對例4.12中 =20,a=2的正態分佈,求小於16的機率。 解答要求16左邊的面積,我們用 2=Y-4116.20 =1- 2 我們從表1中求得相應的面積是 0.0228;因而 0.0228 是測量值小於 16 的機率。 這個面積表示在圖4.14中。 0.40.3正態密度 0.20.1 0.0228 0.0圖 4.14 16 H=20 K=20,0=2的正態曲線下方 y=16左邊的面積例4.14 a=13磅。 一群格恩西(Guernsey)奶牛日產奶量的均值服從正態分佈,其中=70磅,

4.10 -個常用的連續隨機變數:正態分佈•177• a.隨機選擇的奶牛產奶量小於60磅的機率是多少? b.隨機選擇的奶牛產奶量大於90磅的機率是多少? c.隨機選擇的奶牛產奶量在60磅至90磅之間的機率是多少? 解答首先我們畫出所要求的面積的圖形(圖4.15(a)~(c))。為了回答(a), 我們必需計算與俏 60 相對應的z的值。值y=60對應的z得分為 *-25#-852--0.71 從表1中得知,60左邊的面積是0.2206(見圖4.15(a)). 為了回答(b),值 =90對應的>得分為 2=2一#=90720 = 1.54 從表1中我們得出90 左邊的面積是0.9382。於是,大於90的面積必定為10.9382=0.0618,因為曲線下的總面積等於1(見圖4.15(b))。 要回答(c),我們可以使用(a)和(b)的結果。Y1和y2兩個值之間的面積由在這2個值左邊的面積的差來決定(見圖4.15(c))。我們已經求出小於60 的面積是 0.2206,小於90 的面積是0.9382。因此,在60和90之間的面積是 0.93820.2206=0.7176。我們由此得出,奶牛產量的22.06%小於60 磅,6.18%大於 90 磅,71.76%在60和90磅之間。 正態分佈的一個重要的方面是我們可以很容易得到該分佈的百分位數。一個分例如,總體的中位數是50 百分位數30.50,兩個四分位數分別是25和75個百分位數。 正態分佈是對稱的,所以其中位數和均值相等:Y0.s0 (見圖4.16(a))。 為丫求出標準正態分佈的百分位數,我們將表1的用法反過來。要求出100p 百分位數zp,我們在表1中找到機率p,然後沿著表的讓緣讀出與它相應的數字 2p。例如,求80百分位數20.80時,我們在表1中尋找機率p=0.8000。最接近 0.8000 的是0.7995,與它對應的≥的值是0.84。於是,z0.80 =0.84(見圖 4.16 (b))。現在,我們來求均值為,標準差為。的正態分佈的100p百分位數30火此,我們需要反向使用標準化公式。 假定我們要求/=S5,d=3的正態分佈總體的80百分位數。我們已經求出了 20.80= 0.84,於是,該總體的80 百分位數是 30.80 =55+(0.84)(3)=57.52。

• 178• 第四章機率和機率分佈 0.4 0.3 0.2 0.1 0.2206 0.0 60 4=70 (a) =70,0=13的正態曲線下方y=60左邊的面積 0.4 0.3 0.2 0.1 0.0618 0.0M=70 90 (b) =70.a=13的正態曲線下方 =90右邊的面積 0.4 0.30.2 0.7176 0.1 0.0 60 M=70 90 (c)x=70, 0=13的正態曲線下60到90之間的面積圖 4.15

正態密度 0.4 0.3 0 .2 T 0.1 0.00.50 0.0 —T H Yaso (a)對於正態曲線,均值和中位數相同 H Yom F0.8401 (b)正態曲線的80百分位點圖4.16 例4.15 學校評估測驗(SAT)是一種用於測試個人為上大學所做準備的考試。數學得分有均值為500,標準差為100的正態分佈。參加 SAT 的人得分低於350的比例是多少?要確定一組學生是否需要輔導,我們要確定所有分數中最低的10%,即我們要確定10 百分位數 Y0.100 解答要求出得分低於350的比例(見圖4.17(a)),我們需要求出350左邊的面積: 350-500 100 =+1.5 在正態分佈中,均值-1.5倍標準差那一點左邊的面積,可以從表1中查得, 為0.0668。因此,6.68%或近似於7%的參加考試的人其得分低於350。得分350 近似於所有得分總體的7百分位數30.070 為求10百分位數(見圖4.17(b)),我們首先在表1中求出20.100因為 0.1003 是最接近於0.1000的值,而它的對應的:值是-1.28,我們取20.10=-1.28。然後計算 20.10= + 20.100 = 500+(-1.28)(100)=500- 128 = 372 這樣,在 SAT 中有10%的分數不到372。 例4.16 對上一年的所得稅納稅申報單的分析表明,對一個給定的收入階層,在頭三筆

• 180. 第四章機率和機率分佈 0.40.30.20.1 0.0668 0.0350 H=500 (a) =500,a=100的正態曲線下小於350的面積 0.4 0.3 0.2 0.1 0.0 0.10 H=500 Yauo=372 (b) =500, a=100的正態曲線的10百分位數圖4.17 支付中,除已付的納稅額估計憑單以外,拖欠政府的稅額近似服從均值是530美元,標準差是205美元的正態分佈。對這個測量值的分佈,求其75 百分位數。政府想要找出所欠額度中最大的25%的那些申報單。 解答我們需要決定 75 百分位數 y0.7s(圖4.18)。從表1中,我們求出 20.75 =0.67, 因為最接近0.7500的機率是0.7486,與它對應的2得分為0.67。我們然後計算 30.75 = K + 20.750 = 530+ (0.67)(205)= 667.35 這樣,在這個收入階層中,納稅申報單的 25%拖欠政府的稅額超過了 667.35 美元。

• 181• 正態密度 0.4 0.3 0.2 0.1 0.0 圖 4.18 H=$30 Sor=667.35 K=530,0=205的正態曲線的75 百分位數練習基本技能 4.52 使用附錄中的表1求正態曲線下這些值之間的面積: a.2=0和2=1.3。 b.2=0和 = 1.9。 4.53 對下面的值重複練習 4.52: a.2=0和2=0.7。 b =0和 1.2。 4.54 對下面的值重複練習 4.52: a.2=0相2=1.29。 b. =0相 = 0.77。 4.55 對下面的值重複練習 4.52: a.2=-0.21 和 =1.35。 b. =0.37和 = 1.20。 4.56 對下面值重複練習4.52: a.2=1.43和 =2.01。 b. =-1.74和 = 0.75。 4.57 求x大於1.75 的機率。 4.58 求x小於1.14的機率。 4.59 求&的值z0,使得P(2>20)=0.5。 4.60 求的值z0,使得 P(>z0)=0.025。 4.61 求的值z0,使得P(>20)=0.0089。

•182• 第四章機率和機率分佈 4.62 4.63 4.64 求的值x0,使得 P(>20)=0.05。 設 y是均值等於100,標準差等於8的一個正態隨機變數。求下列概率: a.P(y>100)。 b.PCy≥110)。 c.P(y<115)。 11.P(88< <112)。 e.P(100< <108)。 4,65 墳3是 =500,=100的一個正態隨機變數。求下列機率: a.P(500 696)。 b.P(y>696)。 C.P(304<y<696)。 d.設P(500 k 500+k)=0.60、求。 4.66 設是 =100,=15的一個正態隨機變數。 a.證明 130等價於 2。 b.把y>82.5轉換為等價的z得分。 c.求P(y<130)和 P(>82-5)。 e.求P(70),P(>130)和P(70 130)。 4.67 用附錄中的表1計算曲線下方下列值之問的面積: a. =0和x=1.5。 b. =0和 =1.8。 4.68 對下列值重複練習 4.67: a. -1.96稱×=1.96。 b. 2.33種 =2.33。 4.69 當x右邊的面積是0.05時,求x的值是多少?左邊的面積為0.05時 x 的值是多少?(提示:利用附錄中的表2) 4.70 對下列面積求≥的值。 8.2 右邊的面積是0.01。 b.2左邊的面積是0.10。 4.71 求觀察到的:值大於下列值的機率。 8.1.96o b.2.21。 c.2.86c

4.10 一個常用的連續隨機變數:正態分佈•183• d.0.73。 4.72 求觀察到的≥值小於下列值的機率。 a.-1.20。 b. -2.62。 c.1.84。 d.2.17。 應用 4.73(政府)由某個州的預算部門所儲存的記錄表明,從遞交傳票到最終支付資金所經過的總時間近似服從均值為39天和標準差為6天的正態分佈。 a.從遞交傳票到最終支付資金之間經過的時間超過50天的機率是多少? B.如果你在55天以前或更早遞交了一張傳票,你能得出什麼結論? 4.74(教育)每年對數以千計的中學生實施的大學入學考試的成績按照均值為500過標準差是100的分佈來評定。這些成績近似於服從正態分佈。求滿足「下列條件的成續所佔的百分比。 a.大於600。 b.大於700。 c. 小於 450。 d.在450和600之間。 4.75(商業)某一食品廠每月的銷售額近似服從均值是150(幹美元)標準差是35(千美元)的正態分佈。計算下列機率: a.P(y>200)。 b.P(y>220)。 c.P(y<120)。 d.P(100 200)。 4.76 參考練習4.74。一個限於某些人參加的俱樂部希望邀請在大學入學考試中成績在最高的10%中的學生加入。 8. 要被邀請加入該俱樂部,得分需為多少? b. 把總體的最高的60%與最低的40%分開的分值是多少?我們把這個值稱為什麼? 4.77 一個正態分佈的均值是50,標準差是10。 a. 什麼百分位數是38?選擇適當的答案。 88.49 38.49 49.99 0.01 11.51 b. 下列哪一個x得分對應於67 百分位數? 1.00 0.95 0.44 2.25以上都不是

• 184• 第四章機率和機率分佈 4.78(社會)一大群高中男生的體重的分佈是y=120磅,a=10磅的正態分佈。下列哪個是正確的? a.大約16%的男生將超過130磅。 b.大概少於2.5%的男生低於100磅。 c.可以預期男生的一半體重小於120磅。 d.以上都是正確的。 4.11 隨機抽樣迄今為止,在本書中我們已經討論了隨機樣本,並在第二章介紹了各種抽樣方案。隨機抽樣的重要性是什麼?我們必須知道樣本要如何選擇,才能確定與各種抽樣結果有關的機率。用隨加力送選擇的伴本的機率是可以確定出來的,並且我們可以使用這些機率,從抽取的樣本對總體做出推斷。 用非隨機的方法選擇的樣本資料經常受到抽送編礦的干擾。無論何時,只要在抽選時存在過分或過少代表總體的某些部分的系統傾向,就會有抽選偏倚產生。 例如,如果在進行家庭調查時,調查時間選在整個一星期內從上午9點到下午5點的時間段內,那麼,調查結果就會問著至少有一個成員在家的家庭嚴重地偏倚。因此,從這個調查的樣本資料所做出的任何推斷將偏向於至少•個成員在家的那些家庭的態度或意見,從而對於該區域家庭的總體不具有真正的代表性。 現在,我們轉而定義從一個包含 N個測量值的總體中抽取的含有n個測量值的隨機樣本(N>n)。(注意,這是在第二章中討論過的一種簡單隨機樣本。因為本書討論的大多數隨機樣本是簡單隨機樣本,除非為了澄清的需要,我們將省略 “簡單“這一形容詞。〉 定義4.13 從總體中抽選大小為n的樣本時,如果所有不同的大小為n的樣本被選擇的機率都相同,那麼,這樣抽取的樣本稱為一個隨機樣本。 例4.17 計劃在美國對10個最大的城市進行一項有關手槍犯罪的研究。在進行初步調查後,該研究將從 10個最大的城市中隨機選擇2個作為深入研究的物件。要研究的總體是10個最大的城市!CI,C2,C3,C4,Cs,Co,C,Ce.Ce,Ci0f。列出以 10個城市的總體中選取2個城市時,所有可能的不同的樣本。給出從總體中抽取 7 =2個城市的隨機樣本時,每個樣本被抽中的機率。 解答所有可能的樣本列表如下。

4.L1 隨機抽櫸 • 185 樣本 1 2 3 4 5 6 7 8 9 10 11 12 13 城市 Ci,C CiCs CiC4 Ci,Cs C1C。 C1,CR C1,Cg C C10 Cz.C C2.Ca C2.Cs 15 Cz, Cz, C& 樣本 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 城市 C2,C。 C2,C10 Cy,Ca Ca,Cs CsCo Ca,C, C3,CA Ca,Cy Cs,Ci Ca,Cs Ca s C4,C7 4 C8 C4,Cg C4,Ci 樣本 31 32 33 35 36 37 38 39 40 41 42 43 44 45 城市 Cs. C Cs G C5,CB Cs, Cg Cs. Ciu Ca,C, Co,C8 Co.Gg Co,Cro C7.C C7,Cg C7,CI Ca,C CsCIR C9,Cza 現在,我們假定從45個可能的樣本中選擇一個* =2個城市的隨機樣本。如果每個樣本有相等的被選擇的機率,即 1/45,選取的樣本就稱為一個隨加撈本。 從總體中選擇容量為n的隨機樣本,最簡單、最可靠的方法之一是使用一張隨機數表(見附錄中的表13)。隨機數表是這樣的一張數字的表格,不管你從表的哪兒開始,也不管你向哪個方向移動,數字是隨機出現的並且有相等的機率。這樣,如果我們希望從包含100個測量值的總體中選擇由3=10個測量值組成的一個隨機樣本,可以把總體中的測量價標記為0~-99(或1~100)。然後參考附錄中的表13,並且從中選擇一個隨機起點,從該起點開始向前接「下來的10個2位數就作為包含在選取的隨機樣本中的那些測量值的標記。同樣,透過向上移動或向下移動,我們也將獲得一個隨機樣本。 對於所有可能的樣本進行列表,只有當樣本容量*和總體大小N都不大時才可行。從含有N 個測董值的總體中選取樣本容量為:的樣本時,所有不同的樣本的個數 M 可以由下列的公式確定: M-nI(N-n!

• 186• 第四章機率和機率分佈在例4.17中,N=10, =2。於是, M-21(0027-2-45 甚至當 N不大時,M 的值也會很大。例如,如果 N=50而:=5,那麼 M =2 118 760。這樣,如果要從含有 N=50個測量值的總體中抽取由n=5個測值組成的隨機樣本,要列出所有的2118760 種可能的樣本是很不切實際的。在實踐中,我們把總體中的 N個元素編號為從1到N,並構造一張表,列出這些編號,該表稱為樹拌框架。然後使用隨機數表(見附錄表13)或計算機程式,從整數 (1.2.•,N)中隨機選取n個整數。大多數統計軟體程式包含從整數(1,2,, N)中隨機選取:個整數的例程,其中 N>n。練習 4.86 中包含了使用 Minitab 產生隨機樣本時需要的命令。 例4.18 一個小社群由850 個家庭組成。我們希望獲得20個家庭的一個隨機樣本,以查明公眾對工資和價格限定的接受情況。參考附錄中的表13,決定哪些家庭作為樣本。 解答假設有社群中所有的家庭的列表(例如一個電話目錄),因而我們可以把這些家庭標記為0~849(或等價地標記為1~850)。然後,參考附錄中表13,我們選擇一個起點。假定我們決定從第1行第3列開始。沿著這一頁,我們選取頭 20 個界於000和849之間的3位數。從表13,我們得到 015 255 225 062 818 110 564 054 636 533 482 $26 710 518 $24 333 463 337 224 055 這20個數字指明瞭在我們的樣本中包括的20個家庭。 電話目錄並不總是最好的名字的來源,特別在調查與經濟或政治有關的問題時。在1936年的總統選舉中,富蘭克林•羅斯福作為民主黨的候選人與共和黨候選人堪薩斯的州長阿爾弗雷德•蘭登競選。此時正是美國的困難時期;美國還沒有從20 世紀30年代的大蕭條中恢復過來,仍然有900萬人失業。 讀者文摘(《Literary Digest》)為了預測選舉的獲勝老進行了一項投票公眾的抽祥。使用從電話本和俱樂部的會員表中拿到的名字租地址,Literary Digest 向

4.11 隨機抽樣•187• 外送出了1000萬份問卷調查表,並收回了,240萬份。基於調查表的回答,他們預言蘭登將以57%對43%取得勝利。 這時候,喬治•蓋洛普(GeorgeGallup)正在開始他的調查業務。他進行了兩項調查。第一項基於對3000人的調查,在 Literary Digest 的結果發表之前很久就預言「l-iterary Digest 調查的結果會是什麼;第二項調查基下50 000人的樣本,百確地預測到了羅斯福的勝利。 蓋洛普怎麼能正確地預言 Literary Digest的調查結果呢?他又怎麼能在其後的另一項調查中,正確預言選舉的結果呢?Literary Digest 哪裡出現了錯誤?第一問題是嚴重的抽選偏倚。從電話目錄和俱樂部會員表中選取名字地址,其調查系統地排除了窮人。不幸的是,投票沿著經濟水平分離;窮人大多數授票給了羅斯福,而富人趨於投票給蘭登。犯錯誤的第二個原因可能是由於無回答編筒。因為在1000萬人中僅僅有20%返回了他們的調查表,並且在那些返回的表中有近似一半是贊成蘭登的,人們可能猜想也許沒返回撥查表的人與做了回答的人者有不同的偏愛。事實正是如此。 那麼,怎樣得到一個隨機樣本呢?這需要細心計劃,機敏從事,甚至於要將就進行近似的隨機抽樣時也需要如此。當要研究的問題包括人時,就更是這樣。有些人可能很難與其打交道;他們容易丟棄郵寄的調查問卷並拒絕參予訪問調查。 除非非常謹慎,我們獲得的資料可能包含各種偏倚,從而對我們要進行的推斷造成未知的影響。 我們沒有足夠的時間在本書中進一步探討隨機抽樣的問題;樣本調查研究方法論的內容可以構成大學生和研究生的一系列課程。要記住的重要的一點是,從隨機樣本得出的資料將作為以後的各章中進行統計推理的基礎。隨機樣本雖然是不容易獲得的,但是小心一些,我們就能避免許多潛在的能影響我們所做推斷的偏倚。 練習基本技能 4.79 詳細說明隨機樣本的意義。能否抽出一個真正的隨機樣本?給出解釋。 4.80(政府)假定我們想要從800個人的總體中選擇n=10個人的一個隨機樣本。使用附錄中的表13找出被選在樣本中的人。 4.81(政治學)參考練習4.80。確定從 N=1000的總體中抽取的一個n= 15 的隨機樣本中的元素。

• 188• 第四章機率和機率分佈應用 4.82(社會)某城市要提高地方稅額來改進公立學校的質量。城市官員要通過抽樣來了解一個社群中擁有房產的人關於此事的意見。如果用一張隨機數表來確定樣本中的家庭,並且當訪問者訪問時房主不在家的時候,就放棄這一家,這個過程會接近於隨機抽樣嗎?解釋其原因。 4.83(社會)一家地方電視網想要對居住在一個當地投票選區的人進行的一項非正式調查,以初步瞭解他們對一個籌措資金以把市屬的歷史博物館遷到一個新地點的提案的意見。這家電視網怎樣才可能對這些選民進行近似的隨機抽樣? 4.84(社會)一個心理學家要研究在獲得離婚的過程中的婦女,以確定這些婦女在完成離婚以後是否經歷了重要的觀念轉變。待研究的地理區域的現存記錄表明,近期有798 對夫婦離婚。假設研究中需要25位婦女的一個樣本,試用附錄中的表13決定應要求哪些婦女參加到研究中來。(提示:在第2列第1行開始向下走。) 4.85 參考練習4.84。在大多數調查的案例中,不是所有被選擇參加研究的人都同意參與。假定選擇的25位婦女中有5位婦女拒絕參與。確定在研究中要包括另外5位婦女。 4.86(社會)假定要求你就即將來臨的選舉進行民意測驗。城市裡有230個選區,而你需要從每個選區中隨機選取50個登記的選民。假定每個選區有1 000 個登記的選民,並且你可以獲得一張這些人的表。你在每張表上把1000個人標以數字1~1000,以1記表中的第一人,以1000記表中的最後一人。接下來你需要從1到1000這1000個數字中獲得50個數字的一個隨機樣本。抽樣框架上相應於這50 個數字的名字就是你在民意測驗中選取的50個人。為了說明這一過程,這裡給出一個 Minitab 程式。注意你需要分別執行這個程式230次,以在230 個選區中獲得每個選區的一個新的隨機樣本。 按照以下步驟: 單擊“Calc"。 單擊“Random Data”。 單擊“Integer"。 在“Generate rows of data”對話方塊中輸入$。 在“Store in Colemn(s):”對話方塊中輸入c1~¢10。 在“Minimum value:”對話方塊中輸入1。 在“Maximum value:”對話方塊中輸人1000。 單擊“OK”。 單擊“File”。 單擊“Print Worksheet"。

4.12 抽樣分佈•189• a. 使用一張隨機數表或一個計算機程式,從數字1~1 000 中產生50 個數字的第2個隨機樣本。 b.給出為什麼你需要每個選區產生一個不同的隨機數集合的若干原因。為什麼不在所有的230個選區中使用同樣的50 個數字的集合? C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 1 2 3 4 5 340 783 862 974 232 701 877 625 402 742 684 724 971 768 1 393 498 30 593 861 313 315 766 980 335 312 282 256 $36 129 834 175 40 483 409 596 611 158 244 724 321 725 444 51 340 739 571 546 201 218 4.12 抽樣分佈我們在第三章討論了中心趨勢和變異性的若不不同的度量,並且討論了總體的數值描述量(引數)與樣本的數值描述量(統計量)之同的區別。例如,p和a是引數,而亍和s是統計。 樣本統計量的數值不能預先確切地預測出來。即使我們知道總體的均值p 是216.37 美元,總體的標準差。是32.90美元- -就算我們知道完全的總體分佈 ——我們也不能說樣本均值將恰好等於216.37美元。一個樣本統計量是一個隨機變數;由於它基於從感興趣的總體中抽取的測量值的一個隨機樣本,統計量的取值有隨機的變異。像其他隨機變一樣,一個樣本統計甘也有其機率分佈。我們把一個樣本統計量的機率分佈稱為這統計量的甜樣分為。換句話說,統計量的抽樣分佈是該統計量的所有的可能值的總體。 抽樣分佈的實際的數學推導是數理統計學的基本問題之一。我們將舉例說明對簡單的總體如何獲得了的抽樣分佈。在以後章節中,我們將給出一些一般的結果。 例4.19 樣本均值是從容量為2的一個隨機樣本計算得到的,該隨機樣本是從由 10個值(2,3,4,5,6,7,8,9,10,11)組成的總體中取出的。基於容量為2的隨機樣本,求的抽樣分佈。

• • 190• 第四章機率和機率分佈解答求抽樣分佈的一種方法是透過計數。從10個個體中選取2個個體共有45個可能的樣本。列出如下: 梯本 2.3 2.4 2.5 2,6 2.7 2,8 2.9 2.10 2,11 3.4 3.5 3.6 3,7 3.8 3.9 z的值 2.5 3 3.5 4 4.s 5 6.5 3.5 4 4.5 •5.5 6 樣本 3,10 3,11 4,5 4,6 4,7 4,8 4.9 4.10 4,11 5.6 5,7 S.8 5.9 5,10 S,11 的值 6.S 7 4.5 5 5.S 6 6.s 7 7.5 5.5 6 6.5 7 7.5 8 樣本 6,7 6.8 6.9 6.10 6,11 7,8 7,9 7.10 7,11 8.9 8.10 8.11 9.10 9,11 10,11 爫的值 6.5 7 7.5 8 8.5 7.5 8 8.5 9 8.5 9 9.5 9.5 10 10.5 假定每個容量為2的樣本是等可能的,則基於從總體|2,3,4,5,6,7,8,9,10,11}中抽出的n=2個觀察值, 的抽樣分佈如下表所示。 P(j) 1/45 1/45 2/45 2/45 3/45 3/45 4/45 4/45 5/45 y 7 7.5 8 8.5 9 9.5 10 10.5 P() 4/45 4/45 3/45 3/45 2/45 2/45 1/45 1/45 該抽樣分佈顯示在圖4.19中。注意分佈是對稱的,其中均值是6.5 和標準差約為 2.0(極差除以4)。 例 4.19說明,對很小的總體,我們能做到校舉從總體選出的容量為2的所有

4.12 抽樣分佈 • 191 5/454/45 - Pp 3/452/451/450 2.0 3.0 4.0 5.0 6.0 T 7.0 8.0 9.0 10.0 11.0 J 圖 4.19 的抽樣分佈可能的樣本,並且算出樣本均值的所有可能的值。下一個例子將說明當從較大的總體抽樣時,樣本均值的性質。該例子說明,了作為的估計,其性態取決於樣本的大小n。在本章的後面,我們還將說明總體分佈的形狀對於的抽樣分佈的影響。 例4.20 在這個例子中,總體的值是已知的,因而我們能準確地計算總體均值x和總體的標準差a。我們將從總體選取樣本容量為n三5,10和25的樣本,並以此來考察的性態。總體由500個便士組成,我們可以計算出每個便士的年齡:年齡= 2000-便士上的日期。這500個年齡的直方圖顯示在圖4.20(a)中。圖形向右偏倚,並且右邊有一條很長的尾巴。算得均值和標準差分別為 =13.468年和。= 11.164年。為了對n=5生成的抽樣分佈,我們需要產生容量為n=5的所有可能的樣本,然後對這些樣本的每一個計算。因為從 500個元素的總體中抽選的容量為5的可能的樣本有255,244,687,600個,這些計算將是一項龐大的任務。 樣本容量為10或25的可能的樣本的數就更是大得連國債數額也相形見絀。因此,我們將使用計算機程式 S-plus,從500個便士的總體中選出容量為5的25,000 個樣本。例如,第一個樣本由年齡是4,12,26,16 和9的便士組成,相應的樣本均值 =(4+12+26+16+9)/5=13.4。我們重複25,000次選取5個便士的過程,記錄它們的年齡,31,32,33,34,35,然後計算 =(y1+y2+33+y4+y5)/5。 用所得到的的這25,000個值作頻數直方圖,這個圖稱為n=5時了的抽樣分布。對樣本容量n=10和25進行類似的過程,獲得的抽樣分佈顯示在圖4.20(b) ~(d)中。

• 192• 第四章機率和機率分佈 35 2515 -2 TT 012345678910 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 年齢 (a)500 個便士硬幣年齡的直方圖 2,000」 1,400 800] 400- -2 012345678910 12 14 16 18 20 22 24 平均年齡 (b)n=5時的抽樣分佈 T7 26 28 30 32 34 36 38 340 42 2200 數1,400 頻 600= 0 -2 012345678010 12 14 16 18 20 22 24 126 28 30) 32 34 36 38 ‘平均年齡 (c) n=10時的抽樣分佈 40 42 4,.000】 嫩250_ 頻 1,000】 012345678910 12 14 16 18 20 22 24 26 平均年齡 (d)n=25 時的抽樣分佈:30 32 34 36 40 42 圖 4.20 注意,所有三種抽樣分佈有近似相同的中心值,近似於 13.5。(見表4.5)對於三種樣本, 的均值大體上與總體均值p.=13.468一致。事實上,如果我們對n2 的所有三個值生成所有可能的樣本,那麼了的可能值的均值將準確地等於A。 對於這三張直方圖,下一個值得注意的特徵是它們的形狀。所有三張圖在形狀上具有某種程度的對稱性,當n=25時達到了接近於正態分佈的形狀。然而,

4.12 抽樣分佈 193• 基寸樣本容 =5的的直方圖,比基於n=10的直方圖張得更開些,而基子 -10的直方圖比n-25的直方圖張得更開。當較小時,比起n較大時我們更可能獲得遠離的的值。是什麼原因增加了的值分散程度呢?在樣本中一個極端的 y,不論相對於x是大還是小,當n小時比n大時,在了的大小上有更大的影響。因此,基於小的*的樣本均值作為p的估計時,不如那些大樣本的均僨來得精確。 表4.5包含丫的抽樣分佈的概括統計量。 的抽樣分佈有均值/s和標準差o,它們與總體均值 p.和標準差。有下列關係: Ks=M.os=號 .n 表4.5 的抽樣分佈的均值和標準差樣本容量 1(總體) 5 t0 25 的均值 13.468(p.) 13.485 13.438 13.473 乏的標準差 11.1638(o) 4.9508 3.4926 2.1766 11.1638 Vn 11.1638 4.9926 3.533 2.2328 從表4.5中,我們注意到三種抽樣均值近似等於總體的均值;三種抽樣的標準差近似等下。/VT。如果我們產生了的所有的可能的值,那麼的標準差將準確在常見的樣本統計量中,有不少統計量,如樣本中位數和樣本標準差,對於中等以上的樣本容量,的值,有近似子正態分佈的抽樣分佈。透過下面的計算,我們可以看到這一點。對於從 500 個便士的年齡總體中抽取的由25,000個樣本組成的三個樣本集合(分別對應於 n=5,10,25),計算出各個樣本的中位數和樣本標準差。所得樣本中位數結果的樣本分佈表示在圖4.21(a)~(d)中,圖4.22(a)~ (d)則表示樣本標準差的計算結果。樣本中位數和標準差的抽樣分佈比樣本均值的抽樣分佈傾斜得更厲害。事實上,樣本中位數和標推差的抽樣分佈要近似於正態分佈的形狀所需要的7值比樣本均值所需要的,值大得多。我們稱之為中心極限定理的數理統計學的一系列定理,為我們用正態分佈去近似許多樣本統計量的真實的抽樣分佈提供了理論上的保證。我們將討論關於樣本均值的一個這樣的定理。對樣本中位數,樣本標準差和樣本比例有類似的定理。

• 194• 第四章機率和機率分佈 35 數25] 頻I5 2 012345678910 12 14 16 18 20 22 24 26 28 30 32 34 36 38 年齡 (a) 500個便士硬幣年齡的直方圖 T 40 42 1,8001,200800] -2 012345678910 16 18 20 22 24 26 中位年齡 (b) n=5 時中位數的抽樣分佈 34 40 42 2,000頻數 0 012345678910 16. 18 20 22 24 中位年齡 (c) 1=10 時中位數的抽樣分佈 34 36 38 40 42 0 -2 012345678910 12 14 16 18 20 22 24 中位年齡 (d) n=25 時中位數的抽樣分佈圖4.21 26 28 30 32 34 36 38 40'42 定理4.1 關於的中心極限定理設表示從抽自於均值為並且有有限的標準差。的總體的、容量為”的隨機樣本計算出來的樣本均值。設K,和。s分別表示的抽樣分佈的均值和標準差。基於從總體中重複抽取的容量為n的隨機樣本,我們可以得出下列結論: 1•Ks Ho

4.12 抽樣分佈 • 195• 35 頻數 -2 012345 678910 12 14 一T 16 18 20 22 24 26 28:30 32 34 36 38 40 42 年齡 (a)500個便士硬幣年齡的直方圖頻數 400 2501000 -2 012345678910 12 14 16 18 20 22 24 26 28 33032 34 36 38 40 42 5個年齡的樣本的標準差 (b)n=5 時標準差的抽樣分佈頻數 800600」 400200012345678910 14 16 18 20 22 24 26'28 30) 32 34 36 38 40 42 10個年齡的樣本的標準差 (c) n=10 時標準差的抽樣分佈 1,6001,200- -2 012345678910 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 25個年齡的樣本的標準差 (d) n=25 時標準差的抽樣分佈圖4.22 2.0;=a/vn。 3. 當n取大值時, 的抽樣分佈將逼近正態分佈(隨著n的增加這種近似將愈加精確)。 4. 當總體分佈是正態分佈時,對任意的樣本容量n,立的樣本分佈均為正態

• 196• 第四章機率和機率分佈分佈。 圖4.20說明了中心極限定理。圖 4.20(a)顯示了從中抽取梯本的總體中測試值,的分佈。要使中心極限定理生效,對這些測量值的分佈沒有特定的形狀要求。圖4.20(b)~(d)分別顯示了當n是5,10和25時,樣本均值的抽樣分佈。 我們注意到甚至對於很小的樣本容量, =10, 的抽樣分佈的形狀與正態分佈的形狀很類似。這在一般情況下是不對的。如果總體分佈有許多極端的值或者若幹個峰,*要非常大, 的抽樣分佈才會形成對稱的鐘形。 0.12 0.10度 0.08- /2a-25 n=10 n=5 0.02 - 0.0總體 -20 0 20 40 60 圖4.23 從正態分佈中抽樣時,當n=5,10,25時的抽樣分佈我們看到,樣本容量,對於了的抽樣分佈的形狀有影響。總體測量值的分布的形狀也將影啊的抽樣分佈的形狀。圖4.23和4.24說明了總體分佈的形度衡 0.60.50.40.3• 0.20.10.0 ^ n=25 二10 1=5 0 s 10 15 20 圖 4.24 從偏倚的分佈中抽樣時,當 n =5,10.25時夕的抽樣分佈

4.12 抽樣分佈 • 197 狀對的抽樣分佈的形狀上的影響。在圖4.23中,總體測量值有止態分佈。對 *的所有的值, 的抽樣分佈是準確的正態分佈,如圖4.23對於:=5,10和25 所顯示的那樣。當總體分佈是非正態分佈時,如在圖4.24中所描繪的,對於小的 n, 的抽樣分佈將不再有正態分佈的形狀(見圖4.24~=5的情況)。然而,當對 =10和25時,抽樣分佈在形狀上接近於正態分佈,這在圖4.24中可以看到。 已知總體分佈的確切形狀是不大可能的。因此, 的抽樣分佈的確切形狀也將是未知的。童要的一點是要記住了的抽樣分佈近似」均值為=從,即總體均值,以及標準差為a=4//n 的正態分佈。隨著每個樣本的樣本容量n的增加,或者隨總體分佈的形狀問著正態分佈的形狀變化,這種近似將更為精確。 一個顯然的問題是:為使中心極限定理成立,樣本容量應為多大?多年以來進行了眾多的模擬研究。總的來說,這些研究的結果建議中心極限定理當:>30時成立。然而,我們不應盲目地使用這條規則。如果總體分佈嚴重地偏倚,那麼可的抽樣分佈即使當n>30時也將仍然是偏倚的。另一方面,如果總體是對稱的,中心極限定理當n<30時也可用。 因此,要看一看資料。如果樣本的直方圖明顯地偏倚,那麼總體分佈也可能是偏倚的。因而,要使的抽樣分佈近似正態分佈,所需要的?的值可能要比30 大得多。此時,對於在n =30時,基子的正態性所作出的任何推斷都要進行仔細地推敲。 如在圖4.21和4.22中所看到的那樣,中心極限定理可以被推廣到許多不同的樣本統計量。關於樣本中位數和樣本標準差的中心極限定理的形式,在某種程度上比樣本均值的中心極限定理的形式更復雜。我們在以後的章節中會遇到許多統計量,它們是變數的平均值或總和。總和的中心極限定理容易從樣本均值的中心極限定理中得到。假定我們從總體中抽出含有n個測量值y1,“,》,的一個隨機樣本,令二 = 1+⋯+yno 定理4.2 乙y的中心極限定理設二,表示從總體中抽出的容量為n的一個隨機樣本的積,且總體的均值為 K.總體的標準差。有限。設立,和a立,分別表示二»的抽樣分佈的均俏和標準差。基於從總體中重複抽取的容量為n的隨機樣本,我們可以得出下列結論: 2.02,=Sn0。 3. 當*取大值時,乙y的抽樣分佈近似了正態分佈(隨著n 的增加這種近似將愈加精確)。 4.當總體分佈是正態分佈時,對任意的樣本容量n,二》的抽樣分佈是準確

• 198• 第四章機率和機率分佈的正態分佈。 一個樣本統計量通常用來作為一個總體引數的佔計。例如,樣本均值立可以用於估計從中抽取樣本的總體的均值p。同樣,樣本中位數和樣本標準差可估計相應的總體的中位數和標準差。因而,一個樣本統計量的抽樣分佈常常用來決定該統計量作為總體引數估計的精度。在例4.19中,已知總體均值 p4是6.5。顯然,任任何實際的研究或試驗中我們不知道p的值。然而,對於從總體中抽出的容量為n的隨機樣本,我們可以使用的抽樣分佈來確定的值大於比p低3 個單位的值的機率。當n=2時,使用例4.19中的資料,知這個機率為 P(2.5) + P(3)+ P(10) + P(10.5)= 4 45 在一般的情況下,樣本統計量的抽樣分佈很少知道,因而我們根據中心極限定理使用正態分佈做近似的計算。第五章將討論這類計算。由於我們使用樣本統計量對 ⋯個總體引數進行推斷,統計量的抽樣分佈是決定推斷的精確性的關鍵所在。 抽樣分佈至少可以用兩種方法解釋。一種方法是用大量重複抽樣時的頻率來解釋。設想從給定的總體中重複抽取固定容量的樣本,並且對每個樣本計算所考慮的樣本統計量的值。在大量的重複抽樣中,該樣本統計量的可能值的頻率將接近十相應的抽樣分佈的機率。例如,如果從相應於例4.19中的機率的總體分佈中抽取大量的樣本,並對每個樣本計算其樣本均值,則在這些樣本均值的結果中,約有9%滿足 =5.5。 抽樣分佈的另外…種解釋方法是使用機率的古典解釋。設想列出從給定的總體抽出的所有的可能的樣本。那麼,一個樣本統計量取特定值的機率(比如說,可 =5.5)對每一個樣本計算該統計量時從中得出這一個值的所有可能的梯本的比例。在例4.19中,P(=5.5)=4/45對應於在45個樣本中有4個樣本的樣本均值等十5.5這一事實。無論用重複抽樣方法還是用古典機率的方法求樣本統計量的機率都是合理的。 然而,在實踐中,一個樣本僅僅抽取一次,因而也只計算一個樣本統計量的值。 抽樣分佈是不能在實際中看見的;它不是一個經驗的、觀察到的分佈。相反,它是一個理論上的概念,是一個從關於總體和抽樣方法的假設中匯出的機率的集合。 短語“抽樣分佈”和“樣本分佈“字面相近,容易造成誤解,然而,它們的意義幫迥然不同。“抽樣分佈”意味著理論上匯出的統計量的機率分佈,而“樣本分佈”,是指在一個特定的樣本中實際觀察到的個體值的直方圖。為了避免混亂,我們將樣本值的分佈叫做樣本直方圖,而不稱其為樣本分佈。

4.12 抽樣分佈•199• 練習基本技能 4.87 從均值為60,標準差為5的總體中,抽出容為16 的一個隨機樣本。 描述樣本均值的抽樣分佈。你預期的大約95%的取值會落在什麼樣的花圍內? 4.88 參考練習4.87。描述樣本總和乙v的抽樣分佈。乙:距離960超出 70 個單位是不大可能(不可能)的嗎?解釋原因。 4.89 在練習4.87中,從p=60 和a=5的總體中抽取出一個16 個觀察值的隨機樣本。假設測量值總體的分佈是正態分佈。使用一個計算機程式,透過抽取500 個由16 個觀察值組成的樣本米模擬了的抽樣分佈。模擬時可以使用本章最後一節(4.14)中給出的一個 Minitab 程式。 應用 4.90(心理學)對於一大群狂躁型抑鬱症患者,其精神運動延遲得分是近似於正態分佈的,其中均值為930,標準差為130。 a. 得分落在800和1,100之間的患者的比例是多少? b.不到800的患者的比例是多少? c.大於1,200的患者的比例呢? 4.91 參考練習4.90。 a.對於狂躁型抑鬱症患者的精神運動延退得分的分佈。求其第90 個百分位數。(提示:在表示式 =(y p)/ 中求出y,此處2表示第90 個百分位數超過均值p的部分是標準差的多少倍。) b.求四分位數間距。 4.92(社會)聯邦政府的管理部門已經原則上同意-個門診醫院的建設計劃。為了在有限的預算內,把該醫院設計成為能夠滿足患者就診需求量要求的設施,設計人員調查了患者的需求。他們調查了該區域內一象類似的設施,發現在一個星期期間需要住院的病人的數量的分佈可以用•一個均值為125,標準差為32的正態分佈來近似。 a.使用經驗準則來描述在一個星期內請求服務的病人的數量y的分佈。 b.如果該設施的容納能力為160患者,這家醫院在一個星期內由於容納能力所限而不能接待的患者佔有多大比例? 4.93 參考練習 4.92。為使得前來就醫的患者人數超過醫院容量的機率是 0.05或0.01,該醫院分別應建造多大? 4.94(社會)基於1990年的普查結果,成年人每天花在看電視的小時數近似於均值為5個小時,標準差為1.3小時的正態分佈。

200• 第四章機率和機率分佈 a.成年人中每天看電視的時間超過7個小時的人佔多大比例? b. 在1998年關十電視收視的一項研究中,由500個成年人組成的一個隨機樣本表明,每天用在看電視上的平均時間大於 5.5小時。這項調查的結果與 1990年的普查結果看起來是一致的嗎?(提示:如果普查的結果仍然是正確的,那麼看電視的平均時間超過5.5小時的機率是多少?) 4.95(環境)一種假設的型號(稱為普魯特,Polluter 意為汙染源)的汽車,行駛任城市裡時,其排放的尾氣中一種特別的汙染物質,即一氧化氮的水平近似服從」均值為2.1g/m(克每英里)和標準差為0.3g/m 的正態分佈。 a.如果美國環保署(EPA)規定,一氧化氮的水平不能超過2.7g/m,那麼違背這項規定的這種汽車佔多大比例? b. 找出一氧化氮的一個水平,使得至多有25%的普魯特車超過這一水平(也就是求75百分位數)。 c.生產普魯特車的公司必須降低一氧化氮的水平,以使得排放超過 EPA規定的水平2.7g/m 的汽車至多佔5%。如果標準差仍然是0.38/m,平均排放水平要減少到多少,才能使一氧化氮排放超過2.7g/m 的汽車至多佔 5%? 4.96 參考練習4.95。一家公司有一個150輛普魯特車的車隊,這些車供該公司的銷售人員使用。試以g/m 為單位,描述該車隊的排放的尾氣中所含的一氧化氮的總量的分佈。在這個車隊排放的尾氣中所含一氧化氮的總董的均值標準差是多少(以g/m 為單位)?(提示:-氧化氮的總量可表示為 W其中W:是第;個車輛排出的一氧化氮的數。由此,可以利用對總和的中心極限定理。) 4.97(社會)-架飛機的行李限制是每位旅客不超過100磅。因此,對於有 200個座位的一架飛機,行李不應超過20,000磅。單個的旅客的行李的重量是個具有均值95磅,標準差35磅的隨機變基。如果對於某次特定的飛行,所有的 200個座位都賣出去了,那麼旅客的行李的全部重量超過20,000磅的限制的機率是多少? 4.98(醫學)一位病人因為擔心她的血壓訪問其醫生。如果血液的收縮壓超過150,則認為這個病人有高血壓並且可以開處方藥。問題是在給定的一天內,一個病人的血液的收縮壓的讀數有很大的變化。 a. 如果一個病人在給定的一天內的收縮壓的讀數服從均值為160毫米汞柱, 標準差為20毫米汞柱的正態分佈,對該有高血壓的病人的一次測量沒能檢測出其患有高血壓的機率是多少? b. 如果在一天內不同的時間做5次測量,那麼血壓讀數的平均值小於150,並因此沒能顯示該患者有高血壓問題的機率是多少?

4.13 二項分佈的正態通近•201• c.要使得對這位有高血壓的病人沒能檢測出的機率不超過1%,需要測量多少次? 4.13 二項分佈的正態逼近前面定義的二項隨機變y,是在一項隨機試驗內進行的n次獨立的試驗中觀察到的成功次數,其中所有的n次試驗的試驗結果是成功(S)或失敗《F),並且 P(S)=™。我們下面將說明,如何根據總和的中心極限定理,使用適當的正態曲線作為二項分佈的近似,從而能夠計算一個二項隨機變數的機率。我們在4.8節說過,對於,或開為任何值的二項試驗,總能計算出y取任一個值的機率。但是當 *變得大時,這項任務愈加困難。例如,假定調查由1,000個選民組成的一個樣本,以確定人們對市政府和縣政府合併的意見。如果我們假定整個總體的50%贊成這一改變,那麼觀察到460 或更少人贊成合併的機率是多少?這是一個 n=1,000,x(挑選到一個贊成合併的人的機率)等於0.5的二項試驗。為了確定在1,000個選民的隨機樣本中,觀察到460或更少的人贊成合併的機率,我們可以使用二項式公式來對於 y=460,459,⋯,0計算 P(y),然後,計算所要求的機率 P(y= 460)+P(y = 459)+…+P(y=0) 這裡有461個機率需要計算,其中的每一個機率的計算都因為要計算階乘而有些困難。例如,觀察到460人贊成合併的機率是 P(y =460) -4600:7540T(0.5)#0(0.5)$00 對y的所有其他的值也需要類似的計算。 為了闡述中心極限定理的使用,我們需要定義如下,個隨機變數,1,“,, 上如果第;次試驗結果為成功 1,=1o 如果第之次試驗結果為失敗二項隨機變 y是在*次試驗中成功的次數。現在,考慮隨機變數1,…,1,的總和 21.每當s發生時在總和中加1,而每當F發生任總和中加0。這樣,之!是在雙試驗期間S發生的次數,因此,我們將到》一之1。因為二項隨紅變熱y是獨立的隨機變數的總和,其中每一個隨機變鹽有同樣的分佈,我們可以對y使用總積的中心極限定理。於是,當n的大小適當時,正態分佈可以用來近似二項分佈。所使用的正態分佈的均值和標準差由下列公式給出: 這正昆一項隨機變鹽»的均值和標準差。

• 202