AI 新聞與投資
統計學方法與資料分析引論

第四章介紹了二項分佈正態近似的應用條件,如果我們將同樣的條件應用到上述

16 / 34

兩個二項分佈,那麼,這裡的近似是合適的。因此,如果 x7;和n(1-x:)都至少為 5,i-1.2,那麼,就可以用正態分佈近似示1一元2的分佈。由於不1租T2 未知,因此,這種近似的有效性通常用 n,和n(1 六:), =1,2來衡。 1一72的置信區間和統計檢驗比較簡單,遵循(I p2 的估計和檢驗方法。 下面給出區間估計的形式;它取通常的形式,即點估計士x(標準差)。」一 2的10011-8)% 的置信區間 T1一T 士2a/20 2 其中 0元、*2 = 注:在0,一*公式中用元1和元2代替不,和不20當元1一元2的正態近似有效時,這種代替所產生的誤差很小。 例 10.5 某公司在 Michigan 州的 Girand Rapids 和 Kansas 州的Wichita 城市地區試銷 -種新產品。公司在 Girand Rapids 地區幾乎完全透過電視釋出廣告。在 Wichita 地區,公司在電視,廣播,報紙和雜誌上的廣告投入大致相同。廣告戰開始的兩個月後,公司進行抽樣調查,以瞭解消費者對其產品的認知程度。求兩地區知道該產品的消費者所佔比例差的95%置信區間。 調查的人數知道該產品的人數 Grand Rapids 608 392 Wichita 527 413 解答樣本中Wichita 地區的消費者對該產品的認知程度更高,所以令Wichita 地區為地區1。 i1 = 413/527 = 0.784 元2 = 392/608 = 0.645 估計的標準差為 0.7899-2102+50.602g.3852- 0.0264

10.3 兩總體比例之差 T1 72的推斷 •527• 因此,95%置信區間為 (0.784- 0.645)-1.96(0.0264)≤*1-T2 ≤(0.784- 0.645)+1.96(0.0264) 即 0.087≤m1- 72≤0.191 這表明 Wichita 地區知道該產品的消費者比例比Girand Rapids 地區知道該產品的消費者比例高8.7%到19.1%。 該置信區間的構造是建立在二項分佈的正態近似基礎上。在第四章,我們曾經指出,作為一般規則,為了應用正態近似,n眾和n(1 元)至少應等於5。本例中計算置信區間時,每一樣本都滿足這一規則。實際中,那些非常接近於違反這一規則的樣本容量並不是很冇用,因為他們將導致太寬的置信區間。例如,對於…1= 30,元」=0.20和 2=60, 2=0.10的兩個樣本,即使nar和 (1一元)都大於5,但是置信區間為 0.06≤x1 2≤0.26,不1 可能是任何一個值,從比*2低6個百分點到比x2高26的百分點。 r信區太寬以至於失去作用的原因在:於每次觀測只傳達了很少量的資訊。 實際上每次觀測僅傳達了一個“位元”:代表成功的一•個1或代表失敗的一個0。 例如,公司執行長對賠償問題進行調查時,通常以年為單位列出經理的年齡。 如果我們用“55歲以上”對“55歲以下“這樣的型別資料代替真實年齡時,我們獲得的資訊絕對非常有限。當每一專案只包含一點點資訊時,我們就需要大量的專案來獲得足夠的總量資訊。無論在哪兒,只要有可能,最好用計量的方式而不僅僅用型別的方式來度量結果。當計量的方式不可能時,就應該用容相對大的樣本。 兩總體比例差的假設檢驗是建立在正態近似的,統計量基礎之上。雖然零假設可以是不1一x2等於某已知的值,但典型的零假設一般認為總體比例沒有差異。該檢驗方法非常類似於均值差的t檢驗,總結如下: 兩總體比例之差的統計檢驗 Ho:1. 1 ≤0 2.加1-72≥0 3.不1一72=0 H: 1.元1 220 2.T1 2<0 3. 1 2 0 T.S.: (1 2) x=i

• 528• 第十章型別資料 R.R.: 1.2≥2 2.:<-2a 3.1x|≥8a/2 驗證假定並作出結論。 注:只有當71元1,7/(1 元1),32 2 和722(1-72)都大下5時,該檢驗才能被使用。 例 10.6 教育研究人員欲比較兩種針對非英語人員進行英語教學的效果,一種是藉助於計算機軟體的教學方式,另一種是傳統的課堂教學方式。研究人員隨機地將 300人分成兩個班,一班125 人採用計算機教學方式,另一班 175 人採用傳統教學方式。在6個月的培訓期結束之時,對所有300名學生進行一次測驗,結果列於下表。 考試結果透過失敗總和計算機教學 94 31 125 傳統教學 113 62 175 和傳統教學方式相比,計算機教學方式提高了測驗的透過率嗎?給定8=0.05。 解答 T,表示來用計算機數學的測驗透過率,72表示來用傳統教學方式的測驗透過率。我們檢驗假設 Hn:r一12≤0 Ha:T1一T220 如果檢驗統計量≥大於z0.05=1.645,則拒絕H。。根據資料得估計的觀察值元-器=0.752 和 0.646 從而得檢驗統計世 A= (L一 2) = 0.752-0.646 9.7524129.72)、0.G46(_0.646) -2:00 -

10.3 兩總體比例之差 1一T2的推斷•529. 由於2=2.00大於1.645,因此,我們拒絕Ho,並得出結論:觀察支援備擇假設,即計算機教學比傳統教學具有更高的透過率。查標準正態分佈表,得觀察資料的p 值為: 值=P(2≥2.00)=0.0228。有效性差昇 1一r2的95%置信區間為 0.752- 0.646+1.96 0.752(1-0.752)+0.646(1-0.646) 即0.106 0.104 我們有95%的把握相信採用計算機教學學生的考試透過率比採用傳統教學學生的考試透過率高出0.2%到21%。為使我們的結論具有一定的合理性,我們需要驗證一下樣本容量是否足夠大。由子n11=94, 1(1 元i)=31, 272=113, 72(1-72)=62,這四個數都大」5。因此,大樣本準則滿足。 練習基本技能 10.24 一容量 1=1,000 的隨機樣本來自不,=0.4的二項分佈總體,另一與其獨立的隨機樣本取自 72=0.2的二項分佈總體。正態近似成立嗎?試描述六1一元2的抽樣分佈。 10.25 參看練習10.24。從每個總體中選取多大容量的樣本使得90%置信區間形如元1一f2 士0.012(提示:假定取自兩總體的樣本容量相同,解方程 2a/20元l -#2 =0.01得共同的樣本容量,根據練習10.24,利用元,=0.4,示2=0.2) 應用 10.26(民意調查學)一法律學生認為共和黨人中贊成附加稅激勵的比例高於民主黨人中贊成附加稅激勵的比例。該學生獲得獨立的兩隨機樣本,一個是 200名共和黨人,另一個是200名民主黨人,發現109名共和黨人和86名民主黨人贊成附加稅激勵。試根據這些資料檢驗 Ho: 1 2≤U H: 1 2>0。給出檢驗的顯著性水平。 10.27(商業)某計算機零售商試圖在兩種售活服務方式之間進行選擇。第一種方法強調預防性維護,第二種強調對問題的快速反應。該李售商選取一些顧客作為樣本,其中對••部分顧客用第一種方法,對另-部分顧客用第二種方法。八個月之後,發現用第一種方法服務的200名顧客中有171名對服務滿意,用第二種方法服務的200 名顧客中有153名對服務滿意。基寸1,0資料,用軟體 Execustat 得到的輸出結果如下。

•530• 第十章型別資料 THO SATPLI AMALYSIS FOR SATISPI ED BY HETHOD 1 Sample size Mean Variance 200 0.855 0.124598 200 0.765 0.180678 std. deviation 0.352984 0.425063 95 * confidence intervals 10u1 -m32:(0.0131926, 0.166807)assuning egual variances m0u1-m32:(0.0131847,0.165015) not assuning eqal var lances HTXEOTHESIS TEST-DIFEERENCE OF HMANS Nul1 hypothesis:difference of means = 0 Alternative:not equal Equal variances assumed:no Computed t statistic = 2.30362 F value = 0.021日 2 ditf. = 0.09 ratio - 0.689612 給定=0.05,試檢驗研究假設,即總體比例不相等。仔細給出你的結論。 10.28 求練習10.27中兩總體比例差的置信區間。證明根據該置信區間所得的結論與正式地檢驗研究假設所得的結論相同。 10.29(商業)某廣告社的媒體選擇經理在兩種雜誌上為一委託銀行採用同樣的方式各插入一則廣告。一個月以後進行市場調研,發現 473名第一種雜誌的讀者中有226名知道廣告中提及的銀行業務,而439名第一種雜誌的讀者屮有 165名(剔除同是兩種雜誌的讀者)。下面的 Minitab 輸出結果是建立在1,0資料基礎上的。 MTB > THOT AWARE?'MAGAZIH Two Sample T-rest and Confidence Interval Tosample T for Aware? Magazine 羽 1 473 Mean 0.478 stDer 0.500 SE Mean 0.023 .

10.3 兩總體比例之差x1一T2的推斷•531• 2 439 0.376 0.485 95% C. I. for mu 1 - mu 2:(0.038,0.166) T-Test mu 1= mu 2(us not =):T=3.13P= 0.0018 DE = 908 0.023 a.透過手工計算,求兩批讀者中知道銀行業務的讀者所佔比例之差的95%置信區間。並將該區間和 Minitab 輸出的區間進行比較。 b. 樣本容量是否足夠大,以至於可以使用正態近似? c.給定a=0.05,晉信區間是否顯示兩種比例在統計上具有顯著差異? 10.30 利用練習10.29的輸出結果,給定a=0.05,試正式地檢驗零假設, 即總體比例相同。 10.31 為了檢驗可靠性,我們對兩批各30部點陣式印表機的電動機進行嚴格的測試,他們分別來白於不同的供應商。供應商1 的電動機中有22 部透過測試,供應商2的電動機中只有16 部透過測試。 a.證明在a=0.05的水平下,透過率差異在統計上並不顯著(雙側)。 b.我們可否聲稱我們已經證明了兩供應商提供的電動機具有相同的可靠性? 10.32 利用練習10.31 中的資料計算比例差的95%置信區間。根據兩供應商的相對可靠性,仔細解釋所得結果。 10.33(生物學)為了比較兩種老鼠身上腫瘤的發生率,從每種老鼠中各隨機抽取100只(50只公的,50只母的),進行為期1年的觀察。所有的老鼠幾乎年齡相同,並且在同等條件下飼養。利用1年期的樣本資料,構造兩種老鼠中顯現腫瘤可能性的老鼠所佔比例之差的95%置信區間。 拼本容景表現其有潛在腫瘤的數月種類A 100 25 種類B 100 15 10.34(醫學) 有一種治療男性斑秀的藥物—至少那是數百萬男性的希望, 因為 FDA 批准了Upichn 公司的ninoxidi 可以用心治療這種病。在27個大的研究中心對 minuxidil進行妍究,這些中心的病人被隨機分配,要麼得到 minoxidil 藥物,要麼得到一片外表相同的安慰劑。不考慮中心之間的差別,假定初步結果如下: minoxidil 安慰劑懌術容量 310 309 生出新發的人的百分比 32 20

•532• 第十章型別資料 #。利用這些資料檢驗 Ho:T1-*2=0 H。:元1-72¥0,並給出檢驗的 -值。 B.如果你正在為 FDA工作,那麼,在這一研究中,你另外還需要調查什麼信息? 10.35(生物學) 可卡因比海洛因更致命嗎?Joarnul of the American Medical Assoriation 雜誌報道的一項研究發現任意服用可卡因的老鼠比任意服用海將因的老鼠身體更差,行為更素亂,死亡率更高。研究中30天以後的死亡率如下: 可卡因組海洛困組 30天內死亡的百分比 90 36 a.假定每組100只老鼠。試檢驗 Ho:T1一*2≤0 Ha:T1一72>0,並給出檢驗的p值。 b.對使用這兩種藥的人來說,上述結果意味著什麼? 10.4 多比例的推斷:卡方擬合優度檢驗我們可以將第四章二項抽樣方案推廣到每次試驗有k(k>2)個可能結果的情形。例如,根據政黨(共和黨,民主黨,社會黨,綠黨,獨立黨等)將登記的選民進行分類,或者根據病人身休條件的改善程度(重大改善,改善,沒有變化,更壞)對臨床試驗的病人進行評價。這種型別的試驗或研究被稱之為多項試驗。下面列出其特徵。 多項試驗 1.共做n次相同的試驗。 2. 每次試驗有個可能結果,且只有一個發生。 3. 單個試驗將導致第i個結果發生的機率為開,i=1,2,“,,且對於不同的試驗,不:保持不變。{注:2不;=1)。 4.試驗是獨立的。 S.我們所感興趣的是 7:即導致第;個結果發生的試驗次數。(注:乙n= 㓁。 7次試驗中觀測到每一試驗結果的觀測次數的機率分佈稱為多項分佈,給出奶下。

10.4 多比例的推斷:卡方擬合優度檢驗•533• P(nu, 12,,nk)= 在第四章中,我們討論了二項機率分佈,且知道 n! = n(n-1):1,0!=1 我們能夠用多項分佈計算具體事件的機率。 例 10.7 以前對某群牛進行的繁殖試驗表明一次交配能夠產下一頭健康的小牛的機率為0.83。同樣地,能夠產下0頭或2頭健康小牛的機率分別為0.15 和0.02。一農場主飼養了3頭這種母牛;求恰好得到3頭健康小牛的機率。 解答假定3頭母牛是隨機選擇的,則可以看作是n=3,k=3的多項式試驗。其可能的結果和相應的機率列於下表。 結果編號 2 3 小牛數 0 1 2 機率x; 0.15 0.83 0.02 易見,結果1,2,3分別表示一頭母牛產下0,1,2頭健康小牛的事件。同樣地,」 312、73分別表示產下0,1,2頭健康小牛的母牛數量。為了恰好得到3頭小牛,我們必須能夠觀測到下列可能的事件之一。 • 1頭母牛沒有產下健康的小牛:31=1 A: 1頭母牛產下1頭健康的小牛:72=1 (1頭母牛產下2 頭健康的小牛:73 - 1 71=0 B:3頭母牛各產下1頭小牛: 1n2=3 1N3= 0 由於 n =3,k=3,於是對於A事件 Pln= 1,n2 = 1,13 =1)= 1111T7(0.15)(0.83)¥(0.02)1 0.015 同樣地,對於B件 P(n1 -0.72- 3, 3=0-63107(0.15)9(0.83)(0.02)0 •

• $34• 第十章型別資料 = (0.83) ≥0.572 因此,3頭母牛共恰好產下3頭小牛的機率就是A件與B 事件機率之和;即 0.015+0.572~0.59 在多項分佈中,我們的主要興趣還是關於機率 T1,72,,7k 的統計檢驗所依賴的機率模型。我們將假定這些等於某些給定的值,然後,考察樣本資料是否支援這些假定的值。檢驗這一假設的其中一種方法是考察觀測到的導致每一試驗結果的試驗次數,並將其和期望得到的次數進行比較。例如,在我們前面的例子中,我們給出了對應於0,1,2頭小牛的機率分別為0.15,0.83,0.02。如果我們考察由100頭交配過的母牛組成的隨機樣本,那麼,我們期望將觀察到15頭母牛沒有產下健康小牛。同樣地,我們也期望將觀察到83頭母牛各產下1 頭健康小牛,2 頭母牛各產下2頭健康小牛。 定義10.1 在每一次試驗有k個可能結果的多項試驗中,n次試驗中第;個結果的期望數是n7;,其中T:是單個試驗中第;個結果出現的機率。 1900年,Karl Pearson 提出「下面的檢驗統計基,用以檢驗某些給定的機率: ×’= 「(ni~E;)2 Ei 其中n:表示具體試驗中第;個結果出現的次數,E,表示當假設的機率就是每一結果在每次試驗中出現的機率時,理論上所期望的第;個結果出現的次數。通常我們稱機率 T1,T2,”,不為單元機率(cell probability),一個單元對應於個結果中的一個結果。稱對應於k個結果的觀察數 n1,12,⋯,Hk 為觀察單元數 (observed cell counts),稱E1,E2,,Fx為期望單元數(expeeted cell counts)。 假設單元機率為介1,T2,⋯,T。根據定義10.1,我們就能計算期望的單元數,從而考察實際觀測到的資料和期望的觀測資料是杏擬合得很好。當然,如果那些假設的 x值是止確的,那麼,觀察單元數n:不應該偏離期望單元數E:很多,從 iix’的計算值應較小。類似地,當一個或多個假設的單元機率不正確時,觀察單元數和期望單元數將有很大差別,從而使得x’值變大。 如果期望單元數 E,充分大,那麼x2近似服從卡方分佈。 基十個已知單元機率的卡方擬合優度檢驗具有—1個自由度。本節最後, 我們將解釋為什麼有k-1個自由度。查附表7可得到檢驗統計甘x’= 二「]的上分位數。圖101為一4的卡方分佈。 我們將概括反個已知單元機率的卡方擬合優度檢驗如下。 卡方擬合優度檢驗岑假設:不:二不0。 =1,2,,k,其中ro 為已知機率或比例。

10.4 多比例的推斷:卡方擬合優度檢驗•535, J(X) 一X 圖10.1 df=4的卡方分佈備擇假設:至少有一個單元機率不等於假設的機率值。 檢控統計*: -二[(2 見2門、其中為類:的斑察數、五、二MEw是 H。成立條件下期望的觀察數。 拒絕域:如果x 超過對應十a=Q,d= 1的愉界值。那麼,拒絕 H00 檢驗假定並作出結論。 當樣本容量1變大時,卡方擬合優度檢驗統計量的分佈將越來越接近了卡方分佈。其近似程度將依賴於樣本容量,和單元數k。Cochran(1954)指出,如果沒有E;小於1,且只有20%的E,小於,那麼近似度應該是足夠的。隨者增大, 假定卡方擬合優度檢驗統計量充分近似服從於卡方分佈,那麼n/ 趨向於減小。 Agresti(1990)討論了這樣一種情形,即使期望單元數大小適中,但觀察單元數較小時,卡方近似效果也是比較差的。Agresti 認為,關如何確定合適的樣本容量,我們不可能制定一個單一的規則使之適用於一切情況。然而,我們椎薦使用 Cochran 的方法來考察卡方擬合優度檢驗統計量是否充分近似於卡方分佈。當某些E;太小時,還有其他好幾種方法可供選擇。可以合併型別變數的水平,從而增加觀察單元數。然而,除非可以自然地重新定義型別變數,且型別變數不改變被檢驗假設的自然屬性,否則,就不應該合併。當不可能獲得充分大的觀察單元數以滿足卡方近似時,Agresti(1990)討論了檢驗假設的精確方法。 例 10.8 某實驗室將一種試驗藥品和一種有助子高血壓病人穩定血壓的標準藥品進行比較。為此,在很多地點作了很多次臨床試驗,他們讓可比較的高血壓(根據紐約: • 536• 第十章型別資料心臟協會(NYHA)分類標準)病人服用該標準藥品。實驗室將這些病人對治療的反應分成四類。表10.1列出了各個類以及每-類中服用標準藥品病人所佔的比例。 表10.1 使用標準藥品的臨床結果類別血壓明顯下降血壓中等程度下降血壓略徽下降平穩或略微升高百分比 50 25 10 15 實驗室隨機抽取 200 位高血壓病人進行臨床試驗。正如對標準藥品進行研究一樣,根據 NYHA 分類標準,將所有病人進行同樣的分類。利用表10.2 檢驗假設:與試驗藥品相關的單元機率等於與標準藥品相關的單元機率,給定a =0.05。 表10.2 樣本資料類別 I 2 3 4 觀察單元數 120 60 10 10 解答該試驗具有多項試驗的特徵, =200,k=4。 結果 1:服用過試驗藥品後,病人的血壓明顯下降。 結果2:服用過試驗藥品後,病人的血壓中等程度下降。 結果 3:服用過試驗藥品後,病人的血樂略微下降。 結果 4:服用過試驗藥品後,病人的血壓維持不變或略微上升。 零假設和備擇假設為: Ho:T1=0.50, 2=0.25,T3 =0.10.*4=0.15 Ha:至少有一個單元機率不等於其假設的值。 在計算檢驗統計量之前,我們必須求期望單元數。將這些資料列十表10.3。

10.4 多比例的推斷:卡方擬合優度檢驗 • 537• 類別 1 2 3 4 表10.3 觀察單元數和期望單元數觀察單元數n; 120 60 10 10 期望單元數E: 200(0.50)-100 200(0.25)= 50 200(0.10)=20 200(0.15) =30 由於所有的期望單元數相對較大,因此,我們可以計算卡方統計,並將其和卡方分佈的臨界值進行比較。 X= (ni-E) E: = 120:100)2 + 160 - 50)2 +510-20)2+510-3022 =4+2+5+13.33= 24.33 • 設定第一類錯誤機率 a=0.05,對於a=0.05,df= -1=3,我們查卡方分佈的分位數。由附表7得臨界值為7.815。 R.R.:若 x>7.815,則拒絕 0。 結論:由於x的計算值大於7.815,因此我們拒絕零假設,從而得出結論,即至少有一個單元機率不等於 H。假設下的單元機率。實際上,就試驗藥品來說,有更高比例的病人落入血壓中等程度下降和明顯下降兩類中。該檢驗的p值為p< 0.001(見附表7)。 卡方擬合優度檢驗的前提條件和多項試驗的一樣,關鍵是試驗的獨立性和單元機率的不變性。如果,例如樣本中幾個病人來自同一家庭,那麼,就違反了試驗的獨立性,這是因為高血壓病的遺傳性很強。如果在研究期間,醫療標準發生了變化,採用其他醫療“標準”,那麼,單元機率將不能保持不變。 卡方擬合優度檢驗的檢驗統計量是項之和,這就是為什麼自由度依賴於類的個數免,而不是總的樣本容量n。然而,自由度為 —1,而不是k,這是因為 n;一E;之和一定等於n-n=0;k-1觀察單元數與期望單元數之差是自由變化的,但是最後一個,即第個由條件n;一E:之和等下0所決定。 多年來,擬合優度檢驗被/'泛地應用於檢驗各種科學理論。然而,和前面的統計檢驗不同,這裡,我們感興趣的是零假設,而不是研究(備擇)假設。不幸的是,前面的統計檢驗背後的邏輯在這裡並不成立。在前面所討論的統計檢驗的通常情況下,研究(備擇)假設是科學家所感興趣的;我們建立一個適當的零假設,收集資料, 透過拒絕H。而支援 H。,也就是說,透過否定 H。而“證明”王。是正確的。

• 538• 第十章型別資料對十卡方擬合優度檢驗,我們並不能作同樣的處理。如果某位科學家有一套理論,他希望樣本資料符合他的理論,那麼,他需要接受Hn。根據我們前面的研究,若接受Ho,則我們可能要犯第二類錯誤。這裡,和其他檢驗一樣,很難計算概率B。一般來說,對丁擬合優度檢驗,如果?較小,或者類的個數k較大,那麼,犯第二類錯誤的可能性就很高。即使期望單元數E,與我們推薦的值相一致,犯第二類錯誤的機率也可能很大。因此,對於卡方擬合優度檢驗的結果要審慎看待。即使H。沒有被拒絕,也不要盲目地去接受零假設,認為它就是事實。 練習基本技能 10.36 列出多項試驗的持徵。 10.37 二項試驗與多項試驗之間有什麼聯絡? 10.38 對於多項試驗,在什麼條件下適合使用卡方擬合優度檢驗?如果樣本資料並不拒絕零假設,你需要做出僕麼樣的處理? 10.39 使用卡方擬合優度檢驗時,需要對樣本容量施加僕麼樣的限制條件? 應用 10.40 下表列出的是虛構的資料。利用這些資料作卡方擬合優度檢驗,等資料與假設的機率一致嗎? 類別 1 2 3 4 5 總和觀察單元數n; 60 50 130 40 20 300 10.41 同樣給定 &=0.05,利用練習10.40 的資料作卡方擬合優度檢驗,新的零假設為:Ho:=0.15, 2=0.20,不g=0.45,r4=0.15,rs=0.05。將你的結果科練習10.40 的結果進行比較。該檢驗對 Ho假設下單元機率的敏感性如何? 如果你不能拒絕 Ho。那麼,你能得出什麼結論?

10.4 多比例的推斷:卡方擬合優度檢驗•539• 10.42(商業)過去5年,某保險公司承接的保險單中40%為終身人壽保險, 20%為普通人壽保險,25%為年度更新(ART》保險,15%為其他型別的保險。要改變保險單的這種結構,需要經過長期的努力,在佣金(commission)結構,儲備金 (reserve)和甚至可能需要在投資方面作出調整。從最近幾個月所承接的保單中隨機抽取1,000份保單,由樣本資料算得結果如下。根據這些資料評價現在的比例和歷史的比例是否發生了變化。試給出檢驗的p值。如果有的話,哪一種保險更受歡迎? 類別悠身普通 ART 其他總和觀察單元數灶i 320 280 240 160 1,000 10.43(社會)某大學和幾家企業在其周邊社群開展-項工作—學習計劃。 要求學生在3個月的見習期間和企業的社會工作一起工作。來自該大學的同樣多的學生分別被安排在化工廠,紛織廠和製藥廠。根據他們見習的企業將完成計劃的學生進行分類。下面的資料可以被認為是很多能夠完成計劃學生的一個隨機樣本。試檢驗零假設:在化工廠,紡織廠和製藥廠見習並完成計劃的學生各佔1/3。 給定a=0.05,n;表示第i組完成計劃的學生人數。 組製藥廠化工廠紡織廠觀察單元數 n! 20 13 30 10.44(社會)研究人員進行了一項試驗以考察居住在一個縣各社會階層人員中精神病人的比例是否與該縣社會階層人員的分佈相一致。將400位病人分類得觀察單元數如下。 下層:215 中下層:100 中上層:60 上層:25 是假設的該縣相應的社會階層人員所佔的比例。給定a =0.05,試給出結論。

• 540• 第十章型別資料 10.45(民意調查學)在上一屆總統選舉時,某地區登記的選民中有50%為共和黨,40%為民王黨,10%為獨立派人士。本次選舉之前,隨機抽取 200 名登記的選民,結果90名為共和黨,80名為民主黨,30名為獨立派人士。檢驗研究假設, 即登記的選民分佈不同於上一屆選舉。給出檢驗的p值並做出結論。 10.461醫學)一地方醫生覺得普通感冒的發生具有一定的季節趨勢。他估計每年40%病例發生在冬天,40%在春天,10%在夏天,10%在秋天。該醫生從去年普通感冒病例中隨機抽取1,000例收集資訊,基於樣本資料提供的資訊,你同意陝生的估計嗎?給定 a=0.05 作統計檢驗並得出結論。 季節冬天春天復天秋天頻數 374 292 169 165 10.47 參看練習10.46。如果醫生聲稱各個季節感冒發生率沒有差別,那麼發假設是什麼?檢驗假設:普通感冒發生率沒有季節趨勢。給出檢驗的顯著性水平。你對你的結論還有什麼保留嗎? 10.48(醫學〕以前,關於減輕抑鬱症藥品的試驗都是針對沒有抑鬱症跡象的正常成年人進行的。我們假定透過對正常人的研究得到一個大型的資料庫,且為了實用,資料庫能夠提供正常人中對藥品有不同反應的人數。參加試驗的每一位成伴人都要求對藥品的療效作出評價,是無效,中等有效還是有效。這些類中,被調查者的比例分別為60%,30%和10%。在一項新的針對抑鬱症人進行的研究中,隨機拙取85位患有抑鬱症的成年人,結果如下: 元效:30 中等有效:35 有效:20 是否有充分證據表明對約品有不同反應的患抑鬱症成年人的比例不同於無抑鬱症的成年人的比例。給出檢驗的顯著性水平並微出結論。 10.49(民意調查學) 在一項隨機調查中,調查者要求40位報紙編輯就最近法院判決將來可能給新聞自由帶來壓制談談他們的看法。將編輯的觀點總結如下。利用這些資料檢驗零假設,即各個類的比例相同。給定a=0.05,根據這些數據做出結論。如果有的話,你對你的結論還有什麼保留嗎?

10.5 Foisson(泊松)分佈 •S41• 樂製程度沒有很少中等嚴重頻數 8 8 1 14 10.50(商業)某研究人員獲得了由125位證券分析師組成的樣本,他要求每位分析師從紐約股票交易所選取4只股票,並且期望這4 只股票比標準和普爾指數(Poor's Index)在3個月期限內表現得更好。一種理論指出證券分析師的判斷並不比隨機抓閹更好,4只股票中猜測正確的股票數服從多項分佈,具體如下: 正確數多項機率x 0.0625 ] 0.2500 2 0.3750 3 0.2500 4 0.0625 如果125位讓券分析師所作的正確猜測結果如下,那麼,用這些資料作卡方擬合優度檢驗。給定a=0.05,試作出結論。 正確數頻數 3 1 23 2 S1 3 39 4 9 10.5 Poisson(泊松)分佈 . 任第四章(以及在本章),我們指出,假如7≥5/min(#,1-),則止態分佈為二項分佈提供了很好的近似。為了確保二項分佈基本上對稱,這一條件必要的。 然而,很多情況下,二項機率分佈嚴重偏態,以至於不適合使用止態近似。例如,在臨床試驗中,觀察服用新藥品的病人,有某種副作用反應的病人可能當少。如果 r(觀察到的具有副作用的人所佔的比例)是0.001,那麼,min(,1)=0.001。 對於這樣的例子,為了用正態分佈來近似二項分佈,樣本容量必須等於或大於 5/0.001 5,000。 1837年,S.D.Poisson(泊松)給出了一種離散型機率分佈,因此,稱之為 Poisson 分佈。當不較小,n很大,但nx 小於5時,該分佈為二項分佈提供了很好的近似。在1 次試驗中,觀察到 y次成功的機率由下式給出

•542• 第十章型別資料 P(y)=Ae” y! 其中e是常數,近似等於2.71828,p是y的均值。附表15列出了對應於各個從的 Poisson機率。為了用 Poisson分佈近似二項分佈,我們取x=幾。 例 10.9 參看本節開始所提到的臨床試驗,其中對1,000位病人使用新藥品進行治療。 當 =0.001 時,計算1,000位病人中沒有人具有某種副作用反應(比如嘔吐)的機率。 解答二項分佈的樣本均值為 =n8=1,000(0.001)=1,將 =1代入 Foisson 機率分佈得 (1)'e-1 P(y =0)= =e'1 =2.71828 = 0.367879 (附表15中對應 =0, 1的機率值是0.3679) 例10.10 假定在對1,000位病人進行新藥品的臨床試驗以後,沒有病人嘔吐。是否有理由推斷所有服過這種藥的病人中有嘔吐反應的病人比例不到 0.001? 解答當然不能這樣推斷。假定 =0.001(即,假定0.1%的人會嘔吐),則在n=1,000次試驗中,觀察到y=0的機率為0.368。由於這個機率相當大,因此,據此推斷x<0.001是不明智的。 雖然在一定條件下,Poisson 分佈為二項分佈提供了有用的近似,但 Poisson 分布的應用並不僅限於此。特別地,當下列假定設滿足時,可以利用 Poisson分佈求在某段時間,某個體積,某個空間等某隨機事件出現次的機率。 1.事件發生在時點上;兩個或多個事件不能同時發生。 2.一事件在某段時間裡發生與否與該事件在另一不重疊的時間裡發生與否是相互獨立的;也就是說,一事件在某段時間發生或不發生都不改變該事件在其後某段時間裡發生的機率。 很多情況下,當討論這個問題時,我們通常作如下第三個假設: 3.在任何一段時間裡,事件期望出現的次數都相同,只要時間長度相同,而不管時間的起點在哪兒。 雖然,這些假定好象有點嚴格,但是很多情況都滿足這些條件。例奶,在給定的時間段(如1分鐘)裡,來到櫃檯,停車場收費亭,檢查站,或汽車修理鋪的顧客數

10.5 Poisson(泊松)分佈 • 543 . 量都近似服從 Poisson 分佈。同樣地,在顯微鏡下可觀察到的單位體積的湖水裡某種藻類的塊數也近似地服從 Poisson 分佈。 當我們面臨一組觀測資料時,我們希望檢查資料是否服從 Poisson 分佈。為此,我們利用第10.4 節的擬合優度檢驗,檢驗統計量為 ×’= 有兩種型別的零假議。第一種假設就是:資料來自於 = 0 的 Poisson 分佈; 也就是說,我們希望檢驗 Ho:從=Ma(po已知)對備擇假設HA: M00n;表示單元;的觀測數,E:表示根據均值為po的 Poisson 分佈機率計算而得的期望觀測數。 將檢驗統計量的計算億與附表7中對應於a=a,df= —1的卡方值進行比較,其中為單元個數。 我們可能感興趣的第種零假設並不是一個特定的分佈。我們檢驗 Ho:觀察單元數都來自同一個均值為 (未知)Poisson 分佈。 備擇假設為:並非所有的單元數都米自同一個 Poisson 分佈。檢驗統計量為其中,對所有單元,E:表示根據 Poisson 分佈機率計算而得的期望觀測數,Poisson 分佈的均值由樣本資料估計而得。拒絕域由=,df=—2決定。注意兩種零假設的自由度之間的差別。在後者中,我們丟失了…個自由度,因為我們必須估計 Poisson 分佈引數p。 例 10.11 環境工程人員經常要利用某些資訊來檢測湖的至生情況,比如,湖中藻類種數以及每種藻類藻的塊數。那些僅產有少數幾種藻類但每種藻類的數量很多的湖泊被認為是營養貧乏的湖泊。在一次調查中,透過顯微鏡分析湖水樣本,觀測每個顯微面積中藻類的塊數。在顯微鏡觀測了150 個顯微面積,將樣本資料整理如下。 3:表示每塊面積中藻類的塊數,n:表示含有y:塊藻類的顯微面積數。 Yi ^; o 6 1 23 2 29 3 4 27 5 13 6 ≥≥7 13 給定 a=0.05,檢驗零假設:樣本資料來自於 Poisson 機率分佈。 解答在計算 x’值之前,首先,我們必須估計 Poisson 分佈引數!,然後,計算期望單元數。用樣本均值估計 Poisson 均值p。由這些資料得

• 544‘ 第十章型別資料 ——— 486 150 ~ 3.3 需裝注意的是,113個最人的數被壓縮成最後一個單元之前,利用所有樣本資料計分的樣本均做為3.3。這就是為什麼這裡將樣本均值近似為3.3。 當 - 3.3時,在附表15 得對應於 =0,1,,7或7以上的 Poisson 機率如 • 0 1 2 3 4 5 6 ≥7 3.3.Py:) 0.037 0.122 0.20L 0.221 0.182 0.12 0.066 0.051 利用E:=nP(y:)呵計算任一單元的期望單元數。因此,根據我們的資料(n =150)得期望單元數如下。 —- F; 5.55 1 18.30 2 30.15 3 33.15 4 27.30 5 18.00 6 9.90 ≥7 7.65 將這些資料代入檢驗統計量,得 x= (n;一E,)7 -163號9+(22 -9202+0-0082-608 對應了 =0.05,df= -2=6的卡方臨界值為12.59。因為卡方計算值並沒有超過12.59,所以,我們沒有充分的證據拒絕零假設:樣本資料來自於 Poisson 分佈。 下而就這種檢驗方法,我們給出一點提示。正如我們前面提到的,當我們使用卡方統計量時,所有的期望單元數應該相當大。特別地,我們要求E;>1且小於5 的E,不超過20%。任例10.11中,如果大丁等於7的y被各自看作一類時,那麼這些E將不滿足x?的應用條件。那就是為什麼我們將所有大於等於7的了歸為一類。 練習基本技能 10.51 查附表15,計算如下 Poisson 機率。 3.PCy=1),已知 =0.5, =1.0, =3.0。

10.5 Poisaon(泊松)分佈•545• b. P(y>1),已知 =1.7, =2.5, =4.20 cP(y<5), 知 =0.2、 =1.0, 2.0。 應用 10.52(工程)長期來看,高峰期小汽車以每分鐘6輛停在飛機場出口處。利用附表15,求下面的機率。(y表示高峰期任何一分鐘來到小汽車的數量) a.P(y=0)。 b.P(y>1)。 c.P(y20.3)。 10.$3(商業)某公司打算採用電話銷售方法作為傳統銷售方式的補充。據估計,每100個電話中只有一個能夠推銷成功。假定某一天打了250個電話: a.寫出不到6次推銷成功的機率表示式——不需計算。 b.在(a)中,你係了什麼假定? c.用正態近似計算P(6。 d. 用 Poisson 近似計算 Ply<6)。 e.(c)和(d)中,哪一個近似更好?為什麼? 10.54〔醫學) 某種出生的缺陷發生的機率為0.0001;即,10,000 個嬰兒中只有一個有這種缺陪。某一年某醫院出生了5,000個嬰兒,應該用什麼近似?全少一個要兒有這種缺陷的近似機率為多少? L0.ss(政府)一項政府調查研究的一部分就是要考察公共汽車專用車道的有效性,為此,需要調查在特定時間段,某十字路口發生阻塞(可能導致事故的駕駛情況)的次數。在開闢公共汽車專用車道,以前進行的研究表明上午7:00至9:00 之間的高峰期,平均每5分鐘發生阻塞的次數非常近似於=2的 Pcisson 分佈。 將40天的樣本資料緊理如下,其中3:表示阻塞的次數,n:表示有多少個5分鐘觀察到 yi。 0 90 1 230 2 240 3 130 4 68 s 30 ≥6 12 8。Poisson 假定成立嗎? b.利用這些資料檢驗研究假設,即每5分鐘阻塞的次數不等於2。(提示:用基於 Poisson 分佈的卡方檢驗) 10.56(工程)工人們記錄了90天中,每天尼龍紡紗工序由於斷線引起停工的次數。利用下面的樣本資料考察每天停工次數是否服從 Poisson 分佈,給定a =

• 546• 第十章型別資料 0.05。在資料中,3:表示每天停工次數,*;表示停工y:次的天數。 ⅜; #; 0 20 1 28 2 15 3 8 4 7 ≥5 12 10.57(生物)昆蟲學家要研究農業區昆蟲的分佈情況。他們將草原分成50 平方米的小塊,然後統計每塊草原上發光蟻丘(fire ant hiil)的數量,以便研究草原上發光蟻丘的分佈狀況。如果等假設“草原上發光蟻丘的分佈是 Poisson 分佈”成立,就說蟻丘數量在草原上是隨機分佈的。導致拒絕這一隨機性假設的有兩種情況。一種可能是蟻丘的分佈是均勻的,即每塊50平方米的草原上有同樣多的蟻丘,另一種可能是蟻丘的分佈是聚群《cluster)的。如果蟻丘數量是隨機分佈的,那麼方差等於均值,。2=p。如果蟻丘數量分佈比隨機分佈更均勻,那麼就說該分佈是分散不足的,。<p。如果分佈比隨機分佈聚群性更強,那麼稱分佈是過度分散的,。’>。記錄了草原上100塊50平方米的地塊。在資料中,3:表示每塊草原上發光蟻丘的數,7:表示有y:只發光蟻丘的草原塊數。 Wi 1 2 3 nj 2 6 8 10 4 5 12 15 6 13 7 12 10 9 6 12 15 20 3 2】 a.估計每50平方米草原上發光蟻丘的數量的均值和方差;即用第三章的公式,計算了和s’。 b.草原上發光蟻丘的分佈是隨機的嗎?給定a=0.05,利用 Poison 分佈的卡方檢驗擬合這些資料。 c.如果你拒絕了用卡方分佈作為發光蟻丘分佈模型,那麼草原上發光蟻丘的分佈是更聚群,還是更均勻? 10.6 列聯表:獨立性檢驗和齊性檢驗在第10.3節,我們介紹了比較兩個比例的檢驗。為此,只要簡單數一下每個樣本中某一結果出現了多少次。本節,我們將這種檢驗加以拓廣。首先,我們要建立一個檢驗統計量,檢驗樣本資料與理論比例的偏離是否僅是由於偶然而產生的。 我們在第四章第一次引入機率思想時,我們首先從頻數(次數)分佈表開始。 當時,我們處理這些次數時好象他們代表了整個總體。實際上,我們幾乎不可能知

10.6 列聯表;獨立性檢驗和齊性檢驗 •547• 道總體的全部資料;通常情況下,我們僅僅知道總體的一個樣本。當我們根據樣本進行計數時,通常將他們處理成交叉列表或列聯表的形式。本節,我們將介紹一種特殊的檢驗,即獨立性卡方檢驗,它被經常用來檢驗列聯表。 任第四章,我們引入了獨立性的概念。特別地,我們討論了變數之間的相依意味著一個變數對於另—個變數的預測比有價值的。通常樣本資料之間似乎也存在著相依。本節,我們介紹一種x’檢驗,據此可檢查樣本資料中所呈現的相依是否僅是一種意外,即是隨機變化的結果,而不是真正的相依。 首先,頻數資料被排成,行(列的交叉列表形式。一個變數可能的值決定表的行,另一變數可能的值決定表的列。我們用r;表示落在第;行,第;列的總體比例(或機率)。第i行總的比例為不,第;列總的比例為 j。如果行比例(概評價在4個不同辦公室的職焚之間實行3種不同的彈性上作制的受歡迎程度。下表列出的一組比例不y是示了獨立性。在第1個辦公室喜歡第2種方案的職員所佔比例為不12=0.03,所有喜歡第2種方案的職員比例為 2.=0.30,第1個辦公室職員所佔比例為7.1=0.10。丁是,該單元的獨立性成立,因為 21=0.03= (2.)(元.1)=(0.30)(0.10)。其他單元的獨立性也都成立。 辦公室喜歡的方案 2 3 4 總和 1 D.05 2 0.03 3 0.02 總和 0.10 0.20 1.12 0.08 0.40 0.15 0.09 0.06 0.30 0.10 0.06 0.04 0.20 0.50 0.30 0.20 x“檢驗的零假設為:兩種比例是獨文的。研究假設為:存在某種相依,也就是說,並不是在每個單元,等式開二不.不,,都成立。檢驗統計垃為對所有單求和, 共中,和式的每一項為 (觀察值-期望值)/期望值對於獨立性檢驗,在零假設成立的條件下,期望值E;計算不同」擬合優度檢驗。 獨立性的零假設並沒有給出行機率 x:和列機率 7.j的其體數值,所以必須根據相應行、列的頻率對其進行估計。如果n是第之行的實際頻數,那麼用六.=:-/ 來估計不;同樣地。用示=n/n 來估計 j。假定獨立性的零假設成立,那麼應

•548• 第十章型別資料定義10.2 在獨立性假設下,第;行,第;列期望值的估計為即行頻數乘以列頻數再除以總頻數d 例 10.12 假定在彈性T作制例子中,根據216 名職員的樣本資料得下面頻數: 辦公室汽歡的方案 ⋯⋯ 2 3 總和 15 8 1 24 2 32 29 20 81 3 23 25 66 4 5 18 22 45 試計約E,值的表。:對下第1行,第1列,期望值的估計為 E1-(組1社熱整編發1列類數)。(701242-7.78 對其他單元作同樣的計算,得下表。 總和 70 78 68 辦公室! 喜歡的方案 1 2 3 總和 7.78 8.67 7.56 24.01 2 26.25 29.25 25.50 81.00 3 21.39 23.83 20.78 66.00 4 14.58 16.25 14.17 45.00 總和 70.00 78.00 68.00 216.00 易見,E;表中行頻數和列頻數與觀察值(ni》表中相應的行頻數和列頻數相同 《除舍入誤差外)。 獨立性的x“檢驗 Ho:行變數與列變數相互獨立。

10.6 列聯表:獨立性檢驗和齊性檢驗•549• Ha:行變數與列變數是相依的(關聯的) T.S:x=2(n-E,P/E; 割取面積a;r=行數, =列數。 檢查假定,做出結論。 該檢驗統計垃有時也被稱之為 Pearson(皮爾遜)x統計。 獨立性x2檢驗的自由度與雙問表中固定邊際不變時自由的單元數有關。例如,在2×2表(2行,2列)中,只有1個單元項自由變化。一旦該項固定,我們就可透過從相應的行頻數和列頻數中減去該項來求出其餘各單元項。在表10.4(a), 我們任意標出了一些合計數,標有*的單元可以取任何值(不能超過相應的合計數),但所有剩下的單元都將有合計數確定。同樣地,對於2×3表(2行,3列),兩個單元項可任意變化,比如標有*的兩個單元。一旦這些項固定,我們就能透過從相應的行頻數和列頻數[見表10.4(b)]中減去該項來求出其餘各單元項。一般來說,對於,行c列的表,共有(-1)(c-1)個單元項是自由變化的。因此,這個數表示獨立性x’檢驗的自由度。 表10.4(a) 2×2表中有1個自由康 (b]2×3表中有2個自由度類B 類A * 總和 21 總利 16 34 S0 類A * 類B * 總和 29 (u) 總種 28 41 22 40 91 (b) 該獨立性x檢驗是建立在近似的基礎上。一個保守的準則是,使用這種近似時,每個E。必須不小於。一般在實踐中,如果某些E,太小,就將那些行(或列)合併,直到該準則滿足為止。 例 10.13 就例 10.8中的資料,完成獨立性x檢驗。首先用 &=0.05,然後給出p值的上界。 解答零假設和備擇假設為: Ho:彈性工作制的受歡迎程度與辦公地點相互獨立。

• 550. 第十章型別資料 H。:彈性工作制的受歡迎程度依賴於辦公地點。 利用例10.12中的x:和E;可計算檢驗統計量: T.S.: = (15- 7.78)2/7.78 + (32 -26.25)2/26.25 +…+(22-14.17)2/14.17 =6.70+1.26+ …+4.33 = 27.13 R.R.:對士 df=(3-1)(4-1)=6, 4=0.05,查附表7得臨界值為12.59。由 27.13 超過了12.59,因此拒絕Ho。實上,由於27.13大於附表7中對應於 =0.001的臨界值,因此, 值<0.001。 檢查假定,做出結論:既然每個期望值都超過5,因此 x’近似應該是好的。從而,我們有充分的證據表明:彈性上班制的受歡迎程度依賴了辦公地點。 另一個x 統計量被稱之為似然比統計量,它常出現在計算機輸出結果中。 定義為似然比x=乙n,;ln(n/(ni.n.j)) 其中n是第;行的總頻數,n,是第;列的總頻數,In 是自然對數(以e=2.71828 為底)。該似然比的值也應該和具有同樣自由度(r 1)(c-1)的x分佈相比較。 雖然,不太明顯,但這種形式的 x’獨立性檢驗與 Pearson 形式的檢驗基本相同。 有理由相信,就表中值而言,Pearson x”統計量比似然比統計量更近似於服從x 分佈,所以,我們寧願用它,而不用似然比形式。 獨立性x”檢驗的惟一功能就是檢查樣本資料中表面的相依是否可能純屬偶然,即為隨機變化的結果。拒絕岑假設僅表明並不能合理地將這種明顯的相依歸結為偶然。它並不表示任何關聯的強度或形式。 同樣的x’檢驗統計量可應用於另一種稍微不同的抽樣方法。我們圍繞著獨立性x’檢驗的討論實際上暗含著一個假定,即數操來自於整個總體的某單一隨機樣本。經常有這樣的情況,即各個樣本取自於列(行)變數定義的子總體。在彈性工作制例子(例10.12)中,資料可能來自丁四個不同樣本(容盤分別為24,81,66 和45)而不是來自於由216名職員組成的單一樣本,四個樣本分別取自於四個辦公室。 一般地,假定列的類別代表,個不同的子總體。容量為 81,72,•,”。的隨機樣本取自於這些子總體。然後將每個子總體的觀察值歸為r個類別,他們對應於一個型別變數的,個值,由列聯表中的,行表示。研究假設為不同的子總體在, 個類別上的機率分佈是不同的,其中,個類別對應於型別變數的,個水平。零假

10.6 列聯表:獨立性檢驗杯齊性檢驗 •551、 設為,對於所有•個子總體,不同子總體的一組r個比例(1j,T2g,,T)是相同的。因此,零假設被表示為該檢驗被稱為分佈的齊性(又譯同質性)檢驗。齊性檢驗和獨立性檢驗的機制是一致的。然而,需要注意的是,抽樣方法和結論不同。對丁獨立性檢驗,我們隨機地從單個總體中選取n個個體,根據兩個型別變數的取值將這些個體進行分類。然後,我們要檢驗這兩個型別變基是否相互關聯。在關十比例的齊性檢驗中,我們從:個子總體中隨機選取n=71+82+⋯+n,個個體,再根據單個型別變數的取俏將他們進行分類。我們要檢驗對十所有c個子總體,在型別變數的值上子總體的機率分佈是否相同。 正如我們在第10.4 節所討論的,x?的抽樣分佈對卡方分佈的近似程度依賴於樣本容堅n和單元數R。Cochran(1954)指出,如果沒有E;小於1,小於5的E: 不足20%,那麼該近似程度應是足夠的。Larntz(1978)和 Koehler(1986)證明,當樣本容較小時,x2比似然比檢驗統計量更有效。針對各種不同的樣本容量, Agresti(1990)比較了檢驗獨立性的兩種檢驗統計量的名義 a- 水平和實際a-水平。 當n/k超過1時,x檢驗統計基還算可以。我們再一次推薦使用 Cochran 準則考察卡方檢驗統計量是否充分近似於卡方分佈。當某些F;太小時,可以使用其他幾種方。調查人員將型別變數的水平進行合併以增加觀察單元數。然而,除非有自然方式重新定義類的水平而不改變被檢驗假設的自然性,否則,不能對類進行合並。當不可能獲得足夠大的觀察單元數以允許卡方近似時,Agresti(1990)討論了檢驗假設的精確方法。例如,當兩個型別變垃僅有兩個水平時,可以使用 Fisher 精確檢驗法。 例10.14 現有一隨機樣本,其中200人來自主要產油和天然氣的國家,200 人來自主要產煤國,400人來自其他國家。讓他們參加一項民意測驗,調查他們對5種可能的能源政策的態度。每個被調查者從下面選出他最贊同的政策: 1.工要強調節約。 2.主要強調開採國內的石油和天然氣。 3.1:要強調在太陽能方面進行投資。 4. 主要強調核能的開發和安全。 5. 主要是減少環境限制,強調使用煤炭。 結果如下:

• 552• 第十章型別資料贊同的政策 2 3 4 5 總和石油天然氣國家 50 88 56 4 2 200 產煤國 59 20 $2 3 66 200 其他 161 40 188;— 6 400 - 總租 270 148 296 12 74 800 其計算見Execustat 輸出結果。每個單元的第二項是該單元數佔所在列的百分比。 0i1Gas crosstabulation Coal Other 1 2 3 4 5 Column Total 50 59 161 25.0 29.5 40.3 88 20 40 44.0 10.0 10.0 56 52 188 28.0 26.0 47.0 4 3 5 2.0 1.5 1.3 2 66 6 1.0 33.0 1.5 200 200 400 25.00 ‘ 25.00 50.00 Sunmary Statistics for CrossLabulation Chi-square D.E. P Value 289.22 8 0.0000 Row Total 270 33.75 148 18.50 296 37.00 12 1.50 74 9.25 800 100.00 Narning:Some table cell counta < 5. 礦三類國家,試作分佈的x’齊性檢驗,並給出該檢驗的p值。 解答為了檢驗相應的總體分佈是不同的,利用下面的期望值表:

10.6 列聯表:獨立性檢驗和齊性檢驗 •553• 贊同的政策 1 2 3 4 5 石油天然氣國家 67.5 產煤國 67.5 3 18.5 74 3 18.5 其他 135 74 148 6 37 我們看到,期望值表中有兩個E;小於5。然而,因為只有2/15=13%的E,小於5, 且所有E。都大十1,所以,將卡方近似應用到檢驗統計量的準則是滿足的。檢驗步驟如下: Ho:列分佈是齊性的。 H:列分佈是非齊性的。 T.S.: X= 二(ny- Fip/E; = (50 - 67.5):/67.5+ (88- 37)2/37 +…+ (6-37)2/37 = 289.22 R.R.:因為,對應於 df=8, a =0.001 的x2臨界值 26.12,所以p-值 <0.001。 檢查假定並做出結論;即使認識到x’近似的精度有限,我們仍能以很小的p 值拒絕齊性假設。百分比分析表明,特別是給定某一政策,不同型別的國家所佔的百分比呈現出很大的差別:例如,生活在產油/氣的國家,贊同政策5的人只佔 1%,與其相比較,生活在產媒國的人贊同政策5的人佔 33%。 本節介紹的x’檢驗用途有限,但很重要。該檢驗僅僅被用來考察,從統計上資料是否顯示出各個類之間具有可察覺的(顯著的)關係。它並不能衡量這種顯著的關係究竟有多強。在一個大的資料集中,相關可能是可察覺的(顯著的),而在一個小的資料集中,強相關可能並不顯著。 練習 10.58(人力資源)某大型研究型公司的人部經理將學院和大學分成4類, 即最受歡迎的,比較好的,中等以及不受歡迎的,以在招募人學畢業生時參考。該經理收集了156 多最近畢業的學生,讓主管給每位畢業生評級。

•554• 第十章型別資料學校嚴受歡迎較好中華不受歡迎優秀 21 20 4 3 Exccustat 計算機軟體包輸出結果如下: 級別一般 25 36 14 8 差 2 10 7 6 Outstanding Average Crosstabulation Poor Most desirable Good Adequate Undesirabel Column Total 21 43.8 20 30.3 4 16.0 3 17.6 48 30.77 Chi-square 15.97 Warning: Sone table cell counts < 5. 25 2 52.1 4.2 36 10 54.5 15.2 14 7 56.0 28.0 d 6 47.1 35.3 83 25 53.21 16.03 Summary Statistics for Crosstabulation D.F. 6 P Value 0.0139 Row Total 48 30.77 56 42.31 25 16.03 17 10.90 156 100.00 2.計算 x統計量的值。 b.求俏。 c.經理能否安全地得出結論,認為學校型別和學生等級之間有關係? d.在使用x’近似時,還存在什麼問題嗎? 10.59 行百分比(輸出單元的第2項)反陝了我們在練習10.58中發現的相關性嗎? 10.60(人力資源)為了進行一項有關潛在年齡歧視的講究,需要考察一•大型公司中層經理人員的提升情況。資料如下:

|| 提升 - 未提升總和 30以下 9 41 50 30--39 29 41 70 Minitab 輸出結果如下: HTB> Table prcomoted''agegroup'; SUBC≥ Countss SUBC> ColPercentsi SUEC> ChiSauare. ROWS: promoted COLJNNS:agegroup 1 2 1 9 18.00 9 29 41.43 29 2 ALL 41 82.00 41 50 100.00 50 41 58.57 41 70 100.00 70 CHI-SOUARE. = CEIL CONTENTS13.025 COONT * OF COL COUNT a.求在獨立性假設下的期望數。 b.驗證所輸出的自由度是正確的。 10.6 列聯表:獨立性檢驗和齊性檢驗年齡 40~49 32 48 50 及以上 10 40 $0 • 555• 慈和 80 170 3 32 40.00 32 48 60.00 48 80 100.00 80 WITH D.E. =3 4 10 20.00 10 40 80.00 40 50 100.00 50 AL 80 32.00 80 170 68.00 170 250 100.00 250 •

• 556• 第十章型別資料 c.給定a =0.05,年齡和提升之間是否存在統計上的顯著關係? 14.61 10.62 給出練 10.60中p值的界限。 將練習 10.60 的資料合併如下: 提升未擬升總利直到 39 38 82 120 年齡 40及以上 42 88 130 總和 80 170 Minitab 輸出結果如下: MTE > Table pronotedcombined'; SUEC> SUEC> SUBC> RONS: Counls: ColPercents; ChiSquare. 1 promoted 1 38 33.67 38 COLUNS:combined 2 42 32.31 42 ALL B0 32.00 80 2 82 68.33 82 sa 67.69 88 170 68.00 170 ALL 120 100.00 120 CHI SQUARR = 130 100.00 130 0.012 250 100.00 250 NITH D.F.= 1 a.能夠用一個合理的c,拒絕獨立性假設嗎? b.合併年齡類別會產生什麼影響?將該答案和練習10.60的答案進行比較。

10.7 相關程度的度量•557• 10.7 相關程度的度量我們任第10.5 節討論的x“檢驗有一個內在的限制。透過設計,檢驗僅僅回答了這樣•個問題,即從統計上類別之間是否顯示出可察覺的(顯著的)關係。它並不能回答這種關係是強的,是有趣的,或是有意義的。這並不是說該檢驗有什麼不好;事實上,沒有哪個檢驗能夠回答這些問題。本節,我們討論如何度量交叉列表資料中所呈現的相關性的強度。 度量相關性強度最簡單(通常也是最好)的方法就是簡單的百分比分析。如果沒有關係(即,如果完全獨立),那麼,行或列百分比也不會呈現任何關係。例如,假定某直接郵寄公司要檢驗該公司兩種不同的報價,看看他們引起的響應率是否不同。結果如下: 報價 A B 總和是 40 80 120 啊應否 160 320 480 總和 200 400 600 為了檢查相關性,我們計算對每一種報價響應的百分比。我們看到,(40/200) =0.20(即20%)對A做出反應,(80/400)=0.20對B做出反應。因為百分比相同,所以沒有相關性的跡象。再,我們注意到,回答“贊同”的被調查者中有三分之一,回答“不贊同”的被調查者中也有三分之一被提供A報價。由幹這些分數完全相同,因此,沒有跡象表明存在統計相關。 當然,很少有資料絕對不顯示出樣本中的相關性。更普遍的是,行或列百分比不相同,呈現出某種程度的相關。例如,某公司計劃銷售一種清潔產品,為此,公司委託--家市場調研機構對當今的主要產品進行研究。他們所感興趣的變數是使用頻數和主要產品的評價等級。資料如下: 使用很少偶爾經常總和尚可 64 131 209 404 評價好 123 256 171 S$O 優秀 137 129 45 311 總和 324 516 425 1265

•558• 第十章型別資料 •種白然的分析方法就是利用表中的頻數,將評價等級看成是使用情況的函數。要進行分析,就必須要考慮給定使用因子時,等級因子的條件機率,但要知道資料僅僅是一個樣本,而不是總體本身。當使用因子為很少使用時,最好的估計就是有64/324=0.1975(或19.75%)比例的人將產品評為尚可,123/324=0.3796 評為好,137/324=0.4228 評為優秀。對於偶爾使用者,相應的比例為131/516= 0.2539,256/516 =0.4961和 129/516=0.2500。對於經常使用者,比例為 0.4918,0.4024 和0.1059。對於二種使用類別來講,比例(或百分比,即比例乘以 100)差別相當大,這表明評價等級和使用頻率是有關係的。再者,我們也可以計算在評價等級類別中使用類別的百分比。每種情形都顯示了某種關係。因為,隨著使用頻率的不同,等級的百分比也存在著相當大的差異(或隨著等級百分比的不同,使用頻率的比例也存在著相當大的差異),所以,這顯示出使用頻率和評價等級之間存在著相當強的關係。 分析資料中相關性的另一種方法就是考慮可預測性。資料中顯示出的相關性越強,則由其他變數值就越能預測某個變數的取值。我們問以設想一種情況,其中每位很少使用者將產品評價為優秀,每位不經常使用老將產品評價為好,每位經常使用者將產品評價為尚可。這種情況下存任著完全統計關係;從可預測性角度來說,給定使用頻率,就可以精確地預測出評價等級。當然,在實際中,關係和預測是不完全的。我們需要一個相關強度的度量,定義為可預測度。 我們需要區分因變數—試圖要預測的變數和自變數—一被用來作預測的變量。如果給定使用頻率時,要預測評價等級,那麼使用頻率就是自變數,評價等級就是因變數。沒有內在的因果關係;因變數和自變數的選擇全憑作資料分析人員的個人意願。 最簡單的預測方法就是預測因變數取其最常見值(眾數);該方法是入(lambda)可預測度的基礎。在使用-評價例子中,在很少使用的情況,最常見的評價是優秀,有137人響應;如果對每個很少使用的個人,我們均預測他的評價是優秀,那麼,我們就有187=64+123=324-137次預測錯誤。同樣地,對於偶爾使用的情況,預測評價均為好,則將產生260=131+129=516-256次預測錯誤;對經常使用而言,作評價均為尚可的預測將產生216=171+45=425-209次錯誤。錯誤總數是187+260+216=663次。相比較而言,如果不知道使用情況,那麼,我們預測因變數取其最常見值,即“好”,這樣我們將犯 715=404+311=1265-550次錯誤。 因此,有足夠理由認為,在預測評價結果方面,和不知道使用資訊相比,當知道使用資訊時,我們做得更好。 入的大小表明我們預測效果多麼好。當使用為自變數,評價為因變時,預測錯誤的差等於715-663=52;我們用這個差作為分子,用不知道自變數情況下所犯預測錯誤的次數,即715作為分母。如果使用是自變數,那麼

10.7 相關程度的度量•559• A=自變數未知時預測錯誤的次數一息變基馬知時預測錯誤的次數自變數未知時預測錯誤的次數 =715-663 = 0.073 715 入在0和1之間,A=1表示,至少在樣本中,給定自變數就可精確地預測因變其。如果資料中存在獨立性,或者總是預測因變數為同一個值,那麼1=0。在解釋入的其他值時,要注意入是一個錯誤比例的下降(PRE)。1=0.073意味著知道使用資訊比不知道使用資訊時預測評價所犯的錯誤要少7.3%。在實際資料中, 大於0.30的入很少見;因此,A=0.073表明評價和使用之同存在著一定的相關性。注意,入值的大小依賴於將哪個變數看作因變數。例如,根據評價來預測使用時,入=0.115。 定義10.3入的計算對於自變數的每個水平(每行或每列),求因變數的眾數(如果有兩個或多個具有相同頻數的眾數時,任選一個)。將所有非眾數單元相加,得K已知自變數值時預測錯誤的次數。 檢視因變數的邊際(總)頻數,將所有非眾數類別相加,得U=自變數值未知時預測錯誤的次數。 A=(U-K)/U 例 10.15 現對單位內部的辦事員,一般管理人員和基層經理進行調查,以瞭解他們對彈性上班制的看法。下面是 SAS輸出結果(注:在結果中,辦事員、一-般管理人員積基層經理分別標記為 clerical、 superv 和 junior manager,四種看法分別標記為 strongly oppase(強烈反對),oppose(反對),favor(贊成),strongly tavor(極力贊成)): TABLE OE OPINION BY LEVEL, OPINION FREQUENCY COL PCT LEVEL, Clerical strongly oppose + — 5 12.50 + .juniori superv | manager | --I+- ~---- 8! 9 | 26.67 | 45.00 | -一一十 II-I-- TOTAL

• 560• 第十章型別數掘 oppose Favor strongly favor TOTAI, STATISTIC CHI-SQUARE STAPISTIC 8 | 20.00 | 14 | 35.00 | 13! 32.50 | I + 40 STATISTICS FOR TABLE OE OPINION BY L.EVEL 10 | 33.33 | I|+ 7i 23.33 | ~--+ 5| 16.67 | ~---+ 30 DF 51 25.00 | 一~ 4 | 20.00 | 2i 10.00 | 6 20 VALJ -- 12.110 VALUE 0.120 0.123 23 25 20 PROB 0.060 ASE LAHBDA ASYMMETRIC CIR LAMBDA ASYHMETRIC RIC SAMPLE SIZE = 90 ASE IS THE ASYNPTOTIC STANDARD ERROR. RIC MEANS RON VARIABLE DEEENDENT ON COLAIMN VARIABL.E. 0.106 0.079 a,關下資料中呈現的相關性,x”檢驗表明了什麼? b.透過考察列百分比,你發現了什麼? c.將春法視為因變數,求入值,並解釋之。 d,證明入的計算是正確的。 解答 a.在輸出結果中,x 統計量表示為 CHI-SQUARE=12.110,自由度為6,P情我示為PROB=0Mn 你~=nn下我們不我忻你獨如從的後細洗你

10.7 相關程度的度量 • 561 差不多。另外,x檢驗的結果表明我們不能太相信這種表面的相關性;這種相關性或許純屬隨機變化所致。 c.此時行變數是因變數。結果中“RIC MEANS ROW VARIABI.E DEPENDENT OON COLUMN VARIABLE”表示我們需要的是“L.AMBDA ASYMMETRIC RIC”,即把行變數是因變數時的入值,其值為0.123。 d.預測的結果可以表示為是(CLERICAL,FAVOR),(SUPERV, OPPOSE), (JUNIOR MANAGER, STRONGLY OPPOSE),即列中最高頻數的單元。將其他所有單元的頻數相加,得K=5+8+13+8+7+5+5+4 +2=57。在OPINION的TOTAL.列中,我們發現最大頻數對應的觀點是 FAVOR。將其他類的頻數相加,得U=22+23+20=65。因此, A =05-27=0.123 百分比分析和入值起著和x“根本不同的作用。x’檢驗是瞭解有多少證據表明存在相關性,而不管相關程度的大小。百分比分析和入值是用手中的資料考察相關性究竟有多強。這兩種型別的分析互為補充。 最後我們就有關計數資料和相關性的一些問題進行討論。 1.x2擬合優度檢驗將次數和理論機率進行比較,其中理論機率不需要樣本資料就可直接計算。相反,x’獨立性檢驗將一個子集(比如,一行)的次數和其他行進行比較。究竟需要哪一種檢驗,一種方法就是要看是否存在一組樣本資料之外的理論機率。如果是這樣的話,當屬擬合優度檢驗。 2.正如任何顯著性檢驗,x檢驗的惟一目的就在於考察樣本資料的差異是否只是隨機因素所致。一個檢驗並不能直接告訴你這種差異有多大或有多重耍。 3.特別地,統計上可察覺的(顯著的)x獨應性檢驗並不一定意味著很強的關係,不顯著的擬合優度檢驗也並不一定意味著樣本比例非常接近於理論概率 4.在決定結果是否具有實際的重要性時,仔細地檢視一下百分比至關重要。 例 10.16 將總共9,035份被批准的抵押貸款按批准貸款的機構進行分類(銀行,銀行擁有抵押權的公司或獨立抵押公司),同時還根據借款人的收入水平進行分類。分析人員想知道批准貸款的機構和獲得貸款的借款人收入水平之間是否存在統計上的相關。資料見圖10.2。 根據圖10.2所示的Excel 輸出結果,我們能看到統計相關性的明顯跡象嗎? 如果能的活,這種相關性強嗎?

•562, 第十章型別資料 A 1 B Banks 2 c Fank Owned D Mortgage Company E Total 3 4 5 6 8 9 <$21,000 S21,00010 <$33,000 S 33.00010 <$42.000 $42,000 1o <$ 50.000 $ 50,000+ 943 2186 708 424 948 166 503 211 150 239 151 711 589 397 709 1260 3400 1508 971 1896 10 11 Total 5209 1269 2557 9035 A 1 2 3 4 SK $21,000 61$21,000 mor $.33,000 7 $ 33.00X0 16≤ $42,000 8 $42,000 to< $50,000 9 $50,000+ 10 11fjlital 12 13Chr sguane starisdic 14p-valm: I5 116 17 18<$21,000 19$21,000 0< $33,000 20 $ 33,000 to< $42,000 21,$42,000 to< $50,000 22 $59,000+ 123 24Toad Henks 圖 10.2 抵押資料的 Excel輸出結果 C D Benk Marigee F Total F G Oureil Campany H Earks I J K Bark Mentgage:Total Owred|Conpary 943 2186 708 424 948 156 503 211 150 239 151 71 S89 37 709 1250 3440 1508 971 1896 <$21,000 726.435 $21,000 t $33,000 1960.22 $33,0011 10 < $42,000 869.416 $42,000 6 < $50,000 559.816 $50,000+ 1093.11 176.972 477.$43 211.804 136.381 266.3 356.593 962.236 426.78 274.803 536.$88 1260 3400 1508 971 18%6 52m9 1269 2557 9035 $34.48 3E-110 Banks 78.84 64.29 46.95 43.67 $0.00 Eank Oned 13.17 14.79 13.99 15.45 12.61:Mortgae Company 11.98 20.91 39.06 40.59 37.39 Tetal 100 100 100 =00 100 57.65 14.05 28.3 100

10.8 機率和優比•563• 解答首先,我們注意到抵押貸款貸方的型別是定性變數。同時,抵押數量被分成5組,所以,我們也應將其處理為定件變數。 為了檢驗統計相關性的存在,我們利用Excel 輸出結果中的x’統計量。P值很小;由丁,“E-110"表示“小數點向左移動110位”,因此,P值為小數點後面跟 109 個0,之後再跟一個3。這就是說有更充分的證據顯示存在相關性。 P值小並不一定意味著強的相關性;它也可能是弱相關和大樣本的結果。耍評價相關性的強度,可檢視輸出左下角對應十每種貸款數量的百分比。有一•個明顯的模式,隨著貸款數址的增加,抵押公司持有貸款份數的百分比增加,銀行持有貸款份數的百分比下降。對於50,000美元收入水平而言,這種趨勢被顛倒,但總的來說,這種趨勢還保持得相當好。然而,百分比的變化不是很大,所以,我們並不能說相關性非常強。 相反,它僅僅是適度相關。 10.8 機率和優比分析關於定性變數的計數資料的另—-種方法就是利用機率(odds)。這種方法被廣泛地應用於生物醫學研究,也可能有助」分析市場調研方面的一些問題。幾率的基本定義為一事件發生的機率與該事件不發生的機率之比。 定義10.4 事件A的機率=-PLA) I- PIA] 如果一件發生的機率為號,那麼機率為號/號=2。通常將其農述為“水件發生的機率為2比1”。機率通常被用在賽馬和其他賭博專案中。賽馬機率被定義為賽馬不贏得比賽的機率。因此4比1的機率意味著賽馬失去比賽(不贏)可能性是嶡得比賽可能件的4倍。根據機率,比如說,和機率為20比1的賽馬相比,幾率為4比1的賽4是一匹更好的“賭馬”。兒率為1比2(等價地,0.5比1)的賽馬如何?這種馬非常受歡迎,因為臟得比賽可能性是賽馬失去比賽可能性的兩倍(2 比1): 任分析機率時,只要確定感興趣的事件是僕麼即可。同時,很容易將一事件的機率換算成該事件的機率。對了事件A而言事件A.的機率 P(A)=I十事件及的機率因此,如果一匹馬(不贏)的機率為9比1,那麼該匹馬不贏的機率為機率(不盛) 二=0.。

• 564• 第十章型別資料同樣地, 的機率是 0.1。 利用機率能夠方便地看出條件件的發生如何改變一事件的機率。回想一下,在第四章中,給定另一事件B,一-書件A發生的條件機率為 P(AI B) = P(A 和B》/P(B) 經過簡單的代數運算就可知道,給定另一事件B3,有利下事件A 發生的機率為 P(A I,B) 即初始機率乘以似然比,似然比就是A發生時條件事件的機率與A 不發生時條件件的機率之比。如果當 A發生時比當A 不發生時,B更有可能發生,那麼 B 的發生使得有利於A 的機率上升。 例10.17 考慮一人口總體,其中每1,000人中有1人攜帶HIV 病毒。現有一種檢測方法,攜帶病毒者被檢測出陽性的佔 95%,不攜帶病毒者被(錯誤地)檢測出陽性的佔2%。如果隨機選取一人,經檢測為陽性,那麼,攜帶 HIV病毒的機率是上升還是下降?上升或下降多少? 解答我們當然相信一個陽性檢驗結果會增加攜帶病毒的機率。如果一個陽性檢驗結果使得患病的機會減少,那麼這個檢驗一定是一個很奇怪的檢驗!記件 A 為“攜帶 HIV”,事件B 為“陰性檢驗結果”。 在檢驗之前,隨機抽取一個人,他攜帶 FIIV的機率為 0.001 0.999~0.001 陽性檢驗結果的發生使得機率改變為 P(HIV|陽性) P(HIV) P(阻性 |HIV) P(不攜帶 HIV|陽性)一P(不攜帶HIV)P(陽性| 不攜帶THIV) -9e8品說-0.ars 如果得到的是陽性檢驗結果,那麼攜帶 HIV 的兒率從大約 0.001(比1)上升到大約0.0475(比1)。 和機率密切相關,且被廣泛應用在生物醫學研究中的-個概念就優比(odds radio 機率比)。顧名思義,優比就是一個組(比奶,男人)中某事件(比如,染上某種癌)的機率與另一組(比如,女人)中同一事件的機率之比。優比通常用條件機率來定義,但同樣也可以用聯合機率來表述。

10.8 機率和優比 • 565• 定義10.5 對應於兩組,某事件的優比奶果A是任一事件,具有機率 P(Al組1)和 P(A|組2),則優比為 P(AL組1/|1-P(A|組12] P(AI組2)/[1- P(A|組2)i*PA和組1)/11二P(A和組1。 P(A 和組2)/[1- P(A 和組2)] 如果伴 A 在統計上獨立於組,那麼優比等於1。 例如,就兩種品牌的跑車而言,假定我們有下面關於購買某種懸掛裝置的頻數表: 品牌1 品牌2 •-i 總和是 250 400 650 否 750 1600 2350 總和 1,000 2.000 3,000 我們將估計給定品牌的條件下,購買或不購買該懸掛裝置的條件機率。這些機率為品牌1 品牌2 是 0.250 0.200 否 0.750 0.800 總利 1.000 1.000 優比(0.250/0.750)/(0.200/0.800)=1.333表明為品牌1轎車購買該裝置的機率較為品牌2轎車購買該裝置的機率高33.3%。購買懸掛裝置似乎並不獨立於品牌(雖然,我們不得不面對樣本資料有限這樣的事實)。同樣,我們也可按如下方式計算優比 (250/3,000)/(750/3, 000) 250/750 (400/3,000)/(1,600/3,000)400/1,600 T= 1.333 通常用優比的自然對數對優比進行推斷。前面曾提到過“in”通常表示自然對數(以 =2.71828為底),且In(1)=0。當根據次數資料來估計優比的自然對數時,它近似服從正態分佈,期望值為總體優比的自然對數。其標準差為將表中4個次數的1/次數相加,然後開平方根。對於購買懸掛裝置的資料,In(優比)= In(1.333)=0.2874;標準差估計值為 /1/250+1/750+ 1/400+ 1/1,600 = 0.0920 有了這些結果,我們就能計算95%置信區間為

• 566• 第十章型別資料 0.2874 1.96(0.0920)≤In(優比)≤0.2874+1.96(0.0920) 或 0.1071≤In(優比)≤0.4677 我們也可以用“反對數”——指數將優比覺信區間轉換為 01071 ≤優比≤e0.467 或 1.113≤優比≤1.596 因為區間並不包含優比1.000(或等價地,In(優比)區間不包含0.000),所以,我們可以得出結論:資料顯示了統計上可察覺的相關性。 優比是一種很有用的方法,用以比較兩總體比例天,和不2,當不」和加2較小時,優比方法比不1和72 的差不1一T2更有意義。例如,假定用複方1治療的 5,000例冠狀旁通管(coronary bypass)病人,其再梗率為元,=0.05,用複方2洽療的 5,000 例冠狀旁通管(coronary bypass)病人,其再梗率為示2 =0.02。這樣,和優比相比,它們的差六:一2 =0.03 就得不太重要,帶來的資訊也較少。見表 10.5。 ——— 複方1 複方2 是 250(5%) 100(2%) 再梗否 4,750 4,900 71=5,000 *2=5,200 複方1和複方2的再梗率兒率如下: 複方1機率=250/5,000。 4,750/5,000 = 250 = 0.053 4,750 複方2兒率-4,90075:000- 1.900 - 0.020 4,900 析應的優比為0.053/0.020=2.65。可見,雖然再梗率之差僅為0.03,但是經過複方1治獰以後再梗率機率是經過複方2治療以後再梗率機率的2.65倍。 10.9 小結本章,我們處理的是型別資料。在很多情況下,我們遇到的是單一變數的型別資料。首先,我們研究單個總體比例以及基於獨文樣本的兩總體比例差大一T2 的估i和檢驗方法。作為這些方法的推廣,為了比較總體的幾個比例(兩個以上) 時,我們引入了卡方擬合優度檢驗。 基於,Xc列聯表資料,我們利用卡方獨立性檢驗和卡方齊性檢驗研究兩變

10.9小結•567, 量的型別資料問題。我們用,度兩個型別變之間相關性的強度。 最後,我們討論了機率和優比,它們在涉及到二項比例的生物醫學試驗方面特別有用。 重要公式五(1-元), 2.形如開士E的100(1-a)% 信區間所需樣本容量 E2 (提示:如果沒有合適的估計,取 =0.5) 3. 的統計檢驗 T.S.:2= 元一T且 To(1-Ta) 其中女= 4.T1-T2的置信區間元1一2士24/20元,i 其中 0」 2 T.S.:~= 元(1一 +22(1- 2) 1一 2 S.n1-T2的統計檢驗其中 6. 多項分佈元(1-12+221- 22 P(n1,32,nk)=!n2! 其中 E;=nx:0 其中 Ew=(第五行頻數)第;列頻數) A=自變最未知時預測錯瀑的次數一點變甚只知時預測錯誤的次數自變數術知時預測錯誤的次數 LI.對於二項情形,兩總體優比總體1機率總體2機率 T2/(1-m2)

• 568‘