AI 新聞與投資
統計學方法與資料分析引論

第十六章 協方差分析

29 / 34

區組性別 1 2 3 4 5 6 F F F M M M 年齡 (年) ≤20 20-40 ≥40 <20 20-40 ≥40 A 48 43 44 42 37 41 治療前 B 36 31 35 38 34 36 c 31 28 29 29 28 26 A 21 22 18 26 21 18 治療後 B 25 21 24 20 24 24 C 17 19 18 17 15 19 16.10 參見16.9。 a.用計算機程式完成練習16.9(b)部分的模型擬合,取a=0.05。 b. 檢驗直線是否平行。 c.假設直線是平行的,檢驗根據協變數調整後的處理均值是否有差異,取。 =0.05。 16.11 參見16.9和 16.10。 a. 假設這些響應的線是平行的,檢驗根據協變數調整後的區組是否有差異, 取a=0.05。 b.你如何將區組平方和劃分為五個自由度為1的平方和? c•寫出一個模想並進行(b)中的檢驗,取 =0.05。 16.12(社會)要進行一項研究來確定社會經濟因素會否影響幼兒的語言表達能力。首先定義了四個社會經濟階層,並選了20個六歲以下的孩子參加試驗。 研究假設光這四個階層的平均表達能力是不同的。研究者認為,對幼兒來說,他們的表達能力能在幾個月內有顯著的提高。因此,他們決定記錄下來每個孩子的確切的年齡(到月)和語言表達能力(透過測驗來衡量)。資料如下。 社會經濟階層 1 年齡 (片) 40 37 30 語言表達水平 26.2 27.5 19.6 年齡 (月) 20 65 $1 2 . 語言表達水平 20.8 39.0 34.3 3 4 年齡 (月) 54 27 25 語言裘達水平 34.3 25.1 27.0 年齡 (月) 27 36 23 語言表達水平 33.1 37.1 47.3

16.5 小結•1079• 續表社會經濟階層 1 2 3 午齡 (月) 61 21 18 36 16 41 19 30 26 28 16 28 19 34 20 18 語言表達水業 43.2 32.4 23.5 15.6 18.5 23.6 21.0 11.9 10.2 29.8 20.6 13.5 17.2 29.3 25.6 25.6 18.4 年齡 (月) 56 16 29 20 20 17 35 25 21 27 25 28 33 16 22 23 語育表達水平 39.4 23.7 23.8 37.2 33.0 21.9 36.1 31.7 27.6 26.0 20.3 32.6 25.8 21.2 36.3 34.2 17.7 年齡 (月) 44 31 39 25 18 17 22 24 28 23 17 26 23 26 35 31 37 話言表達水平 29.1 33.3 38.4 14.9 38.7 32.7 34.0 23.8 13.3 32.4 36.2 33.7 29.2 33.2 28.5 31.4 36.2 4 年齡 (月) 31 48 48 16 32 31 24 20 26 24 33 21 25 37 36 19 34 語育表達水平 47.3 53.7 $9.6 36.0 41.2 44.2 48.9 $3.0 42.8 50.8 42.1 42.6 45.0 $9.8 37.9 38.9 45.0 a.畫出資料的散點圖。對每個組來說,表達能力和年齡呈線性關係嗎? .寫出表達能力與年齡是一次關係時的模型,其中各杜會經濟階層都有其對應的直線。 16.13 參見16.12。 n.根據下面的計算機輸出結果,檢驗這四個社會經濟階層中表達能力與年齡間的關係方是否是平行的直線。 b.這四組的平均語言表達能力分數有顯著差別嗎?檢驗此假設。取a=0.05 c•給出每組中調整後表達能力的平均分數的95%的置信區間。

• 1080• 第十六章協方差分析 HODEL I: DIFFERENT SLOPES AND TREAIHENT DIEFERENCES General Linear Hodels Procedure Dependent Variable:Y VSKILL, Sum of Source Model Error Corrected rotal Source X1 (AGE) X2(C1) X3(C2) X4(C3) X5(X1*X2) X6(X1 *X3) X7(X1 *X4) DE Squares? 6380.2373 72 3138.4195 Mean Square 911.4625 43.5892 79 9518.6569 DE Type III sS Mean Square 1 188.81711 188.81711 1 577.36595 577.36595 1 170.50366 170.50366 1 29.75438 29.75438 1 5.46901 5.46901 1 13.40413 13.40413 1 72.25787. 72.26787 MODEL II: SANE SLOPES BUT TRENTHENT DIFFERENCES General Linear Models Procedure Dependent Variable:Y VSKILL Sum of Source Hodel Error Corrected Total Squares 4 75 79 6222.B867 3295.7702 9518.6569 T for HO: Parameter Estinate Paraneter=0 INTERCEPT 37.03395378 14.59 X1(AGE) 0.28023845 4.02 X2(C1) -22.17859463 - 10.56 X3(C2) - 15.94679732 -7.60 X4(c3) -14.91889270 -7.12 MODEL III: SANE SLOPES AND HO TREATMENT DIEFERENCES Generai Linear Hodels Procedure Mumber of observations in data set = 80 General Linear Models Procedure Dependent Variable:Y VSKILL Mean Square 1555.7217 43.9436 F Value 20.91 Pr>F 0.0001 F Value 4.33 13.25 3.91 0.68 0.13 0.31 1.66 Pr>E 0.0410 0.0005 0.0518 0.4114 0.7242 0.5809 0.2020 F Value 35.40 Pr>ITl 0.0001 0.0001 0.0001 0.0001 0.0001 Pr>E 0.0001 Std Error of Estimate 2.53830797 0.06973064 2. 09962198 2.09711070 2.09650778

16.5 小結•1081• Source Hodel Error Corrected Total Source X1 Paraneter INTERCEET X1 Eatimate 22.61763850 0.32035109 Sum of DE Squares 1 930.68400 78 8587.97288 Mean Square 930.68400 110.10222 79 9518.65687 DE Type III SS Mean Square 1 930.68400 930.68400 T for HO: Fr≥1r Parameter =0 6.69 2.91 0.0001 0.0047 E Value 8.45 EI≥F 0.0047 E Value FI≥E 8.45 0.0047 std Error of Est.imate 3.38324077 0.11016516 16.14(商業)一個主食發售商想評價三種不同的促銷方式對微波比薩餅銷量的作用。公司的市場部確定了三種用於雜貨店的促銷方法。 促銷方法1 分發產品樣品給商店中的顧客,同時不在商店增設貨架。 促銷方法2 在商店中通常的位置增設貨架。 促銷方法3 除在通常位置設立貨架外,在過道盡頭設立專門的展示架用完全隨機化設計,為每種促銷方法隨機地分配五個商店。市場部希望盡址控制除促銷方法外的其他可能會影響產品銷量的因素。例如,這15個商店的價格以及對此商品的廣告宣傳都相同。促銷期間的產品銷量(y)被記錄下來。因為各商店可能會有不同的顧客種類,即顧客是否更傾向於購買該產品,所以每個商店在促銷前的該產品銷址(z)也被記錄下來。控制住這個因素是很關鍵的,因為可以想象在促銷前銷量最高的商店應該在促銷進行時銷量也很高。這將會遮蔽促銷方法作用之間的差異。資料如下。 1 促銷方法 2 3 47 48 45 54 42 31 36 32 38 29 $2 47 47 36 43 44 36 39 28 35 33 41 40 30 37 33 39 40 26 39 a.畫出資料的散點圖。對每種促銷方法,促銷時的銷址和促銷前的銷址是否是線性關係?

•1082• 第十六章協方差分析 b.寫出用促銷前的銷進行調整的、促銷時銷量和促銷方法間關係的模型。 c•用計算機程式作(L)中模型的擬合。 d.檢驗促銷時銷量和促銷前銷量間的方程是否是平行線。 e.三種促銷方法的平均銷量有顯著差異嗎?檢驗此假設,取 a=0.05。 f. 對二種促銷方法,給出各自促銷時的調整後平均銷址的95%的置信區間。

第十七章一些固定效應、隨機效應和混合效應模型的方差分析 17.1 引言和素例 17.2 具有隨機處理效應的單因於試驗:隨機效應模型 17.3 隨機致應模型的擴元 17.4 混含效應模型 17.5 計算期望均方的規則 17.6 套抽樣和裂區設計 17.7 小結 17.1 引言和案例在前面章節所遇到的試驗和研究中,都含有試驗因子和處理,研究中處理的水平是由研究人員選定的。從試驗資料所進行的推斷僅是針對這些水平而言的。第十六章的案例中包含三個新的草皮品種,並且這是研究者感興趣的僅有的草皮品種。 在這個試驗中,要研究的總體僅僅是這三個草皮品種所對應的球速的三個總體。 如果高爾夫聯合會決定,為了驗證在原始試驗中得到的平均速度,要重複進行試驗。這三種草皮可能會種植在另外一組草坪上並重復這個試驗。在各個因子均有一組事先選定的水平時,用於考察響應變數變異性的模型稱為圖定效應模型。 從這樣的模型所得到的推斷僅限於研究中所用到的那組特定的處理水平。 定義17.1 在一個試驗的固定效應模型中,試驗中的所有因子都有一組事先決定的水平,並且推斷僅對該試驗中實際用到的因子水平進行。 在某些研究中,主要的興趣在於識別作為響應變數變異來源的因子。在產品改進研究中,質量控制工程師要確定生產工序中的哪些因子是變異的主要來源,並估計這些變異來源中的每一個對於產品的總變異的貢獻。稱這些因子為方差分量。當試驗中採用的這些因子的水平是從所有可能的水平總體中隨機挑選出來的時候,聯絡響應變型和這些因子之間的模型就是隨機效應模型。而從這樣的模型所作出的推斷,也從這些隨機挑選出來的試驗中用到的因子水平推廣至因子水平的總體。在產品改進研究中,通常的變異來源之一是工序的操作。公司可能有上百名操作人員,而被隨機選中參加到研究中來的可能只有五、六人。然而,質量工

• 1084• 第士七章一些固定效應、隨機效應和混合效應模型的方差分析程師感興趣的是所有操作人員的表現,而不只是參加研究的那幾名。 定義17.2 在一個試驗的隨機效應模型中,試驗中採用的因子水平是從所有可能的水平總體中隨機選取的。從這樣的試驗資料所進行的推斷,不只是針對試驗中用到的那些因子水平,而是針對從中挑選這些水平的因子水平總體而言的。 在許多研究中,既包含帶有事先確定的一組水平的因子,又包含其水平是從一個水平總體中隨機挑選出來的因子。一個隨機化試驗中的區組,可能代表從某個農業研究機構的地塊的總體中抽取的一個容量為b的隨機樣本。此時,就認為區組的效應是隨機效應。假定處理是為抵抗某種病毒而開發出來的四個大豆新品種,這個處理的水平是固定的,因為研究人員只對這四個品種感興趣;而地塊的水平是隨機的,因為研究人員不只對這些地塊感興趣,而是瞭解一片寬廣的土地上這些處理的效應。當試驗中用到的一些因子具有從一個因子水平總體中隨機挑選出來的水平,而另一些因子具有事先確定的水平時,聯絡響應變數與因子水平之間關系的模型就是混合效應模型。 定義17.3 在一個試驗的混合效應模型中,試驗中採用的某些因子的水平是從所有可能的水平總體中隨機選取的,而另一些因子的水平是事先決定的。從這樣的試驗資料所進行的關於具有固定水平因子的推斷,僅是針對試驗中用到的那些水平的,而關於具有隨機挑選的水平的那些因子所進行的推斷,是針對從中挑選那些水平的因子水平總體中的所有水平而言的。 在這一章,我們考慮各種隨機效應和混合效應模型。對於每一個模型,我們將給出適當的方差分析方法,並說明如何估討各個方差分量。下面的案例描述了一個混合效應試驗。 案例;擴張接縫處壓降的分析發電站中的一個主要問題是渦輪機中擴張接縫處的壓降。設計工程師想要設計一項研究來確定哪些是最可能影響壓降讀數的因子。一旦這些因子被確定並根據張接處玉降的影響大小決定出那些最關鍵的因子,工程師就可以進行生產過程中的設計改進或改變生產過程中操作者的訓練方式。這些改變很可能花費昂費或者耗費時間,所以工程師需要確定哪些因子對於減少壓降效果最大。 資料收集的設計為設計一個適當的試驗來分析壓降,設計工程師考慮到以下一些方面: 1.哪些因子應該用於研究? 2. 對因子的哪些水平感興趣? 3.多少水平才足以識別主要的變異性來源? 4.為獲得可靠的方差分量的估計需要在每個因子—水平組合處作多少次重複? 5.在試驗期間哪些環境因素可能影響壓力計的準確性? 6.在分析擴張接縫處壓降的變異性的來源時有效的統計方法是什麼?

17.1 引音和案例 1085 7. 為了說明所有重要的變異性來源都已經被識別出來,在最終的報告中應包括哪些資訊? 本研究中選定的因子為接縫入口處的氣體溫度和操作者使用的壓力計種類。 工程師認為需要進行因子試驗來決定哪個因子對於壓降的效應最大。代表渦輪機操作時可能溫度範圍的三個溫度是15C,25C和35C。從數百種用於監測線上壓力的壓力計中,隨機選取了四種用於研究。為獲得12個因子水平組合中每個組合處壓降期望的精確估討值,決定在每個處理處進行6次重複。這72次試驗得到的資料由表17.1給出。 Gl 40 40 37 47 42 41 ¢2 43 34 38 42 39 35 ISC G3 42 35 35 41 43 36 G4 47 47 40 36 41 47 值41.1738.30 38.67 43.00 70 60衰17.1 擴張接維處的壓降 25C G1 57 57 65 67 63 59 G2 G3 49 44 43 45 51 49 49 45 45 46 43 43 G4 36 49 38 45 38 42 61.33 46.67 45.33 41.33 G1 35 35 35 46 41 42 G2 41 43 44 36 42 41 35t G3 42 41 34 35 39 36 G4 41 44 35 46 44 46 39.00 41.17 37.83 42.67 GI 50 - 壓 4o~ G4 30 15 20 25 溫度(CC) T= 30 圖 17.1 12個處理上平均壓降的側面圖 35

• 1086• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析圖17.1給出了12 個處理上樣本均值的側面圖。從圖中我們可以看到,壓力計 G1 對應的壓降比其他三種壓力計對應的變異性更大。為了判定這個觀測到的差異是否僅是由於隨機變化,我們將在本章接下來的部分中給出模型和分析的技巧,以便能確定到底哪些因子對壓降的總的變異貢獻最大。 17.2 具有隨機處理效應的單因子試驗:隨機效應模型對於單因子試驗來說,說明固定效應和隨機效應模型差異的最好方法是舉例子。 假設我們想要對三個眼蹤站處閃電時的靜電釋放強度進行比較,這三個跟蹤站是在距一個大學內的中央計算系統20英里半徑內的。如果試驗中這三個眼蹤站是惟一可用的跟蹤站並且要得到的就是這幾個跟蹤站的推斷,那麼我們可寫出如下的固定效應模型: Y= + a+E 其中3;是跟蹤站iCi=1,2.3)處的第;次觀測值,從是總均值,a是第;個眼蹤站的固定效應。我們假定。服從均值為0方差為。的正態分佈。 然而,假如我們關心的不僅僅是這三個跟蹤站,而認為它們是從很多跟蹤站的可能位置中選取出的三個隨機樣本,那麼推斷就不僅與發生在樣本位置的事情有關,也會與跟蹤站其他可能位置處可能發生的事情有關。可以解釋這個差異的模型就是隨機效應模型: 3二十a+時儘管這個模型與前面的固定效應模型看上去完全相同,但一些假定卻是不同的: 1.仍是總均值,未知常數。 2.c;是第;個眼蹤站的隨機效應。我們假設a:服從均值為0方差為品的正態分佈。 3.a:間相互獨立。 4.如前,s服從均值為0方差為的正態分佈。 5 6間相互獨立。 6.隨機分量0:與ey間相互獨立。 要說明固定效應模型與隨機效應模型間的差別,我們可以假設是在重複做這個試驗。對固定模型,我們總是使用這相同的三個跟蹤站,所以關子這三個位置處期望強度或期望強度問差異的推斷將是有意義的。然而對於隨機效應模型,我們將使用由另外三個跟蹤站構成的隨機樣本(即由另三個a組成的樣本)。現在不再是集中任某一次試驗中的三個a組成的特定集合的效應上,而是需要檢查所有可能。值構成的總體的變異性。這將用如下表17.2的方差分析表來說明。

17.2 具有隨機處理效應的單因子試驗:隨機效應模型•1087• 衰17.2 單因子試驗的 AOY 表:固定或陌機模型來源一處理誤差總極 SST SSE TSS -1:(n-1) IN-1 MS MST MSE EMS 周定效應 o+ mor 隨機效座品+782 可以看到,固定效應與隨機效應模型的方差分析表相同,除了期望均方(EMS)這一列不同。大家可以回想起在第十三章和第十五章的表中並沒有這一列,因為在備擇假設下所有均方(除了 MSE)的期望取值都等於。?加上一個依賴於所檢驗的引數的正常數。一般情況下,1個處理(限蹤站),每個處理處有,次觀測值時的AOV 表與表17.2是相同的。對固定效應模型,8,是常數 a:的正函式,而隨機效應模型中的品代表了a:總體的方差。對於上面的例子,固定效應模型下三個跟蹤站的強度均值相等的檢驗如下(同第十五章): Ho:au = a2 = a3 = 0(即,三個均值相等) Ha:至少有一個a不等予0 T.S.:F = MST/MSE, 其中df=1-1,d=1(n-1) 隨機效應模型下對。總體的變異性的檢驗也使用這個檢驗統計量。零假設和備擇假設為: Ho:0=0 H:≥0 T.S.:F = MST/MSE,其中df =1-1,dfz=t(n-1) 因為我們假設a是從均值為0方差為品的正態總體中選取的,所以零假設是說a 來自於均值為0方差也為0的正態總體,即該總體中所有。的值都等於0。 這樣,儘管兩個模型的零假設形式不同,但它們表示的意義卦是很相似的。對固定效應模型,我們假設樣本中的那些a(也是僅有的a)都等於0,而在隨機效應模型中,零假設是指不僅樣本中的 a,同時還有總體中其他的 a 都等於0。 同樣備擇假設也是如此。在固定效應模型中,我們假設至少有一個。與其餘的不同,即a集合中有一些變異性。而對於隨機效應模型來說,備擇假設是品>0;也就是說,總體中的 a值並不全相等。 在單因子的隨機效應模型中,響應變數的均值和方差是: E(y=po= Var(y)=d+a

•1088• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析因此,在大多數隨機效應模型中,我們需要確定品相對於的大小,從而能估計出處理對於響應變數總的變異性的效應的大小。因為或。是未知的,我們可以借助於方差分析中短匹配估計的思想建立對這些量的估計。從下面的AOV 表,我們可以看到 MST 的期望取值為 +20,MSE的期望取值為品。 來源處理誤益 Ms MST MSE 隨機效應 o+mo 我們令樣本均方等於其估計值,取代總體方差,得到: 品 = MSE,a = (MST - MSE)/n 這樣有, 二 +。響應變數的方差由此分成兩種來源,即處理和試驗誤差,並由此得到兩種來源所佔的比例,見表17.3。 表17.3 響應變數方差的按比例分配估計值 =(MIST - MSE)/n =MSE 方差來源處理誤差總利佔總方差的比例品/ c/ 1.0 研究者也許還想要對響應變數的均值p進行估計。下面我們給出了p的點估計和估計的標準誤差: 應= 和 SE(p) = /MST/63 由此我們可以得到 y的100(1 a)%置信區間: P士te i,taow SE(p)或 .士fa/2.:(w-1) /MST/mn 例17.1 考慮一下我們剛剛用來說明處理效應隨機的單因子試驗的那個例子。兩個研究生在為一個電子!程的教授工作,他們得到資助去記錄三個跟蹤站處閃電時的電荷釋放強度(即電場強度)。因為夏季發生雷暴的頻率很高(Florida 平均每年中有80 或更多天有暴風雨),研究生們要在地圖上從 20英里半徑的區域內隨機地選取一個地點,並將他們的跟蹤儀器安放在那裡(當然要獲得主人的允許)。在五天裡,每天上

17.2 具有隨機處理效應的單因子試驗:隨機效應模型•1089• 午8點到下午5點間,他們要監測他們的儀器,直到記錄下了強度的最大值。然後他們在另外兩個隨機選取的地點重複這個過程。得到的樣本資料(伏特每米)如下表 17.4。 表17.4 閃電時電荷放強度(伏特每米) 跟蹤蛂 1 2 3 強度 20 4,300 100 1,050 70 7.700 3,200 2.560 8.500 5,600 3,650 2.960 50 80 3,340 總平均偵平均值 1,984 2,132 4,520 •—…… 2,878.67 8.寫出適當的統討模型,說明每個項的意義。 b.進行方差分析並解釋你的結果,取a=.05。 •估計方差分量和它們相對總變異的比值。 d.估計日閃電電荷釋放強度最大值的均值,置信度95%。 解等因為跟蹤站是隨機選取的,所以我們可以用單因子隨機效應模型把日閃電電荷釋放強度最大值 vj和第;個跟蹤站和第;天聯絡起來: Y=H++E (i= 1,2,3;j= 1,2,,5) 其中/是日閃電釋放強度最大的均值,a,是第;個被隨機選到的跟蹤站的隨機效應,E;是所有其他變異性的來源所帶來的隨機效應。隨機效應方差分析中平方和公式的計算與固定效應中的計算相同。因此我們有: SST-nZ(- $.)- 5|(1.984-2.878.67)°+ (2.132-2.878.67)2 + (4,520 -2,878.67)P1 = 20,259,573.3 T8-(%- - = (20 -2,878. 67)2+(1.050-2,878. 67Y2 +⋯+ (3,340-2,878.67) = 108.249, 173.3 做減法, SSE=TSS-SST=108,249,173.3-20,259,573.3=87,989,600 我們可以由這些計算結果建立 AOV 表,見表17.5。

• 1090• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析來源踉蹤站誒差總利 SS 20,269,573.3 87.989,600.0 108,249,173.3 表17.5 例17.1資料的AOV表 MS 2 12 14 10,129,786.65 7,332,466.67 EMIS o+5o2 F 1.38 Ho:a=0的F檢驗的自由度df =2,d=12。因為算得F值為1.38,沒有超過3.89(附錄表8中取a=.05,df =2及df=12得到的值),所以我們沒有足夠證據說跟蹤站與跟蹤站間表示強度差異的隨機分量之間有顯著的差異。就像電力工程師假定的那樣,最好僅在一個跟蹤站處工作,因為通常強度的變異性和跟蹤站與電荷釋放地點的距離有關,而我們很難控制這個來源。實際上我們可計算方差分量的估計值: 8 =7,332,466.67 =(10,129,786.65 - 7,332,466.67)/5 = 559,464 由此得到好 =7,332,466.67 + 559,464 = 7,891,930.67 跟蹤站差異相對於總變異的比例是559,464/7,891,930.67=.0709。由跟蹤站間差異帶來的日最大閃電強度的變異性僅佔總變異性的7.1%。我們可得到日最大閃電強度均值的95%置信區間: .土t0.25,2SE(A) 2878.67 土 (2.179)V10, 129,786.65/15或2878.67 土1790.65 由此,我們有95%的把握說日最大閃電強度的均值在區間(1088,4669)內。 練習應用 17.1(醫藥)一個醫藥公司想要檢驗一種在桶中混合所得到的液體藥品的效力。為此,從一個月內的產品中隨機取了5桶作為樣本,每個桶中分別取四次樣品。 8.寫出本試驗的隨機效應模型,確定其中各項的意義。 b.根據下面的樣本資料進行方差分析,取a=.05。 桶1 桶2 桶3 3.2 2.6 3.4 3.8 2.9 3.9 3.5 2.8 3.3 3.0 2.0 3.1 桶4 4.2 4.4 4.3 4.2 桶s 1.8 2.3 1.9 2.1

17.3 隨機效應模型的擴充•1091, 17.2 假設練習17.1 中的醫藥公司想要估計從一個月內生產的那種液體藥品中隨機選出的一桶的預期效力。 2.用練習17.1的資料,給出隨機選出的桶中藥品平均效力的點估計。 b.給出隨機選出的桶中藥品平均效力的95%的置信區間。 17.3 隨機效應模型的擴充單因子試驗中隨機效應模型的思想可以擴充應用到第十五章提到的任何區組設計和因子試驗。我們沒有時間一一討論每種情況,但我們首先要分析一個區組效應和處理效應都隨機的隨機化區組設計。 要進行一項試驗以檢驗在分析齒蘭斑的 DNA 成分時不同的分析員和受試驗者的效應。三個女性受試者(18~20歲)被選入這項研究。每個受試者可以保持她們的正常飲食,同時每天補充 30mg(15片)蔗糖。研究過程中不允許刷牙和漱口。在一週結束時,從每個受試者的完整齒列上都刮下牙菌斑,並分為三份。隨機地選出三個分析員,每一個都拿到那三個受試者的沒有標名字的齒菌斑樣本,並要對它們的 DNA成分作分析(以微克計)。這個兩因子試驗的樣本資料見下表17.6。 分析員衰17.6 齒蘭斑樣本的 DNA成分 _受試者 2 3 平均值 13.2 12.5 13.0 12.9 2 10.6 9.6 9.9 10.03 3 8.5 7.9 8.3 8.23 平均值 10.77 10.0) 10.40 10.39 此試驗是個隨機化區組設計,其中受試者代表區組,分析員代表處理。試驗單元是從受試者齒列上刮下的牙菌斑的樣本。如果我們假設這三個受試老代表從一大群可能的受試者中隨機選取的樣本,同樣三個分析員代表從很多可能的分析員中隨機選取的樣本,那麼我們可以寫出如下隨機效應模型,從而將 DNA成分與兩個因子 ——“分析員”和“受試者"聯絡起來。 假定如下: 1• e 是未知的總含量均。 2 a 是第:個分析員的隨機應,它服從均信為0方差的正態分佈。 3.a;間相互獨立。

1092• 第十七章“些固定效應、隨機效應和混合效應模型的方差分析 4.8;,是第;個受試者的隨機效應,它是個服從均值為0方差為哈的正態分佈的隨機變數。 5.8 間相互獨立。 6.a:B;和ey間相互獨立。 一定要注意企假設處理效應和區組的效應是隨機而不是固定時的差別。舉例來說,如果研究中的三個分析員是我們惟一感興趣的分析員,我們關注的就只是這幾個特定分析員對 DNA成分均值效應的差別。而現在分析員的效應是作為隨機變數處理的,我們得到的推斷也就是關於研究員總體的效應的。因為已假設這個正態總體的均為0,所以我們要判斷方差是否大於0。 一般的兩因子完全隨機化設計的AOV 表可見表17.7,其中因於A有a個水平, B有個水平,且沒有重複。這個 AOV 表也可應用在隨機化完全區組設計中,A代表處理,B代表區組。就像單因子試驗的隨機效應模型那樣,兩因子試驗中固定效應和隨機效應模型的方差分析表除了期望均方項外其他都是相同的。 表17.7 雙因子試驗的AOV 表,因子A有:個水平,因子B有b個水平來源 EMS SS MSS A B 誤差總利 SSA SSB SSE TSS 4-1 -1 (u-1)(6-1) cb-1 MSA MSB MSE 固定效應 a+6A o+aB 隨機效應 a+adj 平方和以及均方的計算過程與第十五章的完全相同。檢驗方法的差別在表 17.8中以因子A為例作出了說明。同樣的結果也適用於因子B。 表17.8 對因子 A檢驗方法的差別固定效應模型 Ho:a=a2=:=2=0 H:至少有-個a與其他的不同 T.S.:F=ASA MSE R.R.:基於 df=4-1,d=(a-1)(-1) 隨機效應棋型 Ffu:o2=0 H:>0 T.S.:F=ASA MSE R.R.:同左

17.3 隨機效應模型的充 1093 下面我們不再繼續討論例子,我們將討論在每個因子水平組合處有n >1次觀察的因子試驗的隨機效應模型,然後說明它的檢驗方法。 在第十五章中,我們考慮過每個單元處有*>1次觀察的完全隨機化設計中a X 析因試驗的固定效應模型。aXb析因試驗的隨機效應模型和與之相對應的固定效應模型具有相同的形式,只是假定不同: Yik=p+ai+B+ay+Ev 其中yy是在因子A的第;個水平因子B的第;個水平處的第次觀測的響應,、 Qi,月;和Ei的定義同沒有重複的隨機效應模型中一樣。此外我們還有如下假定: 1.q8,是因子A的第;個水平因子B的第;個水平的隨機效應,q,服從均值為 0方差品的正態分佈。 2.Q;間相互獨立。 3.0及,a8y和E泌之間相互獨立。 固定效應和隨機效應模型相應的 AOV 表見表17.9。 表17.9每個試驗單元處有n次現測的a×b析因試驗的 AOV 表來源 EMS SS df MS 固定效應隨機效盛 A SSA a-1 MSA 昨+n60A 唔+ noig+ omas. B SSB MSB o+ natln AB SSAB 誤差 SSE 總和 TSS (a-1)(~1) ab(-1) alm-1 MSAB d+nfAB MSE 表17.10給出了這兩種模型中AB互動效應平方和的適當的檢驗。 表17.10 固定效應、隨機效應模型的互動效應檢驗的比較固定效應模型隨機效崆模型 Ho:af11-412=:=a=0 Hn:0=0 H:至少有一個雙,與其他的不同 H:a≥0 T.S.:F- MISAL MSE MSE R. R.:根據 d=(a- 1).dfa= ah(n-1) R.R.:同左

•1094• 第十七章⋯些固定效應、隨機效應和混合效應模型的方差分析不像單因子試驗和沒有重複的兩因子試驗,此處固定效應與隨機效應模型中檢驗主效應的統計量並不相同。而且,對隨機效應模型來說,即使AB 互動效應(c)的檢驗結果是顯著的,對於品和婿的檢驗也可繼續進行。我們可以回想前面講到的固定效應模型中,當互動效應顯著時,只有在輪廓圖顯示互動效應是“有序的”時,檢驗主效應才是有意義的。對隨機效應模型,我們感興趣的是確定響應變數»變異性的各種來源(如 dap,0和o)。即使當。看來比0大時,檢驗品和晴也是有意義的。在固定效應模型中,當AB的互動效應不顯著時,我們可用如下統計量分別檢驗因子 A和因子B的主效應: F-SP= 就像從表17.9看到的期望均方列那樣,無論對Ho:0=0檢驗結果如何,我們可以利用表17.L1 中的檢驗步驟對c分量和唷分量做F檢驗,要注意檢驗統計量與固定效應情況的不同,固定效應時所有F統計量的分母都是 MSE。 表17.11 有無復的a Xb 析因試驗的檢驗:隨機效應模型因子 A 因子B H:0=0 Fo:0>0 T.S.:F=MS MSAE R.R.:基於 Hm:0=0 Hx :020 T.S.:F=NS MSAB R.R.:基於 df =(a-1),dfz =(a-1)(-1) 在很多因子具有隨機效應的試驗中,我們需要估計方差分量品,0, 及o。 我們還可用 AOV 矩匹配估計,即將樣本均方用 AOV 中的期望均方做匹配得到每個方差分量的估計。利用表17.9中的各個 MS 和 EMS我們得到: 品= MSE aa= (MSAB - MSE)/n (MSB- MSAB)/am 及 9= (MSA - MSAB)/bn 從兩個因子的水平都是隨機選取的隨機效應模型,我們有: ECyak)= 和嗎=時+婿+o+的

17.3 隨機效應模型的擴充•1095• 所佔的比例:因子A,因子B,互動效應和試驗誤差。見表 17.12: 方差來源因子 A 因子B AB 互動效應溪蘢總計表17.12 響應變數的總變異性的按比例分配估計值品=(MSA-MSAB)/Bm 子=(MSB-MSAB)/an a=(MSAB-MSE)/n a=MSE a=路+o+a+0? 佔總方差的比例 T. 品/ a1/ 併究者可能還想估計響應變數的均值 p。我們有,的點估計和估計的標準誤差如下: SE(A)=V(MSA+ MSB-MSAB)/abn 我們可建立如下的100(1-a)%置信區間: /(MSA + MSB-MSAB)/abr. 其中:檢驗統計量的自由度是用 Satterthwaith 近似得到的, dfApyrox. = (MSA + MSB-MSAB)’ (MSA)2/(a - 1)+ (MSB)2/(6-1)+(MSAB)2/(a-1)(6-1) 很多情況下這個值並不是整數,我們取小於或等於 dfAaprox 的最大鱉數。 在一些試驗中,某些方差分的估計值可能是負數。當然定義中的方差分量必須是個非負數,所以當樣本估計值是負數時我們必須另想辦法。 A1.我們可令估計值等於0並用0作為方差分量的估計值。然而此時估計值將不再是方差分量的無偏估計。 A2. 方差分的估計值為負可能說明模型中某些因素不適合下此試驗。試驗可能需要更復雜的模型。 A3.方差分量還有別的估計方法,但在數學知識上超過了本書的範圍。像 REML. 和MINIQUE 等方法現在可用SAS軟體完成。然而我們還是應該仔細檢查資料,因為質的方差分量估計值通常說明模型不合適。 例17.2 一個消費者用品代理商行想要評測一種補品中鈣水平的測定是否準確。現在有很多可參加試驗的實驗室及很多種對鈣的化學化驗方法。代理商行隨機選出了三個實驗室和三種化驗用於研究,每個實驗室都要使用全這三種化驗方法。現在準備

•1096• 第十七章一些固定效應,隨機效應和混合效應模型的方差分析好了十八個含 10mg 鈣的樣品,每個化驗—實驗室組合處都隨機分配到兩個樣品。 鈣含量的測定結果見下(括號中的數是化驗-實驗室組合處的平均值); 化驗方法 1 3 實驗室平均億 10.9 10.9 (10.g) 11.3 11.7 (11.5) 11.8 11.2 (11.5) 11.3 實驗室 2 10.5 9.8 (10.15) 9.4 10.2 (9.8) 10.0 10.7 (10.35) 10.1 一化驗方法均億 3 9.7 10.0 (9.85) 8.8 9.2 (9.0) 10.4 10.7 (10.55) 9.8 10.3 10.1 10.8 10.4 a.對此試驗進行方差分析,所有檢驗取a=0.05。 b.估計所有的方差分並確定它們佔總變異性的比例。 <估計所有實驗室和化驗方法對應的平均含鈣水平。 解答利用第十五章的公式,我們算得平方和如下: TSS= = 12.00 S8A=二6y-3- =61(10.3-10.4)-+ (10.1-10.42-+(10.8- 10.4)31 = 1.56 Ssl-2603.-3 =61(11.3-10.4)+(10.1- 10.4)2+(9.8- 10.4)31 = 7.56 SSAL= 二2(3. -3..)2 = 21(10.9-10.4)2+ (10.15- 10.4)2+ (9.85-10.4)2 +⋯+ (10.55- 10.4)2 = 1.64 SSE= TSS - SSA - SSL.- SSAL = 12.00- 1.56-7.56- 1.64 = 1.24 用方差分析表將結果總結如下:

來源化驗實驗室化驗* 實驗室誤差總計 Ss 1.56 7.56 1.64 1.24 12.00 df 2 2 4 9 17 17.3 隨機效應模型的擴充•1097• MS 0.78 3.78 0.41 0.1378 EMS a+20g+60 a+202+60 Q+20 品利用上面 AOV 表提供的結果,可進行適當的統計檢驗。對AB 的互動效應我們有 Ho:o=0 Ho:oa>0 MSE = 2.98 R.R.:對 《=0.05,如果值超過3.63就拒絕 Ho,臨界值取 a= 0.05, df = 4 和d=9。 結論:沒有足夠理由拒絕Ho。因子A、B的水平之間看來沒有顯著的互動效應。 對因子B我們有 Ho:∞=0 He:0≥0 T.S.:F= MSB -臺發 0.41 = 9.22 R.R.:對 & =0.05,如果F值超過6.94 就拒絕Ho,臨界值取 a=0.05, df =2 相dfz=4。 結論:因為F的觀測值遠大於6.94,我們拒絕H。並認為實驗室與實驗室之間對鈣含量的測定有顯著差別。 對因子A的檢驗如下: Ho:∞=0 H:0≥0 T.S.:F= S=2-190 R.R.:對 a=0.05,如果F值超過3.63 就拒絕Ho,臨界值取&= 0.05,df =2 和d=4。 結論:沒有足夠理由認為化驗方法與化驗方法間有顯著的差異。 下面我們估計方差分量。利用方差分析表中的MS 和 EMS,我們有 ⅔ = MSE= 0.1378

• 1098• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析 aan= (MSAB- MSE)/n = (0.41 - 0.1378)/2= 0.1361 a-(MSB-MSAB)/an =(3.78-0.41)/6= 0.5617 及 a =(MSA - MSAB)/b = (0.78-0.41)/6 = 0.0617 同樣,對下有兩個因子水平是隨機選取的隨機效應模型我們有 E(yy)= 和時二哈+時+ooto 所以 0 - 0.0617 + 0.5617 +0.1361 + 0.1378 = 0.8973 我們可以把總變異性。按比例分配給變異性的四種來源:化驗,實驗室,互動效應和試驗誤差。 -- 方差來源化驗實驗室互動效應誤差總計估計值 0.0617 1.5617 0.1361 0.1378 0.8973 -— 佔總方差的比例 0.0617/0.8973=0.069 0-5617/0.8973=0.626 01.1361/0.8973=0.152 0.1378/0.8973=0.156 1.9 因為樣品鈣水平的測定結果有顯著的差異,所以研究者就不再關心總均值水平 p的估計。然而為說明這個方法,我們將繼續進行。得到!!的點估計和標準誤差為: A=y.= 10.4 稱 SE(p) = /(MSA + MSB - MSAB)/abn = 0.4802 的100(1 a)%置信區間為: V(MSA + MSB- MSAB)/ abrd 或 10.4 土(tc/2.df,woox,)(0.4802) 其中/檢驗統計量的自由度是用 Satterthwaith 近似得到的, dfAprox. (MSA + MSB-MSAB)2 (MSA)2/(a -1) +(MSB)2/(-L)+(MSAB) /(a-1)(6-1) (4.15)2 = (0.78)-/2+ (3.78)9/2+ (0.412/4-2.3 取小下或等於 dfApne,的最大整數,則 dHAprox. =2。因為1.025.2=4.303,我們得到所有的實驗室和化驗方法對應的含鈣水平均值的95%信區間為:

17.3 隨機效應模型的擴充•1099• 10.4土(4.303)(0.4802) 10.4土2.1郎(8.3,12.5) 本節中,我們比較了完全隨機化設計與每個單元處有n 次觀測值的aXB析因試驗的隨機效應模型和固定效應模型。這個研究並不夠徹底,但已經說明了除定效應模型外還有別的模型。對隨機效應模型更詳細的研究應包括含更多因子(多於兩個)的析因試驗和 17.6 節中的套抽樣試驗。對於後一種試驗設計,因子B的水平是巢狀在因子 A的水平中(而不是寧之相互交叉)的。比如,要考察一種化學制品的效力,我們先從不同的生產廠取樣,再從廠內產品批中取,再在每批產品中取。注意因子“批”與因子“生產廠“並不是相互交叉的,因為比方說,廠1的第一批和廠2的第一批是不同的。 在第17.4節中,我們將把本節的結果擴充到a×6 析因試驗的混合效應模型。 練習應用 17.3(化學)現在要進行.一項研究來檢驗對齒菌斑 DNA 含董的化學分析的變異性。研究中選的兩個主要來源是不同的分析員和不同的受試者。研究人員從一大群可以參加研究的分析員中隨機選了三個,同樣選了三個女性受試者(18-20歲)。 從每個受試者的完整齒列上刮下齒菌斑並分為三份。每個分析員都拿到每個受試者的一份沒有標名字的樣品並對它們進行DNA含量的分析(以微克計)。資料如下。 分析員 1 2 3 平均值 1 13.2 12.5 13.0 12.9 受試者 2 10.6 9.6 9.9 10.03 平均值 3 8.5 7.9 8.3 8.23 10.77 10.00 10.40 10.39 a.寫出一個合適的統計模型,並辨別模型中所有項的意義。 b.寫出期望均方。 17.4 根據例 17.3,做方差分析,所有檢驗取 a=0.05。 17.5(商業)一個市場調查公司想要研究一種新的促銷活動對於提高D-cell電池品牌的效應。研究在隨機選取的四個標準的大城市的統計區域(SMASs)進行,每個城市內隨機選取了三個連鎖銷售店(從一大堆雜貨店、藥店和百貨公司的名單中選取),記錄下指定區域在促銷活動後隨機選的兩週內的銷 (以美元計),資料如下。

•1100、 第十七章一些閒定效應、隨機效應和涯合效應模型的方差分析 SMSA 連鎖銷售店 2 3 1 98 112 87 75 140 190 2 149 126 96 138 L$9 185 3 79 61 119 104 169 150 4 340 302 125 133 460 420 8.寫出適當的線性統計模型,列出假定並指出各項的含義。 b.進行方差分析,寫出期望均方,取a=0.05。 c將銷量的總變異性分解為各個來源帶來的變異性。 17.4 混合效應模型在17.3節中,我們對隨機化區組設計和完全隨機化設計中一般a×3吸引試驗的固定效應模型和隨機效應模型的方差分析表做了比較。假設對於同樣的這些試驗設計,我們的模型是一個因子效應固定另•個隨機的混合效應模型。例如,17.3節中我們考慮了一個試驗,這個試驗是檢驗不同的受試者和不同的分析員對齒菌斑 DNA成分的效應。如果三個受試者是隨機選擇而三個分析員是所關心的僅有的分析員,那麼我們就有了一個隨機化區組設計的混合模型,其中分析員是固定的,受試者是隨機的。 讓我們考慮完全隨機化設計中一般aX 析因試驗的混合模型。除假定不同外,模型與17.3中的一樣: Yik= +a+月+o+ Eis 其中因子 A的水平固定,因子B的水平隨機選取;假定如下: 1. 是未知的總響應均值。 2.a:是因子A的第個水平對應的固定效應,2a=0。 3.8,是因子B的第;個水平對應的隨機效應。A,獨立同服從均值為0方差骨的正態分佈。

17.4 混合效應模型 • 1101• 4.Q8是因子A的第;個水平和因子B的第;個水平的互動效應,Zas, =0,對任意j=1,,6oa。服從均值為0方差的正態分佈。對所有j 了,明y村 affg 是獨立的。 5.B.Q0,和 eiw 間獨立。 因為二aB,=0.對任意;=1,…,,所以對每個j,01Q82j,,apa是相關的,而對所有的;j,0,和 apj是獨立的。即,因了B的同-•個水平對應的互動效應是相關的,而因子B不同水平對應的互動效應之間卻是獨立的。 根據假定,有重複的兩因子試驗的固定、隨機和混合模型的方差分析表如下表 17.13。 表17.13aX 析因試驗的 AOV表,每個單元處有n次觀測 df MS EMS 來源 SS A SSA a -1 B SSR 6-1 AB SSAB (a-1)(6-1) 誤差 SSE ub(n-1) 總計 •TSS rab-1 MSA MSB MSAB MSE 固定效應 q+bn8A o+ands ∞+3fg 隨機效應 o+ moag + lmaa o+nsig t uno o+nap 混合效應 A 固定,B隨機 o+ nolg+ onta 聖+ ansk R+n郡表17.13中的期望均方哪一列對於進行適當的顯著性檢驗是很有幫助的。混合模型申對。 的檢驗和隨機效應模型中一樣。 對c的檢驗: H:c=0 E:a≥0 T.S.:F~ MSAB MSE R.R.:基於 df= (a-1)(8-1), df= ab(n-1) 無論對。的檢驗結果如何,我們都可以繼續對因子A和B 作如下檢驗,檢驗也要用到表17.13中期望均方列中的項。對因子A 的檢驗如下: Ho:a1 = a2 = ⋯•=0 H:至少有一個。與別的不同

• 1102• 第十七童一些固定效應、隨機效應和混合效應模型的方差分析 T.S.:F= MSA MSAB R.R.:取df= (a-1),df= (a-1)08-1) 對因子B的檢驗為: Ho:0=0 H:0≥0 T.S:F-M MSE R.R.:取 df= (B-1),df= ab(n-1) a ×6因子試驗的混合效應模型的方差分析過程同樣也適用於隨機化區組設計,其中處理是固定的,區組則假設為隨機的,並且每個區組和處理處有,次觀測值。我們將用下面的例子說明隨機模型。 例 17.3 現在要設計-•項研究來評測兩種不同的防曬劑(S」稱s2)在保護人們肌膚暴露在陽光中時不受到灼傷或曬黑方面的效果。由40個受試者(20~25歲)組成的隨機樣本同意參加這項研究。在每個受試老背部肩下方腰背上方處劃分出1平方英寸的範圍。各二十名受試者被隨機分到一種防曬劑。在使用一定量的指定的防曬劑之前,先記錄下指定範圍內肌膚的顏色讀數;同樣在使用防曬劑並暴露在陽光中2小時後也記錄下讀數。公司注意到膚色的測量結果差異極大,並想要估計一下由於讀取讀數的技術員造成的變異性,所以公司從它的全世界範圍的員工中隨機選了10名技術員參加這項研究。四個受試者,其中兩個用S1兩個用S2,被隨機分配給一個技術員作考察。下面表17.14記錄的資料是受試者的兩次讀數的差值(曬後減去曬前)。 響應變數值越高說明灼傷程度越深。 防曬劑(A) 平均值 $2 平均值平均值 1 8.2 7.6 (7.9) 6.1 6.8 (6.45) (7.175) 表17.14 例17.13防曬試驗的資料技術員 2 3.6 3.5 (3.$5) 4.3 4.7 (4.5) (4.025) 3 10.7 10.3 (10.5) 9.6 9.2 (9.4) (9.95) 4 3.9 4.4 (4.15) 2.3 2.5 (2.4) (3.275) 5 12.9 12.1 (12.5) 12.4 12.8 (12.6) (12.55)

17.4 混合效應模型 •1103. 續表技術員防曬劑(A) Si 平均值平均值平均值 6 5.5 5.9 (5.7) 4.8 4.0 (4.4) (5.05) 7 9.1 9.7 (9.4) 8.3 8.6 (8.45) (8.925) B 13.7 13.2 (13.45) 12.9 13.6 (13.25) (13.35) 9 8.1 8.7 (8.4) 8.0 7.5 (7.75) (8.075) 10 2.5 2.8 (2.65) 2.1 2.5 (2.3) (2.475) 平均值 7.82 7.15 7.485 這是個完全隨機化設計,有兩個因子——有兩個固定水平的防曬劑種類(A)和隨機選取了10個水平的技術員,每個防曬劑一技術員組合處有兩個受試者。分析數據以確定防曬之間和技術員之的差異。 解答,我們可用下面的公式計算 AOV 表中各種變異性來源對應的平方和。 + (2.5-7.485)2= 530.59 SSA -2206y.-3.) = 201(7.82-7.485)°+ (7.15-7.485)?1 = 4.40 SSB= 248.-3.8=41(7.175-7.485)2 + (4.025-7.485) +. + (2.475-7.485)2 = 517.49 SSAB = 2202.-3.)- SS4 -S8 =21(7.9-7.485)-+ (3.55 -7.485)- + (10.5- 7.485)2+⋯+(2.3-7.485)2 -4.49- 517.49= 5.97 SSE = TSS- SSA-SSB- SSAB=530.59- 4.49- 517.49- 5.97=2.64 將a=2,6=10和n=2代入與表17.13 相似的 AOV 表中就得到了表17.15 的結果。

•1104• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析米源表17.15 例17.3 資料的 AOV表 df MS A E AB 誒差總訃 SS 4.49 517.49 5.97 2.64 530.59 1 9 9 20 39 4.49 57.50 0.66 0.13 FMS 固定模型 0+20%+208 a+40 0+20部 • 對隨機分量 cp;的檢驗如下: Ho:0 4=U Ha:da MSAB T.S.:F = 9.66 MSE 0.13-5.08 R.R.:對 a= 0.05,如果計算出的 F值大於2.39(附表8中a=0.05, df」= 9,dtz =20對應的值),我們就拒絕Ho。 結論:因為 5.08大於 2.39,我們拒絕 Ho,結論為 o>0;即,A(遮光劑)的第 i 個水平和B(技術員)的第;個水平組合是隨機變異很重要的來源。從中我們可推斷出,由技術員造成的膚色測定的變異對於這兩種遮光劑是不同的。 接下來評估技術員的效應。 H: =0 T.S.:F = 體-2.- 42.31 MSE R.R.:對 a=0.05,如果計算出的F值大於2.39(附表8中&=0.05, df」= 9,df= 20對應的值),我們就拒絕Ho。 結論:因為442.31 大於2.39,拒絕H。並認為o>0.所以技術員與技術員之間的差異是隨機變異的重要來源。 對因子A有: Hy:a1 = a2 =0 Ho:a1$a2 T.S.F-M-€:3-6.80 R.R.:對a= 0.05,如果計算出的F值大於5.12(附表8中=0.05,df= 9,dfz= 20對應的值),我們就拒絕Hoo

17.4 混合效應模型•1105 結論:因為6.80>5.12,拒絕H。並認為兩種遮光劑的響應均值(曬後減曬前) 不同。因為了:1=7.82,3:2 =7.15,我們認為平均說來s2比s1能提供更多保護。但是就像前面表明的,技術員和技術員與遮光劑的組合也是變異性的重要來源。 下面我們分析案例中的資料。 來例資料分析:擴張接縫處的壓降本研究的目的是確定電渦輪機上擴張接縫處的壓降否與氣體溫度有關。而且研究者還想估計一下由不同種類的測壓計造成的讀數差異,以及確定讀數的變化是否與不同的氣體溫度相符合。在圖17.1中,我們觀察到當溫度從15C升到 25 時壓降有輕微的升高;而在溫度進一步由25C升到35七時壓降卻相應下降。 四種測壓計測得的壓降與這三個溫度相當的一致,只除了在25C時測壓計GI測得的壓降平均值比另三種測得的更高。下面12個溫度—測壓計組合處的均值和標準差表顯示標準差是相當穩定的,除了測壓計G1在25C時壓降的均值比其他 11 種溫度-測壓計處理的壓降均值要高。 玉讀數的均利標準差溫度 — 均 15 25 35 G1 41.17 61.33 39.00 G2 38.50 46.67 41.17 值 G3 38.67 45.33 37.83 G4 43.00 41.33 42.67 Gl 3.31 4.27 4.69 標準差 G2 G3 3.62 3.72 3.44 2.07 2.79 3.31 Ci4 4.69 4.97 4.18 因為這四種測壓計是從這個公司使用的所有測壓計中隨機選出的,所以我們要估計上面表中和圖17.1中觀察到的模式相對子從中選出測壓計的總體來說是香是顯著的差異。此外,我們還要確定15t到35t的各溫度範圍之間的壓降均值是否有顯著差異。此處溫度因子是固定的,測壓計因子是隨機的。用下面的模型來擬合資料: Yik= +a+B;+ay+Ev 其中yi是溫度;下用測壓計;時第知次重複測量的壓降。在進行假設檢驗和構建置信區間之前,我們要考察推斷成立所必須滿足的試驗條件是否恰當。檢查下面的殘差圖能幫助我們考查模型條件的正確性。下面是擬合模型殘差分析的計算機輸出結果。

• 1106• 第十七章 -些固定效應、隨機效應和混合效應模型的方差分析 Residual Analysis for Case Study Univariate Procedure Variable= RESIDUALS Variable=RESIDUALS H Mean Std Dev Skewness N;Nornal Stem Leaf 4 000233578 2 03338023335777 0 5778823378 -0 877322533222 -2 87777533087330 -4 325332000 Naments 72 Sur Wgts 0 Sum 3.532545 Var iance 0.014971 Kurtosis 0.959963 Pr≤N 72 12.47887 -0.87963 0.0655 Boxplot + L 10 12 14 Variable=RESIDUALS 7+ -7+ Normal Probability Plot +++*++* 山衡育身宙育身青青會有*青++ 童南南大會有窗盲大 * *青 *+ ++食+++ Plot of RESIDUAL.S*PREDICTED Legend: A = 1 obs,B= 2 obs,etc. 10+ RESID 0 -10+ A AB A BA A AA •一B-- apc 加m B AA A 35 -+ 40 A A B •———-- B H B -+- 45 50 PREDICTED A B

17.4 混合效應模型•1107• 殘差的盒形圖和莖葉圖顯示沒有極端值。正態機率圖顯示一些殘差稍微偏離擬合的線條。但是正態性檢驗的 p值為.0655,所以沒有顯著證據說殘差不服從正態分佈。殘差對預測值的圖顯示關於殘差的等方差假定並沒有被違背,因為在預測值附近殘差的分佈相當穩定。所以由資料看來,正態性和等方差等條件是滿足的。測壓計是從測壓計總體中隨機選出這個條件以及試驗進行總遵循響應之間獨立的方式這個條件將透過與和此試驗有關的研究者進行討論來檢查。現在我們給出 AOV 表和有關的假設檢驗。 案例的 AOV表來源溫度(T) 測玉計(G) T*G 誤差總計 SS 1,133.78 437.22 1,106.78 886.00 3.563.78 df 2 3 6 60 71 MS 556.89 145.74 184.46 14.77 EMS a+6oig+240 2+180 o+60 對資料擬合上述模型的計算機輸出結果如下。 General Linear Nodels Procedure Deperdent Variable:Y DROE Source Model Error Corrected Total DF 11 60 71 Sum of Sqvares 2677.77778 886.00000 3563.77778 Meen Square 243.43434 14.76667 R-Sguare 0.751387 c.v. 8.92507B Root MSE 3.84274 Source TEMP GAUGE TEAIP * GAUGE DF 2 uu 6 rype III SS 1133.77778 437.22222 1106.77778 Hean Square 566.88889 145.74074 184.46296 Dependent Variable:Y Source: TEAP F 3.02 9.87 12.49 F Value 16.49 F Value 38.39 9.87 12.49 p值 •1238 <.0001 <.0001 FT>F 0.0001 Y Hean 43.0556 PI>F 0.0001 0.0001 0.0001

• 1108. 第十七章•些固定效應、隨機效應和混合效應模型的方差分析 EITOr: HS(TENP * GACKGE) Denominator Denominator DF Type III Ms DE HS F Value PE>E 2 556.88888888 6 184.46296296 3.01897 0.1238 根據 AOV 表,我們確認氣體溫度和測壓計的種類之間有顯著的互動效應(p 值<0.0001)。所以,在15t到35C的溫度範圍內壓降均值和氣體溫度間的關係對丁所有測壓計種類來說並不是相同的。這個結論確認了我們在圖17.1 的側面圖中觀察到的關係。此外,測壓計種類引起的壓降變化也是很顯著的(值< 0.0001)。所以測量壓降用的測壓計在研究中的各溫度範圍下測得的結果並不一致。然而三個溫度下的壓降均價並無顯著差異(p值=0.1238)。這樣看來,渦輪機中擴張接縫處壓降變異的主要來源是用於測壓降的測壓計種類而不是氣體溫度。 結果報告我們需要寫份報告來總結我們在此試驗中的發現。報告中應包括: 1.對研究目的的陳述。 2.對研究設計的描述,研究中的因子是如何選取的,測壓計是如何從測壓計總體中選出的,使用已選出的溫度範圍的可行性,何時讀取壓降讀數的時間選擇以及其他因子—比如操作者的差異、環境差異、渦輪機執行條件——是如何控制的。 3.對結果從此研究應用到渦輪機總體的可推廣性的討論。 4.資料集的數值和圖表概括。 s. 所有推斷方法的描述: •敘述所有研究假設及其 F 檢驗和p值, •證實推斷方法用到的必要條件得到了滿足。 6.對結果和結論的討論。 7.對與以前研究相關的發現的討論。 8. 對以後研究的建議。 9.列出資料集。 這個討論只為混合模型的學習提供了一個簡單的人門介紹。事實上,我們可以在研究生水平的學習中花一個或更多章節討論適合於混合模型的話題。對於更複雜的工作,我們可以分析有三個或更多因子(一些隨機,另一些固定)的析因試驗。此外,當研究兩個因子(都是固定效應)對響應變數的效應同時以第三個因子 (隨機的)為區組變數時,裂區設計就成為隨機化區組設計中析因試驗的重要替代

17.4 混合效應模型 • 1109• 方法。裂區設計和屬於隨機化區組設計的析因試驗之間的差別在於將處理應用於試驗單元的方法上。裂區設計中,對每個區組,因子1的水平是隨機地分配到試驗單元中的,然後第二個子的水平再被隨機地分到因子1每個水平內的子單元中。 這種隨機化與隨機化區組設計中的析因試驗的隨機化是非常不同的。有關此話題的討論將在17.6節中進行。 練習應用 17.6(環境)下面的研究是要分析培育出的四種用來控制火蟻的化學制劑的效果。化學制劑放置的環境條件可能會對它殺死火蟻的效力產生影響,所以研究者從一大堆可選的位景中隨機選了五個位置,每個位置代表一個隨機選取的環坑。為減少火蟻群體不同和它們居住的土提不同帶來的影響,研究者建立了40個人造的火蟻居住的土丘並讓有相似祖先的50,000只火蟻居住在裡面。研究者隨機地給20個化學劑-位置組合的每一個分配了兩個土丘。一內殺死的火蟻數量被記錄下來。火蟻死亡的數目(以幹記)如下。 8.為本研究寫出合適的線性模型,辨明模型中所有項的意義。 b.計算試驗的平方和並在 AOV 表中報告出來,注意AOV 表中要包括期望均方的列。 地點化學制劑 1 2 3 4 5 1 7.2 9.6 8.5 9.6 9.1 8.6 8.2 9.0 7.8 8.0 2 4.2 3.5 2.9 3.3 1.8 2.4 3.6 4.4 3.7 3.9 3 9.s 9.3 8.8 9.2 7.6 7.1 7.3 7.0 9.2 8.3 4 5.4 3.9 6.3 6.0 6.1 5.6 5.0 5.4 6.5 6.9 17.7 根據例17.6,進行方差分析,給出結論,取a=0.05。

• 1110• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析 17.5 計算期望均方的規則在第十五章我們討論了固定效應模型下單因子和兩因子試驗的方差分析;本章前面我們又討論了隨機和混合模型。本節中我們將看到對任何在每個因子水平組合處有,次觀測的k-因子試驗的資料,利用一些相當簡單的規則就可能寫出固定、隨機或混合模型所有主效應和互動效應的期望均方。這些準則的聖母性在下,在寫出其個不熟悉的試驗設計的糊望均方後,我們常帶就可以建立適當的印齡驗。固定和隨機模型的假設將與在前面幾節中描述固定、隨機和混合模型時的一樣。 在我們繼續討論計算期望均方的準則之前,先要給出兩條判定互動效應是固定效應還是隨機效應的準則。 互動效應的判定準則: 1.如果一個固定效應與另一個面定效應互動作用,則所得的互動效應是固定效應 2. 如果一個隨機效應與另一個效應(固定或隨機)互動作用,則所得的互動效應是個隨機的分量。 例 17.4 考慮一個3×6 的析因試驗,每個因子水平組合處有兩個觀測值。判定如下情況下 AB 的互動效應是隨機的還是固定的。 a.A 和B 都是固定效應。 b.A是固定B是隨機的。 c.A 和B都是隨機的。 解答我們應用上面的準則來判定互動效應。 a.AB 是固定效應,因為是A(固定)與B(固定)互動作用的結果。 b.AB 是隨機分,因為是A(固定)與B(隨機)互動作用的結果。 c.AB 是隨機的,因為是A(隨機)與B(隨機)互動作用的結果。 例17.5 考慮因子為A、B和C的析因試驗。判定 AB,AC,BC 和ABC的互動效應是固定還是隨機的,其中A和B是固定的而C是隨機的。 解答我們應用上述的判定準則。 AB是固定的,A(固定)與B(固定)互動作用。

17.5 計算期望均方的規則•1111 AC 是隨機的,A(固定)與C(隨機)互動作用。 BC 是隨機的,B(固定)與C(隨機)互動作用。 ABC 是隨機的,A(固定)與BC(隨機)互動作用。 在敘述計算期望均方的規則前,建立一個均方表很方便。步驟總結如下並以一個a×6 的析因試驗來舉例說明,其中因子A隨機、B固定,A和B的每個因子水平組合處有次觀測。 構造均方衰的步驟: 1.寫出試驗的模型。對a X6析因試驗,模型為 Yuk= K tait月+ai+Ei 注意:6一項中使用了括弧是為了說明A和B 每個因子水平組合處(即,對i,;的每個選擇)有k=1,2,⋯, 次觀測。 2. 用模型中每個量(除了)作為一行的標題構造一個表,表的形式如下。 EAF的] 3.模型中每個下標形成一列。 i k apy EA[i] 4.在每列標題上方說明下標對應的是固定(F)效應還是隨機效應(R)。 5.還要標示出每個下標的水平數。對我們的例子由第4 步和第5步得到的表如下。

• 1112、 第十七章 -些固定效應、隨機效應和混合效應模型的方差分析 R i b F j R! 口i ap,, 6.付給定一列的每一行,寫入列下標對應的水平數,除非行中量的下標含有列下掭 - R i 6 F J b x R k ….. "; 泣 n EAi! 7. 介行經列任表中第一列的模型中的各量,對下標中含有括號的量,在含存摺以!沙及劍的下標的列下面寫上1。 a R b F i j — R k 72 72 &i B, ap., E[ 1 1

17.5計算期望均方的規則 •1113• 8.對於一列中剩下的位置,如果此列的頭上是F就填上0;如果是R 就填!1 a R i 1 b F j n R k (i B, aBy Ekli」 a 1 1 0 0 1 n 1 這就是兩因子試驗計算期望均方用的均方表,其中因子A是隨機的,因子B3 是固定的,在A 和B的每個因子水平處有n次觀測。 當你有均方表之後計算期望均方就是很簡單的了。下面列出了規則。 利用均方表計算 EMS的規則 1.察看要計算均方的那一項的下標。 2.刪去均方表中那些不含此下標的行。 3.遮上表內那些以此項中未被括起的下標打頭的列。 4.將每一行餘下的未被遮起的量相乘,就得到了期望均方中各項的協係數。 例17.6 計算兩因子試驗中的E(MSA),因子A(隨機)有a個水平,因子B(固定)有6 個水平,每個因子水平組合處有n次觀測。 解答根據剛剛給出的均方表,我們注意到a:的下為:;所以我們刪去表中第二行,遮去第1列(以;頂頭),並將餘下的項相乘。表17.16顯示了這些步驟、乘法和 EMS的各量。 表17.16 計算 E(MSA)的均方表 n R EAE L R i 1 1 1 F 6 0 1 餘下項的乘積 bn EMS bnag n 1 t

• 1114• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析利用表17.16的最後一列,我們有 E(MSA)= d+boa E(MSB)的計算遵從類似的方法。B;的下標為j,所以我們刪去均方表中第二列(以;頂頭)和第一行(不含j)。將餘下項相乘得到期望均方中各項係數(見表17.17)。 表17.17 計算 E{MSB)的均方表 a R i 1 1 1 F j b 0 0 1 R. k 餘下項的乘積 EMS ” an n 1 anfg Ek[ ] 所以, 其中0g是形如下式的常數 1 E(MSB) = o + now+ an8a 二防 8=6'-j 例 17.7 2.建立因子A固定、因子B隨機的兩因子試驗的期望均方計算用表,A和B 的每個因子水平組合處有加次觀測。 b.計算 E(MSA)。 解答 =.此試驗的模型為 Yil=M+ a:+B+ asy + ekli 相應的均方表見表17.18。 •

a: E L ] 17.5 計算期望均方的規則•1115• 表17.18 例17.7 的均方表 a F 0 1 6 R j 6 1 1 1 R k n 1 b.從表17.19中可以找到E(MSA)。 表17.19 計算E(MSA) b F R j k 4; EATi F i 0 q 0 1 1 1 1 1 餘下項的乘積 bn - n 1 EMS bn6。 所以 E(MSA)=02+no部+bn8a,其中0=2a3/(a-1)。做適當的符母變換,就會發現這與我們在前面的因子B固定的例子中得到的結果相同。 在前面我們只著重關注了固定效應模型。對這種模型,檢驗統計量都是用相應的均方作分子被 MSE 除得到的。然而對於隨機和混合效應模型,檢驗統計越並不總是這樣。互動效應的檢驗統計量,即F等 MSAB/MSE,對固定、隨機和混合模型都是相同的;但對因子A 和B的F檢驗根據對a:和多的假設而變。例如,因子A 的F檢驗是 MSA/MSE 當因子 A 固定且B固定或因子A 隨機B 固定時。相反,當因子A 固定B 隨機或A 隨機B 也隨機時,因子 A的F 檢驗是MSA/ MSAB。由此可見對於隨機模型利混合模型,辨識期望均方是很重要的。 對兩因子試驗有一種特的情況需要提到:當A和B每個因子水平組合處只有一次觀測(n=1)時,我們的模型為

• 1116• 第十七章 ⋯些問定效應、隨機效應和混合效應模型的方差分析 3i=p+atBtatai 你可以從表17.20縮減的 AOV 表中看到,誤差項沒有自由度,所以沒有對互動效應的檢驗,並且視模型情況有時對主效應也可能沒有有效的檢驗。惟一可能補救的情況就是當我們能假設因子A和B間沒有互動效應時,所有的主效應可以利用模型 Y= +a+B+E 的均方誤差來檢驗,無論是固定、隨機還是混合模型。當無互動效應的假設不合理時,為「獲得互動效應和主效應的有效檢驗,試驗必須考慮在因子A 和B 的因子水平組合處進行重複(n>1)。 表17.20 縮減的 AOV 表,兩因子試驗(n=1) 來源 df A a -1 B AB (a-1)(6-1) 誤差總計 ¢b-1 對兩因子試驗用的規則同樣可用於更復雜的模型,雖然它們看來有些麻煩,但在實踐中它們簡單易用。我們將給出一個三因子試驗的例子。對於有關假設、推導和更復雜應用的更多細節,可看 Hicks, Turner(1999)和 Kuehl(1999)。 例 17.8 給出每個因子水平組合處有 =4次觀測的3×5×2析因試驗的期望均方。 將因子 A稱B視為固定,因子C視為隨機。 解答下面給出了此試驗的全模型及相應的均方表: yill=p+a+B+Y+ api + ayi +pi + apYi+ Eili] 我們將建立針對a,,c和n一般取值的均方表,然後再代入具體值。利用前面討論的規則得到的均方表見表17.21。對此均方表應用EMS規則就可得到模型中各量的期望均方。比如對 F(MSA),未被去的項見表17.22。

F i 0 4 0 0 0 1 F i 0 17.5 計算期望均方的規則•1117• 表17.21 例17.8的均方表 b F j b 0 ‘ R k c 1 0 0 1 c 1 1 1 1 衰 17.22 例17.8E(MSA)的計算 b F j R { 0 ^ R i EMS Eexta aYik R k 「1 1 1 1】 n "I 餘下項的乘積 bet 一 0 bn 0 1 braar E:Li] 0 1 ^ 0 1 n 1 從表中最後一列我們有 F (MSA) = on + onoay + bcnBn 代入 =3, =5,c=2和 =4,上式為 E(MSA)=0+200例+408A 其中 81 = ≥0312 類似可以得到因子B和C的期望均方如下 E(MSB)=0+ anoky +acnfa

和 •1118• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析 = a+120前+240日 E(MSC)=0+abrioy =8+600 計算 AB 互動效應的期望均方的表格見表17.23。MSAB 的期望均方為 E(MSAB)=c+ nospy + cnegB = c+ 4dapr +88/j 其中 146$ Bep = 2 8 表17.23 例17.8 E(MSAB)的計算 F 8i 0 b F J b 0 R k n R L c c 1 n ay aYi BY 0 Elljk] a 0 1 0 b 0 0 c 1 1 1 # n 1 在對 AC和BC 的互動效應應用EMS規則後,得到 E(MSAC)=0+ bnsay = 0+2002 和 E (MSBC)=d+ano = 0+120 同樣可以得到 MSABC 和 MSE 的期望 E (MSABC) = o+ noap 餘下項的乘積 EMS! cn8AB 一 1 品和

17.5 計算期望均方的規則• 1119• E(MSE) = 0 對這個每個單元處有3=4次觀測,因子A和B固定而C隨機的3×5×2析因試驗,表17.24是對我們根據本章講到的EMS 規則算得的期望均方的總結,其中包括了檢驗某變異來源是否顯著時有效的F檢驗的分母。 米源 A B C AB AC BC ABC 誤差表17.24 例17.8 的部分 AOV 表 FMS +200 +408A 0+120+2408 8+600 a+4op + 88AB o+200a 六+120 ∞+ 40G F 檢驗的分子 MSAC MSBC MSE MSABC MSE MSE MSE * 例 17.9 根據例 17.8,對於 Ho:0A=0和H0: =0 給出合適的F檢驗統計量解答根據表17.24 中的期望均方,很明顯H0:0A=0的檢驗統計量是F= MSA/MSAC; Ho:0=0的檢驗統計量是 F=MSBC/MSE。 對固定效應模型我們總可以獲得所有變異性來源的有效檢驗,但這一點對於某些隨機效應模型和混合效應模型卻並不一定成立。表17.25,17.26,17.27 和表 17.28顯示了幾個三因子試驗的EMS。在這些表中我們給出了那些可以進行F 檢驗的方差分量在進行F檢驗時的分母,*號說明此方差分量沒有有效的F檢驗。對隨機效應和混合效應模型中無法進行有效F檢驗的變異性來源可以建立近似的F檢驗。這些檢驗可以藉助一些計算機軟體實現一如 SAS 和SPSS。對這些檢驗的論述可見 Hicks, Turner(1999)和 Kueh!(1999).

• 1120• 第十七章—些固定效應、隨機效應和混合效應模型的方差分析米源 AB AC B: ABC 誤差來源表17.25 所有因子固定、有次復的三因子aX xe設計所有因子固定 EMS o+ Bn8n 品+ arnfn +abno 餘+ Cn0AB 品+EndAc: a+ andp: 天+ n0AR: 朵 F檢驗的分母 MSE MSE. MSE MSE MSE M$E MSE * 表17.26 所有因子隨機、有* 次置復的三因子aXbX。設計所有因子隨機 EMS 8+ nois + enobg + brsay + fxnaa o+ nola tcnoag t unok + acmoi d+ noiln + bnoiy + anopn + abmey 時+neai + cnohg a+ noi+ bnoiy Q+nose + unok o+ no r F 檢驗的分母 *** MSABC MSABC MSABC. MSE AB AC: EC' ABC 誤差米源 A B C AB AC BC AEC' 誤差表17.27 因子A、出腩機,因子C固定,有*次意復的三因子。X Xc設計 A、B隨機,C固定 EMS c+ cnoke + bones 哈+ cnsi +acnoi o+ no n + bno in + anohn + atmBes a+cnobp a+ nio er + Bmo y 時+ moaar +amok 8+noier F 檢驗的分母 MSAB MSAB * MSE MSABC MSABC MSE *

17.6 套抽樣和裂區設計•1121• 表17.28 因子A隨機,因子B、C固定,有n次量復的三因子aX Xe設計 A 隨機,B、C固定來源 FMS A B C AB AC BC ABC 誒差 a+ cnoatacnfs 好+ bno ar t atmlc o+cnok 呤+ bnaar o+ nokp tanfsc c+na F檢驗的分母 MSE MSAB MSAC MSE MSF MSABC. MSE 17.2節和17.3節說明了方差分量的估計。繼前面部分中介紹的步驟後,令均方等於期望均方,我們可得到平衡設計隨機效應和混合效應模型方差分量的估計。很多計算機軟體的程式可以實現這些計算一如 SAS和 SPSS。是對某些程序,它所施加在模型上的條件與我們用的條件,即所謂的經典條件是不同的。在這些軟體程式強加給模型的條件下,對有些固定模型得到的期望均方是不一樣的。 所以方差分量的估計值和適當的F檢驗可能會積經典條件下得到的結果不同。 不平衡設計方差分量的估計是個複雜的問題,超出了本書的範圍。對這一問題的詳細討論可見 Searle, Casella 和 McCulloch(1992). 17.6 套抽樣和裂區設計有時在試驗中一個因子是巢狀在另一個內的,可以用下例來說明這種情況。 一個醫藥公司進行檢驗以測定它們的產品在一個特定時間點的穩定性(在室溫條件下)。用了兩個製造地點。在每個地點,隨機獲取三批產品,並從每批產品中再隨機抽取十個藥片。這個設計可用圖17.2 表示如下。 地點地點內的批批內的樣品 123.10123.10123.10123.10123-10123⋯10 圖 17.2 產品批巢狀在地點內的兩因子試驗

• 1122• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析雖然這看起來像通常的兩因子試驗,因子A是地點,因子B是產品批,但是要注意到從地點1取的三批產品和從地點2取的三批產品是不同的。從這個意義上說因子B(產品批)是巢狀在因子 A(地點)裡的。在這種試驗情況下不可能衡量因子B與因子A的互動效應,因為不像析因試驗中對因子A 和B的安排那樣, 醫子B的每個水平並沒有和因子A 的每個水平都同時存在。這裡,一個地點內的三個產品批對於這個地點來說是惟一的。 因子B 巢狀在因子A 中的兩因子試驗(每個單元處有,次觀測)模型一般可寫為 i= 1,2,,a 3ik=M+ ai + P()+E j=1,2,,6 k=1,2,⋯,n 注意這個模型和 17.3節中兩因子試驗的模型相似,除了沒有互動效應項ap並且因子B的項是B),下標表示因子B的第;個水平是揪套在因子A的第;個水平裡的。此設計的方差分析表見表17.29。 表17.29 因子B巢狀在因子A中的兩因子試驗(每個單元有x次觀測)的AOV表來源 SS MS A SSA a-1 B(A)SSB(A) (-L) 誤差 SSE. ab(n-1) 總計 TSS abn-1 MSA MSB(A) MSE 固定 o+ bnoA o+ 28日 EMS 混合(A 固定) o+moy+ bndA 品+ mo 隨機 a+ nok+ bndt o+加育 AOV 中的平方和用下面的公式計算。 SSE. = TSS - SSA - SSB(A) 表17.29 中還給出了三種常見情況的期望均方,尤其要注意下面的問題: 1.因子B的F檢驗總是 F=MSBGA) MSE

17.6 套抽樣和裂區設計•1123• 2.固定效應模型中因子A的F檢驗是 F-MS MSE 但在隨機和混合效應模型中因子A的相應檢驗是 3.7 =1時,沒有因子B的檢驗,但我們可以用下式檢驗隨機和混合效應模型中的因子 A MSA F= MSBA 例17.10 研究者進行試驗以測定降低血壓用的心血管藥物中一種加膜葯片成分的一致性。他們從兩個調製地點中每一個獲取三批產品作為隨機樣本;從每批產品中隨機取五個藥片作樣本進行化驗以測定成分的一致性。資料如下: 地點 2 每個地點內的批每個批內的葯片! 5.03 5.10 $.25 4.98 5.05 2 4.64 4.73 4.82 4.95 5.06 3 5.10 5.15 5.20 5.08 5.14! 5.05 4.96 5.12 5.12 5.05 2 5.46 5.15 5.18 5.18 5.11 3 4.90 4.95 4.86 4.86 5.07 a.進行方差分析,取a=0.05。,有證據說明在成分一致性上產品批與產品批之間有變化嗎?F檢驗的進行依賴子我們對產品批固定還是隨機的假設嗎? c.對產品批做出結論。 解答 a.對這些資料我們有a =2個調製地點,每個地點有B=3個產品批以及每批中有n=5個藥片。由資料我們算得樣本均值如下:

•1124• 第十七章—-些固定效應、隨機效應和混合效應模型的方差分析地點 1 產品批 2 3 L 2 總 5.082 5.06 4.84 5.216 5.134 4.928 地點平均值 5.01867 5.068 5.04333 算得平方和如下: TSS= (5.03-5.04333)°+ (5. 10-5.04333)2+⋯+(5.07-5. 04333)2 -0.76348 SSA=15|(5.01867-5.04333)2+ (5.069-5.04333)21=0.01824 SSB(A) =5I(5.082-5.01867)2+ (4.84-5.01867) +(5.134-5.01867)2 + (5.06-5.068)2 + (5.216-5.068) +(4.928-5.068)21=0.45401 SSE=TSS-SSA-SSB(A)=0.76348-0.01824-0.45401=0.29123 這個資料集的計算機輸出結果在下面給出。注意這些平方和與我們的計算結果稍有出入,這是舍入誤差造成的微小偏離。此試驗我們將使用計算機輸出的平方和作方差分析表,見下。 米源 A B(A) 誤差總計 SS 0.01825 0.45401 0.29020 0.76246 df 1 4 24 29 M5 0.01825 0.11350 0.01209 F 0.16 9.39 CONTENT UNIFORMITY OE FTLA-COATED TABLETS General Linear Hodlels Procedure Dependent Variable:Y CONTEHYT Source Model ErTOr Corrected Total DF 5 24 29 Sum of 0.47226667 0.29020000 0.76246667 Hean 0.09445333 0.01209167 F Value 7.81 ET>F 0.0002 R-Sqvare C.V. Root HSE Y Hean

- 0.619393 2.180346 Source DE Type III SS SITE 1 0.01825333 BATHH(SITE) 4 0.45401333 Tests of Hypotheses for Hixed Hodel Analysis of Var iance Dependent Variable:Y CONTENT SourCe: SITE ErrOr: HS (BATCH(SITE)) DE Type III NS 1 0.0182533333 Source: BATCH(STTE) Error: MS(Error) Denoninator DF 4 D Type III MS A 0.1135033333 Denominator DF 24 h.,C.產品批的 F 檢驗為 Denominator HS 0.1135033333 Denominator HS 0. 0120916667 17.6 套抽樣和袋區設計•1125• 0.10996 Hean Square F Value 0.01825333 1.51 0.11350333 9.39 5.04333 HI>F 0.2311 0.0001 F value 0.1608 Pr>F 0.7089 F Value 9.3869 Pr>F 0.0001 FH MSRAA) = 9.39 MSE 其中自由度dfy =4,df=24。因為F的觀測值9.39超過了a=.05 水平下F表中的值,所以結論是在藥片成分一致性上產品批與產品批之間存在相當大的變化。 這個檢驗與產品批是否隨機無關。 到現在為止你應該已經意識到隨著巢狀效應的引入,一系列全新的試驗設計已經展開。除兩因子設計外,你還可以設想一般的多因子設計,如因子B巢狀在因子A 的水平中,因子C巢狀在因子A和B 中等等。表17.30是所有因子都隨機的三因子巢狀設計的方差分析表。 也有對這些設計的其他擴充套件。例如你可以進行一個三因子試驗,因子A和B 是交叉分類的面因子C是巢狀在因子A和B 的水平內的。這是一個部分辦棄沒汁的例子。

• 1126. 第卜七章一些固定效應,隨機效應和混合效應模型的方差分析米源 A H(A) C(A,B) 誤差總計表17.30 三因子巢狀設計的 AOV表—所有因子都是隨機的 (每單元有 n次觀測) SS SSA SSB(A) SSC(A,B) SSF TSS df MS 4-1 MISA a(b-1) MSB(A) c(c-1) MSC(A, B) chk:{n-1) MSE abcn-1 EMS o+nog+ cnog+ benoa a+neo +cnop 品+no 假設某市場調研公司要在國內四個地理區域(B,•,B)內從潛在的客戶群中抽樣以獲得他們對兩種產品(A」和A2)的意見。在每個地區隨機抽取六個銷售產品A,的商店作為樣本。在地區B,為產品 A,選的每個商店裡,採訪了十個人對產品i的意見。這個設計中,因子C(商店)是巢狀在因子 A(產品)和因子B(地區) 的水平內的,並且巢狀在因子A、B水平內的因子C每個水平處都有n=10次觀測 (意見)。 遇到巢狀和部分巢狀設計的可能性是無窮盡的,但是遺憾在此處我們沒有機會分析它們。感興趣的讀者可以參考 Kuehl (1999)和 Montgomery(1997)以獲得對這個問題的更多處理方法。但是我們要考慮一個與部分巢狀設計類似的常用設計。它被稱為毅區設計,這是因為它起源於農業試驗。我們用一個例子說明它的用途。 要比較兩種不同的肥料水平下三種大豆的產量。如果我們想要在肥料和大豆品種的每個組合處得到n=2次觀測,就需要有12塊相同尺寸的地。將肥料作為因子A,大豆品種作為因子T,一種可能的設計方法是完全隨機化設計中的標準2 X3析因試驗,每個因子水平組合有n=2次觀測。但是因為向地裡施肥是在準備播種土地時進行的,所以(邏輯上)很難在每塊地裡種上要求的大豆品種之前就把肥料 A,先施加到由因子A和決定的六塊土地上再把肥料 A2施加到另六塊土地上。 一個更易於執行的設計是將每種肥料施加到兩“整塊”土地上,然後在每整塊地內將三種大豆種在三“小塊”地上(與前面設計中每塊地的尺寸相同)。這種設計如圖17.3所示。 此設計稱為裂區設計,設計中有兩階段隨機化。首先,因子A(肥料)的水平是隨機分到整區中的;其次,因子T(大豆)的水平是隨機分到整區中的小區上的 (見圖17.4)。利用這個設計更容易準備土地,將適當的肥料施加到整區上,然後再將大豆種到小區上;而不是準備肥料,先將肥料施加到小區上然後再將大豆種到小區上,就像標準的2×3析因試驗中那樣。

17.6 套抽樣和裂區設計•1127• Ai 整塊地 T Ts Az 整塊地 2 T ™ T 整塊地 3 圖17.3 裂區設計整區虀塊地 4 Ta 1 Aj 2 Az 3 Az 4 (a) 整區 1 Tz 2 3 4 Tz Ts Ts (b) 圖 17.4 完全隨機化裂區設計的兩階段隨機化因為在整區水平上和小區水平上的隨機化都是依據完全隨機化設計進行的, 所以此設計通常被稱為完全隨機化裂區設計。 考慮因子A 有a個水平,因子T有:個水平並且因子A的第;個水平處有n 次重複的完全隨機化裂區設計的模型。若y表示因子A的第;個水平因子T的第j個水平處的第次的響應,則 Yil + ai+ t; t arii + Sik + Eik 其中 •

•1128、 第十七章•些固定效應、隨機效應和混合效應模型的方差分析 a1:因子 A第i個水平的固定效應。 v:因子T第;個水平的固定效應。 atj:因子A第;個水平因子T第;個水平的固定效應。 0派:接受A 的第;個水平的第整區的隨機效應。&獨立,服從均值為0方差為哈的正態分佈。 互獨立的。 此設計和模型的 AOV 表見表17.31。 來源整區之間 A 整區誒差整區內 T AT 小區誤差總計 SS 表17.31 憲全隨機化裂區設計的 AOV d EMS SSA SS(A) 4-1 a (m1> o+ 60g+ En8A o+t SST SSAT SSE TSS (:-1) (-1)(1) 4(n 1(1) an$~1 a+aner 品+n8AT 當然可以用標準的公式計算 AOV中的平方和,但是我們建議利用計算機輸出結果得到它們。根據期望均方我們有下面的分析。 燅區分析 Ho:0A = 0(或等價於Ho:所有a:=0),F = MSA MS(A) 小區分析 Ho:0AT= 0(或等價於H0:所有oE=0), F- MSAT MSE Ho: 0r = 0(或等價於H0:所有z;=0),F-M MSE 此設計的一個變化是引入一個區組因子(比如農場)。對我們的這個例子,可能會有6=2個農場,每個農場有。=2塊整塊地,每整塊地分為:=3塊小塊地; 見圖17.5。因為整塊地的隨機化遵從隨機化區組設計,而每整塊地內的小塊地的隨機化遵從完全隨機化設計,所以這個設計常被稱為隨機化區組裂區設計。

17.6 套抽樣和裂區設計•1129• 區組 1 Az 2 T Tz T A2 Tz Ts 圖17.5 隨機化區組袋區設計這種更一般的有b個區組的兩因子裂區設計的模型: yik =Htai+B+ apy + Ek t arik + Eik 其中3:表示在第;個區組內因子A 第;個水平因子第個水平處的測量值。 引數ai,Tk和 aznk就是通常兩因子試驗中主效應和互動效應的引數;而B,是區組j 帶來的效應,ap,是第;個區組和因子A的第;個水平之間的互動效應。此模型的分析見表 17.32。此處我們假設因子A和T 是固定效應而區組是隨機的。 表17.32 隨機化區組裂區設計的 AOV(A,T 周定:風組隨機) 來源 SS df EMS 整區之間區組 SSB a+at A SSA a-1 AB(整區誤差) SSAB (a-1)(6-1) 整區內 T AT 小區溴差總計 SST SSAT SSE TSS (:-1) (a-1t-1) a(-1)(-1) abt-1 o+ abfr 0+ B8AT 表17.32中列出的各變異性來源的平方和是利用析因試驗中主效應和互動效應的一般公式或者合適的軟體包得到的。透過期望均方,我們可以得到分析中的大塊地部分裡對因子A 的有效F檢驗以及小塊地部分對因子T 和AT 互動效應的F檢驗,如下所示。注意沒有對區組帶來的變異性的檢驗。

• 1130• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析盩區分析 Ho:0, =0(或等價於Ho:所有a:=0),F= MSA MSAB 小區分析 Ho:0Ar=0(或等價於 Ho:所有 aTiA = 0), F= MASAT MSE Ho:Or =0(或等價於 Ho:所有 k=0),F= MST MSE 例 17.11 6=3個區組的兩因子裂區設計中的大豆產量如下(以每小塊地為單位,按蒲式耳計)。肥料(因子A)隨機地施加到每個農場內的整塊地上,然後將大豆種類 《因子 T)隨機地分配到每蹩塊地內的小塊地上。利用下面的樣本資料進行方差分析。給出每個檢驗的大約的p值。 1 肥料 2 肥料 3 肥料 - • 種類 I 2 3 1 10.6 11.4 11.8 種類種類 2 10.9 11.7 12.4 2 3 1 1 11.9 12.6 11.6 2 11.5 12.1 10.8 3 1 2 1 9.5 8.1 8.7 2 9.8 8.2 9.3 解客對這些資料有a=2,6=3,1=3和 =1,平方和如下(根據下面計算機輸出結果中的 Type I11 SS 列): SSA=0.845 SSAT=0.00333 SSB=28.863 SSE=0.227 SSAB=0.0433 TSS=35.325 SST=5.343 SPL.IT-PLOT DESIGN: NHIOLE PLOT TRT-FERT AND SEL.T-PLOT TRT-VARLEIY General Linear Nocels Procedure Dependent Varieble:Y YIBLD Source Sum of Squarea Hean Square E Value • Er>E

17.6 套抽樣和裂區設計•1131• Hodel Error Corrected Total 9 8 17 35.0983333 0.2266667 35.3250000 3.8998148 0.0283333 137.64 0.0001 B-Square 0.993583 C.U. 1,570685 Root NSE 0.16833 YMean 10.7167 Source F B B*F DF 1 2 2 2 2 Tye III SS 0.8450000 28.8633333 0.0433333 5.3433333 0.0033333 Mean Sguare 0.8450000 14.4316667 0.0216667 2.6716667 0.0016667 E value 29.82 509.35 0.76 94.29 0.06 Pr>E 0.0006 0.0001 0.4967 0.0001 0.9433 Dependent Variable:Y YIELD Tests of Hyrpotheses using the Type III SS for B * F as an error tezm Source F DF 1 Type III ss 0.84500000 Mean Square 0.84500000 F value 39.00 Pr≥F 0.0247 方差分析表為: 來源 𤨣塊地之間區組 A AB(整塊地誤差) 整塊地內 T AT 小塊地淏差總計 SS df MS F 28.863,845 .0433 2 1 2 14.431 0.845 .0217 39.00 1 .0247 - 5.343 .00333 .227 35.325 2 2 8 17 2.672 -00167 •0283 94.29 .060 1 .0001 •9433 此處的兩因子裂區設計和第十五章討論的標準兩因子設計的區別在於隨機化的過程。在裂區設計中,隨機化的過程分為兩個階段:首先在每個區組內將因子 A 的水平隨機分配到整區中,然後再將因子B的水平隨機分配到每區組內每整區

• 1132• 第十七章一些固定效應、隨帆效應和混公效應模型的方差分析裡的小區單元中。相反,在隨機化區組設計的兩因子試驗(見15.3節)中,隨機化僅是一步過程:在每個區組中直接將處理(即兩個因子的因子水平組合)隨機分配到試驗單元中。包括有均值分解、比較,處理均值的估計和置信區在內的AOV 後的分析對於裂區設計來說比我們前面討論過的設計更為複雜。關於這方面, Kuehl(1999), Snedecor 與 Cochran(1980)和 l.entner 與 Bishop(1993)都是很好的參考書. 17.7 小結就線性模型來說固定、隨機和混合效應模型是很好區別的。固定效應模型是將響應變望和k≥1個獨立變數及一個隨機分量聯絡起來;而隨機效應模型則是 =0且有不止一個隨機分量的一般線性模型。至於混合模型,它是固定效應和隨機效應模型的組合體,將≥1個獨立變數以及多於一個的隨機分量聯絡起來。 我們舉例說明了隨機效應模型在完全隨機化設計和a X6 析因試驗等情況下的應用,指明瞭隨機效應模型和其相應的固定效應模型在進行方差分析中顯著性檢驗時的類似之處。我們利用4X6 析因試驗舉例說明了從固定模型的方差分析中得到的推斷。 遺憾的是,在入門課程中只能對隨機和混合效應模型進行有限的討論。為了充本課中的討論,第17.5節給出的結論在推導平衡設計方差分析表中各變異性來源的期望均方時是很有用的。利用這些期望值,我們可以嘗試構建適當的檢驗統計來檢驗模型中任何固定效應或是隨機效應的顯著性。 關於隨機或混合效應模型的各種問題中,最難的部分在於試圖估計E(y),以及給出在隨機效應模型時給出其適當的置信區間,或給出在混合模型時對於固定效應的某些水平或水平組合處y的平均值。我們舉例說明了如何得到隨機效應模型中E(y)的估計以及如何構建適當的置信區間。在混合模型中這個問題則變得更為複雜。 本章最後涉及到的題目是套設計和裂區設計,簡單介紹了第十五章中討論的和本章前面幾節討論的基本析因試驗的幾種變化。當在多因子試驗的框架中需要考慮巢狀效應時,有很多更為常見的設計,而此處提供的設計只是其中的幾種。感興趣的讀者可以查閱本書後面的參考資料,更詳細地繼續這個主題;特別 Kueht (1999)是很好的參考書。 補充練習 17.8 17.9 辨別0 (當因子A固定)的意義和 (當因子A隨機)的意義。 考慮一個n=5次觀測的2×3×4析因試驗。假設因子A的水平是

17.7小結•1133• 固定的而因子B和C的水平是從水平的總體中隨機選出的。 #. 寫山此試驗的模型。確定模型中各的意義並說明加在各過上的條件。 b. 構建部分 AOV 表,要包括自由度和所有變異性來源的期望均方。 c.給出對變異性來源顯著性所做的所有適當的F 檢驗的均方比值。 17.10 考慮一個 =6次觀測的3×4×2析因試驗。假設因子A 和B的水平是固定的而因子C的水平是從水平總體中隨機選出的。 8.寫出此試驗的模型。確定模型中各量的意義並說明加在各量上的條件。 b. 構建部分 AOV表,要包括 df 和所有變異性來源的期望均方。 c.給出對變異性來源顯著性所做的所有適當的F檢驗的均方比值。 17.11 考慮一個n-4次觀測的3×5X5析因試驗。假設因子B的水平是固定的而因子A和C的水平是從水平總體中隨機選出的。 2.寫出此試驗的模型。確定模型中各量的意義並說明加在各量上的條件。 b.構建部分 AOV 表,要包括 df 和所有變異性來源的期望均方。 c.給出對變異性來源顯著性所做的所有適當的F檢驗的均方比值。 17.12(環境)參見練習17.6。假設這四種化學制劑是從數百種用於控制火蟻的化學劑中隨機選出的。研究者想要確定一種化學制劑控制火蟻的效力是否隨不同的環境變化。 8.寫出此種情況的適當模型。說明施加給此模型中各量的條件與當這幾種化學制劑是僅有的研究者關心的化學制劑時的模型中的條件有何不同。 b.建立 AOV 表,並檢驗所有相關的假設。 c.將得到的結論和推斷與練習17.6 中得到的做比較。 17.13 參見練習17.12。 a.哪個模型和分析更合適?解釋你的答案。 b.哪種情況下固定效應模型更合適? c.給出那些可以用精確F 檢驗進行檢驗的變異性來源的檢驗統計量。 17.14(工程) 某大學的土術工程系得到一大筆資助研究校園內的交通問題, 並且要提出可供選擇的解決方案。此研究的一小部分是要對每日穿過校園而又不使用學校設施的汽車計數。為此,在每個入口處安置一組志願者,以記錄每輛透過檢查點汽車的牌照號和它進入或離開的時間。透過比較所有檢查點的資料清單, 並給汽車穿過校園留出一段合理的時間,組員們就可以確定在上午8:00到下午 S:00間穿過校園而又不用校園設施的汽車數量。從一學年中隨機抽取6周做樣本,每週內取中間的兩天。交通流的資料如下。

• 1134• 第十七章 —些問定效應、隨機效應和混合效應模型的方差分析局1 680 618 間2 438 520 局3 $39 600 周4 264 198 周5 693 646 周6 530 575 8.寫出適當的線性統計模型,確定模型中各頂的意義。 b.進行方差分析,標明期望均方,取&=0.05。 17.15 參見練習17.14,估計隨機選出的一週中間的一天內穿過但不使用學校設施的汽車的平均數目,並給出大概的置信區間。(規示:參見例17.1) 17.161醫藥)設讓了一項研究來考察新的治療方法在降低高血壓病人的收縮壓時的效力。選出三種藥品(D1,D2, D3)進行考察;還有很多種用於降低血壓的非藥物治療方法,包括節食、鍛鍊、生物反饋等方法的各種組合,研究者隨機地選出了三種非藥物治療方法(ND1,ND2,ND3)用於研究。病人的年齡通常會阻礙各種治療的效力,所以,高血壓病入被分成了兩個年齡組(AI,A2)。54 個病人被分到這兩個年齡組並被隨機指定一種藥物和一種非藥物治療的組合。在參加研究2個月後,記錄下了每個病人收縮壓比研究剛開始時血壓讀數的減少。下表給出了這些值。 藥物藥物 D2 藥物 D3 NDI 33 34 35 46 45 46 •38 34 37 年齡組 A1 非藥物 ND2 37 38 36 44 48 49 45 45 44 ND3 41 42 39 43 44 45 36 37 35 ND1 34 33 38 47 49 45 年齡組 A2 非藥物 ND2 48 46 39 35 44 48 46 46 47 44 ND3 44 46 49 44 46 41 38 36 35

17.7小結•1135. a.寫出此研究的模型,確定模型各項的意義並闡明各項必須滿足的條件。 b.建立 AOV表,要包括期望均方。 c.檢驗所有有關的變異性來源的顯著性,取a=0.05。 d. 關於藥物和非藥物治療方法的組合在治療高血壓時的效果是否有差異,你能做出什麼結論? 17.17 參見練習15.3。假設我們認為這五個研究者是從可以從火箭推進試驗的所有研究者總體中隨機選出的。 a. 寫出適當的線性統計模型,確定各量的含義並列出假設。 b.進行方差分析,在方差分析表中要包括期望均方列。 17.18 參見練習17.17。對固定效應和隨機效應模型,指出檢驗的假設之間的區別和結論之間的區別。 17.19 參見練習15.42。假設這兩個實驗室是從參加研究的實驗室總體中隨機選出的,同時時間和溫度也是變異性的可能來源。 a.計算所有變異性來源的期望均方。 b.檢驗所有變異性來源的顯著性,取&=0.05。 c.比較此處得到的結果和練習 15.42 中得到的結果。 d.把實驗室的效應看為隨機效應比把它看為固定效應更合適嗎?解釋你的答案。 17.20 參見練習 15.32。假設這五種窗格設計是從研究中窗格設計的總體中隨機選出的。 8.計算所有變異性來源的期望均方。 b. 檢驗所有變異性來源的顯著性,取&=0.05。 c.比較此處得到的結果和練習15.32 中得到的結果。 e.把窗格設計的效應看為隨機效應比把它看為固定效應更合適嗎?解釋你的答案。 17.21 參見練習 15.28中描述的研究。 2.認為這九種藥物是從可能使用的葯物總體中隨機選出的,寫出此時研究的模型。 b.給出所有變異性來源的期望均方。 c.說明你的分析和結論相對於練習15.28 中的會如何變化? 17.22(工程)在將計算機晶片焊牢在飛機導航系統的主機板上時,影響焊接的兩個最關鍵的因素是插人焊料使用的機器以及操縱機器的操作員。從公司工廠的很多種機器和很多操作員中隨機選出了四種煒接機器和三個操作員。每個操作員都用四種機器的每一種做兩次焊接,得到的焊接強度資料如下。

• 1136•