AI 新聞與投資
統計學方法與資料分析引論

第十七章一些固定效應、隨機效應和混合效應模型的方差分析

30 / 34

機器操柞員 1 1 204 205 2 205 210 3 203 204 4 205 203 2 205 207 205 206 206 204 209 207 3 211 209 207 210 209 214 215 212 日.寫出此研究的模型,要包括模型中的各量以及各量需滿足的條件。 b.給出AOV 表,要包括期望均方。 c.對於機器和操作員對焊接強度變異性的效應,你能得到什麼結論? 17.23 參見練習17.22。 a.估計此研究中的方差分量。 .對焊接強度的總變異性,按比例分配給各變異性來源。 c給出平均焊接強度的95%置信區間。 17.24(環境)對一個地域能否進行煙煤的表層開採做調查,從這個地域的六個地點分別取得了岩心土壤的樣本。將每份岩心樣本再分為四個子樣本以進行樣本中硫含量的獨立的分析。 a.該設計是什麼設計?給出這個試驗的模型。 b. 給出 AOV 中的變異性來源和各量的自由度。 17.25 練習 17.24的樣本資料如下。進行方差分析並給出結論,取a=.05。 分析地點 1 2 3 4 5 6 1 15.2 13.1 17.5 18.3 12.8 13.5 2 16.8 13.8 17.1 18.4 13.6 13.9 3 17.5 12.6 16.7 18.6 14.2 13.6 4 16.2 12.9 16.5 17.9 14.0 14.1 17.261工程)藥片硬度是同一種藥品的不同配方之間的一個比較指標:一個配方中成分的某些組合(除去能起作用的藥物外的成分)可能會導致藥片比的別的

17.7小結•1137• 組合時硬度更高。假設隨機地選出一個配方下的三批產品用於研究。從每批產品中都隨機選出三份1-kg 重的藥片的樣本,再從每份1-kg 樣本中隨機選出7片藥片做檢驗。硬度的讀數見下。 梯本 1 85 94 91 98 85 96 93 產品批1 2 76 87 90 91 產品批2 產品批3 94 96 3 95 98 94 96 99 100 93 1 71 85 78 68 85 67 76 a.指出該設計是什麼設計。 b.給出適當的模型和假設。 c. 給出 AOV 中的變異性來源和自由度。 d.進行方差分析並對此研究中的配方的藥片硬度資料做出結論。取a=.05。 17.27(心理學)一名研究者正在設計一個試驗來比較一種肉製品的九種不同配方。一個因子F是肉中的脂肪含量(10%,15%,20%);另一個因子C是點制方法(電烤,火烤、油煎)。她準備好九種組合中每種的樣品,讓品嚐者根據各種標準給這些樣品打分。研究中有四個品嚐者;每個品嚐者要嘗九個樣品。品嚐者和品嚐者之間有差別,但是樣本被品嚐的順序對得分不會有影響。樣品將用如下方法來準備以保證可以得到肉製品的樣品同時可以為品嚐者保溫。將脂肪含量為 10%的肉製品分為相同的三份,然後每種烹製方法被隨機地分配到一份上。對下脂肪含量為15%和20%的肉製品重複這個過程。然後由一個品嚐者品嚐這九個樣品並給它們打分。對其他三個品嚐者重複這整個過程。得到的分數如下。 品嚐者品嚐者1 品嚐者2 品嚐者 3 品嚐者4 脂肪含量10% 電烤火烤 75 79 61 65 75 78 73 76 油煎 82 74 79 78 脂肪含量15% 電烤火烤 78 82 65 73 80 82 75 81 油煎 81 80 83 90 — 脂肪含量20% 電烤火烤 81 85 75 81 87 88 86 92 油煎 87 85 92 93

•1138• 第十七章一些固定效應、隨機效應和混合效應模型的方差分析 a.指出該設計的型別。 b.給出適當的模型和假設。 e.給出 AOV 中的變異性來源和自由度。 d.進行方差分析並對脂肪含量和烹製方法對肉製品味道的效應做出結論,取 &=0.05。 下面給出了此資料集的計算機輸出結果。 General Linear Models Procedure Class TASTER FAT METHOD Levels Values 4 1234 3 10 15 20 3 BA BR F Dependent Variahle:Y SCORE Source Hodel Error Corrected Total DF 17 • 18 35 R-Square 0.849286 Source T F T*E M F*M D 3 2 6 2 4 Level of HETHOD Sim of Sguares 931.666667 165.333333 1097.000000 c.V. 3. 780508 Type III ss 291.888889 146.000000 451.777778 32.166667 9.833333 Level of FNT N 10 10 10 15 15 15 20 20 20 BA BR F 既 BR F BA ER F 4 4 4 4 4 4 4 4 4 MEAN SCORE. 80.75 78.75 81.25 80.25 79.00 0.00 84.25 B3.25 85.25 Mean Square 54.803922 9.185185 Root MSE 3.03071 Hean Square 97.296296 73.000000 75.296296 16.083333 2.450333 FAT MEAN SCORE. 10 80.25 15 79.75 20 84.25 F Value 5.97 Pr>E 0.0002 Y Mean 80.1667 F value 10.59 7.95 8.20 1.75 0.27 PI>E 0.0003 0.0034 0.0002 0.2019 0. 8949 METEOD MEAN SCORE BAKE 81.75 BROIL 80.33 FRY 82.17

第十八章 18.1 引言和紫例 18.2 有重複觀測的單因子試驗 18.3 一個因子有重複觀測的兩因子試驗 18.4 交叉設計 18.5 小結重複測量與交叉設計 18.1 引言和案例本書中到目前為止所討論的所有試驗(配對差異試驗除外)中,我們都假定在每一個試驗單元上只有一個觀察值。例如,在一個比較三種不同的心血管藥物對於血壓影響的試驗中,我們可以使用一個單因子試驗,其中7」個患者指定使用藥物1,12個患者指定使用藥物2,73個患者指定使用藥物了。此時,模型為 Y=H+&+E 其中&:是藥物:的(固定或隨機)效應,e表示用藥物之治療的第;個患者的隨機效應。對於這個設計,從每個患者我們只能得到一個觀測值。 許多從事應用研究的實際工作人員從費用和效率的角度出發,認為應該從每個試驗單元獲取多於.一個的觀測值。比如,在進行臨床研究時,尋找滿足研究要求並且願意參加臨床試驗的患者往往很困難。因此,一旦找到了適當數量的患者,盡可能多地從這些患者獲取資訊這一點是很重要的。在這一章中,我們將考慮幾種不同的包含一個或多個因子以及重複觀測的試驗。 在交叉設計的試驗中,每個研究物件接受所有的處理。這種研究中的單個對象用做區組,從而降低了試驗的誤差。與每個物件只接受一個處理的設計相比,這種設計提高了處理比較的精度。在復觀測設計的試驗中,隨著指定的處理的執行,在:個不同的時間點上,我們獲得,次不同的觀測的值。這樣的試驗由表 18.1表示,其中Y 表示第j個忠者用第;種藥物治療時第次的觀測值。注意, 對於每個患者,我們有:≥1個,而不是1個觀測債。 對同一個研究物件在不同時間進行多次觀察,往往比每一次都對不同的物件進行觀察能更有效地利用試驗資源。比如,需要較少的研究物件,從而降低試驗費用。再如,可以得到很精確的時間趨勢的估計。本章中所給出的方法,既可以分析從交叉研究中得到的資料,也可以分析從重複測量研究中所得到的資料。這兩種設計的應用背景都非常寬闊,其應用廣泛存在於製藥工業、研究開發和多數工業的製造過程中。藥物研究者、生態學研究者以及其他眾多研究領域中的工作者都要

•1140、 第十八章重複測量與交叉設計評估時間的趨勢,因此會發現重複測設計是有用的。在研究中,當資料中的時間趨勢代之以空間關係時,這些設計的擴充版本可能會是適宜的。這樣的一個例子有帶狀煤田的勘測,石油溢漏效應的評估和工業設施周圍空氣汙染的評估。對於在空間中有重複測量的研究,其模型一般來說比本章中所研究的時間趨勢更加復雜。關於空間資料的模型的進一步的內容,可以在 Ripley(1976),Haining(1990) 機 Cressie(1993)中找到。 表18.1 每個息者蘆復的時間點藥物 1 2 3 1 Y111 Yimg y21: 32m21 2311 Y3mg! 2 Y112 112 Y212 yin2 3312 … … … … … Y1 yiny! Y21 331 下面的案例說明了如何在有重複測量的設計中評估時間趨勢。 案例:石油洩漏對植物生長的影響我們在第六章中考察了這個案例的一小部分。1992年1 月7日,一條地下輸油管道破裂,引起得克薩斯州 San Patricis 縣 Chiltipin Creek地區一片溼地的汙染。 清除工作包括燃燒這片溼地上的汙染區域。為了評估溢油對這片溼地上植物的影響,研究人員設計了一項關於在按照某種方案燃燒後植物生長情況的研究。在一篇沒有公開發表的得克薩斯A &M大學的博士論文中,Newtan(1997)描述了研究者們就 Distichlis spicata,一種對該溢油地區非常重要的植物的發現。 資料收集的設計對於研究人員來說,兩個重要的問題是: 1•溢油和燃燒以後,有油的地區是否恢復了? 2.實現恢復花了多長時間?

18.1 引音和案例 • 1141• 為了回答這些問題,研究人員需要有一個基點,以作為在燃燒數月後溢油地區的 Distichlis spicata 密度比較的參照。這種植物的密度依賴於土壤的特徵,土地的斜度,環境條件,天氣以及許多其他因素。研究人員挑選了附近一片士地,以作為對照。這塊土地沒有受到溢油的影響,但又與溢油地點有相似的土壤和環境條件。 在溢油地點和對照地點,各隨機選擇了 20塊土地,在經過了9個月以後,大約每三個月觀測一次,共觀測了8次。在這期間,分別記錄了這40 塊土地上 Distichlis spicata 的數量心這個試驗的設計是重複觀測設計,有兩個處理,即溢油地點和對照地點,每塊土地有8次觀測,歷時兩年。為了回答研究人員的那兩個問題,我們將利用 Distichlis spicata 的數。因此,我們的研究假設可敘述如下。 研究假設! 研究期間,溢油土地和對照土地上 Distichlis spicata 的平均密度有無差別? 研究假設2 研究期間,Distichlis spicata 的平均密度有無顯著的趨勢? 研究假設3 溢油土地和對照土地上的趨勢是否一致? 資料的聱理資料包括各塊對照土地和燃燒後的(溢油)土地上8次觀察的 Distichlis spicata 的植株數量,總共有320個資料值。研究人員為確定在現場記錄的資料中是否含有明顯的錯誤,對資料進行了檢查。起初,研究人員決定刪除第1 和第20塊對照土地,因為在1992年10月期間觀察到植株數量很少。然而,為了不使抽樣計劃產生偏差,他們最終還是保留了這兩塊土地。然後,按照2.5節中談到的步驟,資料被轉化成計算機檔案,為分析資料做好準備。資料在表18.2 中給出。 處理燃燒地塊 1 2 3 4 5 6 7 8 9 表18.2 兩種處理下 Distichlis spicata 的數量 1992年1993年1993年1994年1994年1994年:1994年1995年 10月 7月 10月 1月 4月 7月 10歲 1月 27 25 18 21 26 22 20 27 5 15 10 12 10 11 12 17 26 26 25 9 15 10 14 17 41 41 42 38 34 26 26 25 25 28 22 27 24 16 18 23 11 24 13 20 16 13 10 14 37 40 33 31 32 30 25 31 38 38 33 38 39 35 32 38 31 33 25 30 28 21 17 19 .

• 1142• 第十八章重複測量與交叉設計處理燃燒處理對煦地塊 10 11 12 13 14 15 16 17 18 19 20 地塊 12 3 10 11 12 13 14 15 16 17 18 19 20 續表 1992年1993年1993年1994年1994年1994年1994年1995年 10月 7月 10月 1月 4月 7月 10月 24 25 21 24 24 19 17 22 27 31 30 32 30 25 26 45 39 35 35 36 30 32 38 34 45 41 28 31 35 37 35 42 35 32 27 26 23 19 18 21 13 11 22 29 24 24 20 16 18 50 54 $6 60 51 $2 49 17 29 23 39 31 24 26 25 37 29 32 28 14 13 33 39 39 48 36 34 30 1月 22 34 27 31 29 19 24 $2 34 24 34 1992 年 1993年 1993年 1994年 1994年1994年 10月 7月 10 月 1月 4月 7月 7 $7 43 43 59 42 35 40 24 42 16 54 30 47 40 11 41 50 8 0 0 46 59 53 55 48 42 51 52 49 31 58 43 50 40 23 45 52 49 59 52 59 50 50 53 $4 50 39 60 43 60 47 27 42 55 51 60 53 60 48 55 57 $9 54 47 60 47 60 49 31 44 53 12 48 58 53 54 43 41 53 57 51 24 54 39 54 43 17 41 45 0 43 53 53 47 37 40 38 55 44 22 51 36 52 41 19 33 42 5 0 1994年 1995年 10月 1月 0 0 40 40 $5 $8 52 54 54 53 38 38 44 45 43 36 57 39 39 41 33 35 48 51 49 56 57 57 48 52 24 29 31 42 35 51 8 10 0 0

18.1 引言和案例 • 1143 資料的分析研究的下一步是概括資料並畫出資料的圖。按處理和日期計算的平均植物數量見表 18.3。 處理燃燒後對照植物數量 604 50+ 401 30+ 20+ 10+ 01 日期植物數量 60+ 50+ 40+ 30+ 20+ 1001 日期表18.3 按處理和日期計算的平均植物數量 1992年1993年1993年1994年1994年1994年1994年1995年 10月 7月 10月 1月 4月 7月 10月 27.20 32.65 28.60 31.95 28.90 24.10 22.55 34.45 40.25 42.80 45.10 39.05 35.55 37.75 1月 26.65 39.35 一—* 白6早白白中中 0 0 對照對照 0 fe 3 對照 4 對無 5 對照 6 對照 0 •• 7 對照 0 - 8 對照 0 0 * 燃姥燃燒燃燒 4 燃燒燃燒嫩燒圖 18.1 按處理和日期畫出的植物數量的盒形圖燃嬈 8 燃嬈第十八章重複測量與交叉設計對」每一個日期和每一個處理,植物數量的盒形圖如圖18.1所示。這些盒形圖表咧,對照地塊的植物數量的中位數比溢油地塊的相應值來得大。然而,對照地塊之間的差別比溢油地塊之間的差別大一些。這可能是由於在溢油地塊上進行燃燒處理的緣戰,燃燒通常使得各地塊的條件比燃燒前更加一致。要知道這一點能公腰全地塊的總體而不僅僅是對於在研究中觀測到的地塊,需要對資料擬合模型,並檢驗相應的統計研究假設。我們將在討論一般重複觀測設計的分析方法之後,在本章的米尾再對這些資料進行分析。 18.2 有重複觀測的單因子試驗在上一節,我們討論了為什麼會需要對每個患者有一個以上的觀察值。對每個患者需要有一個以上觀察值的另一個原因是不同患者之同的變異性常常比同一個患著上的變異性大得多。我們在6.5節配對:檢驗的例子中曾經看到過這一點。如果是這種情況,那麼把患者作為區組,給每一個患者每一種治療可能要好些。這樣,藥物之間的比較是患者內的比較,而不是像給藥物;指定n;個不同的忠折的單因子試驗中那樣,比較是在患者間的。反映這種患者內比較的特性的單監子試驗可由表18.4表示。 衰18.4 藥物1,2,3 的應考內的比較患者藥物 1 - 2 ¥12 n Yi* 2 Y21 ¥22 3 YH 832 …• 331 企這個設計中,對,個患者中的每一個,都依次安排了這三種藥物。在一個給定的治療時期,一種藥物被安排給一名患者。在經過一個充分長的“清洗”時間後,再安排另外一種給該患者。重複這個過程,直到這名患者接受了所有三種藥物的治療。三種藥物治療的順序是隨機安排的。該設計中的關鍵是兩種藥物治療之間的清洗時間要充分長,使得一種藥物的結果不影響另一種藥物的結果。 由此,我們可從每一位思者得到多一個的觀測值,並設想對於研究中的三種約物能得到更多有用的資訊。對於這樣的試驗,一個模型為

18.2 有重複觀測的單因子試驗 •145. +a+玩+5 其中:為總平均響應,a:為第;種藥物的效應,T;為第;個患者的效應,Ej為接受第:種藥物治療的第;個患者響應的試驗誤差。 注意,這個模型看上去與任何其他有a種藥物和n個患老的單因子試驗的模型沒什麼兩樣。然而,模型假設是不同的,因為我們從每個患者得到多於一個的觀測值。對於這個模型,我們做如下假設。 1.a:是一個常數,並且Za;=0。 2. 諸;是相互獨立的,並且服從正態分佈(0,品)。 3.諸ei與諸n;是相互獨立的。 4.諸服從正態分佈(0,)。 5.各個ei間的相關關係如下: 對於j,E和e 是獨立的。 也就是說,從同一名患者觀測到的兩個觀察值是相關的,而從不同患者觀測到的觀察值是相互獨立的。由這些假設可以得出,3的方差為 +。一個更進一步的假設是從患者;觀測到的任何兩個觀察值y;和v:的協方差是一個常數。這些假設可以視為對觀察值的方差-協方差矩陣的要求,此時的協方差矩陣具有複合對稱性。有關相關觀察值的討論超出了本書的範圍,有興趣的讀者請參考Kuehl (1999)以及 Vonesh and Chinchilli(1997)。 衰18.5 表18.4 中給出的試驗的方差分析表來源患者間忠者內 A 誤差總和 SS SSP df -1 EMS(A 固定,忠者隨機) 8+aok SSA SSE TSS -1 (a-12(n-1) an -1 o+nla 這種試驗設計的方差分析和上述這一組假設由表18.5給出。讀者當熟記在心。當假設成立,從而符合對稱性成立時,可以對因子 A的效應進行統計檢驗(F =MSA/MSE)。然而,要使得用 F=MSA/MSE 檢驗因子A的效應的F檢驗有效,還有更為一般的條件。那麼,上述假設有多麼苛刻呢?怎樣才能知道何時檢驗是適宜的呢? .

• 1146• 第十八章重複測量與交叉設計對這些問題沒有簡單的答案,因為沒有簡單的方法可用來檢查複合對稱性。 上述提到的使得因子 A的F 檢驗有效的更為一般的條件(稱為 Huynh-Feldt 條件)常常由於從同一患者觀測到的時間相較近的觀察值之間的相關性比相距較遠的觀察偵之間的相關性來得強而不能得到滿足。所以,使用時需當心這一點。 一般來說,當方差-協方差矩陣沒有複合對稱性時,因子 A 的F 檢驗會有一個正偏差,這將導致拒絕Ho:所有a:=0的可能性比決定臨界 F-值的檢驗水平高一些。 從實用的角度看,在一個給定的試驗環境下,最好的辦法是確保在實施兩個不同的治療之間留出充分的時間,以清洗(或擺脫)前次治療的影晌,同時確保這種設計僅儀應用於疾病相對穩定的情形,以保證在接受治療和清洗以後,每個患者(或試驗單元)基本上和接受治療前一樣。例如,即使在研究降血壓藥的效果時,我們也期望高血壓症足夠穩定,患者在接受「第一種藥物治療並經過清洗階段以後,在繼續接受第二種指定的藥物治療前,其血壓能夠恢復到用藥前的水平,如此等等。 在18.3中,我們還將繼續討論如何判斷使檢驗有效的假設是否成立,以及當這些假設不成立時,我們應該怎麼辦。關於這方面的進一步的內容,請參閱含有對重複觀察試驗進行細緻討論的更高水平的教科書(如 Kuehl (1999)以及 Vonesh and Chinchilli(1997))。 18.3 一個因子有重複觀測的兩因子試驗我們可以把有重複觀測試驗的討論推廣至兩個因子的情形。例如,在比較心血管藥物的降血壓的效果時,我們可能隨機化患者,使得n個不同的患者接受三種藥物的每一種。然而,不是使每一個患者接受每一種藥物,而是我們可能對於每一個患在一定時間段內測量多次。例如,我們可能希望在患者服用指定的藥物之前的一刻測量他的血壓,然後在服藥後的第一個小時內每15分鐘測量一次,在接下來的6個小時內每一小時測量一次。這種型別的試驗的資料如表18.1所示。 注意,這是一個有重複測量的兩因子(藥物和時間》試驗,重複測量是對兩個因子中的一個(時間)進行的。 對於一個比較因子A(藥物)的a個水平的兩因子試驗,其中因子 A的每個水平有x個患者,因子B(時間)有6個水平,我們將使用如下模型: Yik=p+ai+ ili)+質+apk+Ei 其中a,限,a追均為固定效應,分別相應於因子 A(藥物)的主效應,因子B(時間) 的主效應和二者的互動效應。Tjti)為因子A的第:個水平上第;個患者的隨機效應。我們假定各個 *;G:)相互獨立,並且都服從正態分佈(0,)。

來源患者間 A A 中的患者患者內 B AB 誤差總和 18.3 •個因子有重複觀測的兩困子試驗•1147• -- 表18.6 其中一個因子有董複測量的兩因子試驗的方差分橋 SS df EMS(A,B 固定,患者隨機) SSA SSP(A) 4-1 a(n-1) a+加 + bnoA a+6 o+ an0n a+ nfAB SSB SSAB SSE TSS -1 (a-1)(6-1) a (6 1)() abm-1 基於這些假設,我們得到如表18.6給出的方差分析表。從表18.6可以清楚地看出,我們可以進行如下的檢驗: 1.Ho:dun=0 F=MSAB MSE 2.Ho:0p=0 F-MS MSE 3.Ho:0=0 MSA F= MSP(A) 例 18.1 有10名志願者同意參加一項研究,以確定同一•種藥品的同一劑量在兩種不同的藥劑形式(膠囊和片劑)下血流中藥物的濃度。假定在一定的範圍內,濃度越高藥品越有效,其中5個人被隨機地指定服用膠囊(C),另外5人則服用片劑(T)。 他們從頭天晚.上8點開始禁食,第二天早晨8點服藥,服藥4小時以後才能飲食。 在服藥後 0.5,1,2,3和 4小時時分別取了《15mL.)血樣,經分析得到血流中藥物的濃度。資料(ng/mL)給出奶下。 8.對每一種藥劑形式面出平均樣本資料(時間-響應)的圖。在這段時間內, 兩種藥劑形式顯示出了不同的效用嗎? b.進行有重複測量的方差分析。

•1+×. 第十八章重複測量與交叉設計忠折 1.5 5 55 70 60 1 75 80 75 85 90 片劑時間 2 120 135 125 140 150 患者 3 60 70 85 90 95 4 30 40 50 40 50 1 2 3 4 5 0.5 30 25 35 45 解答 a. 桉約劑形式和時間計算的平均血漿濃度如下。 時間形式 T 0.5 37 55 1 . 81 2 85 134 血漿濃度的圖給出如下。 200175 mL 1S0 125 血漿濃度 100 75 50 25 0 0.0 0.5 1.0 ***膠囊 1.5 2.0 2.5 時間(小時) 000片劑 3.0 1 $5 $0 65 70 75 膠囊時間 2 80 75 85 90 95 3 130 125 140 145 160 4 65 60 85 80 90 3 140 80 4 76 42 4.0

18.3 一個因子有重複規測的兩因子試驗 •1149• b. 來源患者間形式形式中的忠者患者內時間時間×形式誤差 SS df MS F p僨 40.5 3920 8 40.5 490 0.083 0.7810 34 288 19 472 980 4 4 32 8 572 4 868 21.01 279.90 159.00 0.0001 0.0001 結論:有根據(基於時間×藥劑形式互動效應的顯著性)(<0.0001)表明兩種藥劑形式隨時間變化有不同的濃度模式。 因子A的F檢驗基於研究物件(患者)間的效應,因而不受因子B上重複測量的影響。然而,患者內效應的F 比值是受到影響的,並且像在有重複測的單因子試驗中一樣,我們必須關心在什麼樣的條件下 F 檢驗才是適當的。如果y非的方差一協方差矩陣的複合對稱性成立,那麼我們可以應用這些F檢驗。有人建議(Greenhouse and Geisser (1959), Huynh and Feldt(1970)),當對F 檢驗成立的條件有所偏離時,用調整後的F 值來決定一個重複測量F 檢驗的顯著性。許多作者提出了各種各樣的調整方法,這些方法的做法大同小異。對所考慮的F檢驗的分子和分母的自由度定義一個乘積調整因子 Epsilon,記之為e,以區別於上述模型中的誤差E。對於大多數調整方法,調整因子e介於0,1 之間,當使得 F檢驗有效的條件得到滿足時,取1,否則,隨著與有效條件偏離程度的增加。的值將越小。對於一個給定的情形,在決定了。的值以後,把計算所得的F統計量與將分子分母的自由度都乘以e以後作為兩個自由度的F分佈的臨界值相比較。 我們以表18.6中的試驗設計為例來說明調整的基本思想。此時,我們有一個兩因子試驗,關於第二個因子 B 有重複測量。當 Huynh-Feldt 條件成立時,對於患者內效應,即表18.6中的B和AB 的F檢驗是有效的。 對於一個給定的試驗,我們計算出e的值,把dl,和dfz都乘以e來調整F檢驗的自由度。所以,為了檢驗 Ho:04B=0,利用樣本資料計算出一個e的值,然後計算 F統計量 F= MSAB MSE 並將其與基於自由度 df =ela-1)(6-1)和 dh=ea(b-1)(n 1)的臨界值F。 相比較。注意,當e=1時,條件成立,我們得到原來建議使用的自由度 df =(a

• 1150• 第十八章重複測量與交叉設計當分析有重複測量資料的試驗時,如果有SAS軟體可用,那麼可以使用 PROC GI.M來計算兩種不同的自由度調整方法下檢驗的p值。SAS 中使用的第一種調整方法是由 Greenhouse 和 Geisser (1959)提出的,這種方法用樣本計算e的一個估計值。在SAS 輸出中,這種方法被標以“G-G”。模擬研究表明,這種調整過於保守,因為實際的中值比G-G調整給出的值可能小很多。第二種調整因子 (由Huynh和 Feldt(1970)提出)則基於e的一個不同的公式。然而,也需要從梯本計算調繁因子的一個估計。然後, 統計量的臨界值的自由度用這個e的估計進行調整。這種調整在 PROC GLM 的輸出中被標以“H-F”。雖然 GreenhouseGeisser的e和Huynh-Feldt的e均必落人區間0<e≤1,但H-F方法中e的估計有時會大於1。此時,用e=1 來確定F檢驗的自由度。 General Linear Models Procedure Dependent Variable: conc Source Model EETOT Corrected Total 17 32 49 Sun of Squares 57720.5000000 980.0000000 58700.5000000 F Value 110.87 Fr>F 0.0001 Source FORH PATTEAT(FOR) TIME FORK'TIME Source: FORM ErrOr: HS(PATIBNT(FORM) 1 8 4 4 Tye I ss 40.5000000 3920.0000000 34288.0000000 19472.0000000 F Value 1.32 16.00 279.90 158.96 PT>E 0.2587 0.0001 0,0001 0.0001 DF 1 T'ype II Ns 40.5 Denominator DF 8 Denominator Ms 490 F Value 0.0827 Pr≥E 0.7810 Repeated Measures Analysis ot Variance Tests of Hypotheses tor Between subjects Etfects . Source FORM Error DE 1 8 Tye III ss 40.5000000 3920.0000000 F Value 0.08 Pr>F 0.7810

18.3 一個因子有重複觀測的兩因子試驗•1151• Repeated Measures Analysis of Varfance Univariate Tests of Hypotheses for Within Subject Bffects Source: TIME DF 4 Type III ss 34288.00000 Hean Square 8572.00000 F Value 279.90 PT>E 0.0001 Adj GG 0.0001 Pr>E HE 0.0001 Source: TIHE* FORM DE 4 Type III ss 19472.00000 Hean Square 4868.00000 F Value 158.96 PT>F 0. 0001 Adj GG 0.0001 Pr≥E FE 0.0001 Source:Error(TIME) DF Type III ss 32 980.00000 Hean Square 30.62500 Greenhouse Geisser Epsilon = 0.7374 Huynh-Reldt Epsilon = 1.3610 例 18.2 參考例 18.1 中的計算機輸出。 a.找出 Greenhouse-Geisser 的調繁因子e和 Huynh-Feldl 的調因子:的估計值; b.關於時間效應和時間藥劑形式互動效應的檢驗的結論受這些調整的影響嗎? 解答 a. e的 Greenhouse-Geisser 估計值為0.7374,Huynh-Feldt 估計值1.3610。 b.時間效應:基於G-G 調整和 H-F 調整的F 檢驗的p值分別為0.0001和 0.0001,它們與原來的F檢驗一樣,因此,調整沒有改變原有的結論。 時間×藥劑形式互動效應:與時間效應的檢驗一樣,調整沒有改變檢驗的p 值,從而也沒有改變檢驗的結論。 我們指出,如果在進行有重複觀測試驗的方差分析時,使用了SAS系統,最好檢查一下對於有關有重複測量的因子的效應的F檢驗,調整的效果如何。如果原來的F檢驗(即e=1)的結果與基於HF調墊或G-G調整的結果不同,那麼,我們建議採用基子不太保守的H-F 調整的結論。

• 1152• 第十八章重複測量與交叉設計下面,我們來完成案例中資料的分析。 案例資料的分析:石油洩漏對植物生長的影響此項研究的日的在了考察石油溢漏和接下來在溢油地塊上的燃燒對植物 Distichlis spicata 生長密度的影響。由於沒有溢油地域溢油和燃燒前植物密度的基礎資料,只能與沒有受到溢油影響的地域進行比較。在圖18.2中,給出了八個觀測時點處對照和燃燒地塊的植物密度的側面圖。對照地塊(C)上的平均密度一致地比燃燒地塊(B)上的平均密度高。除「兩個觀測時點(D3和 D7)以外,對照地塊和燃燒地塊上的平均密度的變化也類似。在D3和D7這兩個時點上,燃燒後的地塊上平均密度比前一個時點下降了,而對照地塊上的平均密度卻是上升的。我們接下來構造有重複測量的方差分析,來確認上述的觀察結果。 50 4540. 數物植 35. 30 25 20DI D2 D3 D4 D5 觀察甘期圖18.2 植物密度的側面圖植物密度資料的方差分析表給出如下。 T D6 D7 D8 •

18.3•個因子有重複觀測的兩因子試驗 •1153• 來源 SS MS 調整後的p值 F p值 G-G H-F 地塊間處理處理中的地塊地塊內 B期日期×處理誤差 10 511.11 60 844.63 1 38 10 511.11 1601.17 6.56 0.0145 2 845.09 602.29 5.587.88 Grecnhouse-Geisser 因子=0.5269 Huynb-Feldt因子=0.5355 7 7 266 406.44 86.04 21.01 19.35 4.10 0.0001 0.0001 0.0001 0.6003 0.0046 0.0029 日期與處理的互動效應是顯著的,這確證了我們從側面圖中看到的結果。更進一步,在燃燒後的地塊與對照地塊之間平均密度有顯著的差異。對照地塊比燃燒後的地塊有更高的平均植物密度,見表18.3。在第一個觀測日期,二者之間的差為7.25,到最後,即到兩年多一點以後,差異擴大到12.70。因此,溢油地塊上的平均植物密度表明,在植物密度上沒有恢復,1992年10月為27.20,至1995年1 月為26.65。由於對照地塊在研究期間與溢油地塊有相似的土壤和環境條件,而對照地塊上的植物密度從 34.45變到39.35,有所增加,我們可以斷言,溢油和接下來的燃燒導致這些地域上植物密度的下降。 報告結論總結這項研究的結論時我們需要包括以下內容。 1.闡述研究的目標。 2.描述研究設計,地塊是如何挑選的,植物密度是如何測量出來的,測量日期是如何選擇出來的,以及所選擇的地塊在環境和土壤條件方面相似性的論證。 3. 討論該研究的結論能否椎廣至其他溢油地域。 4. 資料的數值和圖表示。 5.所有推斷方法的描述: •明確陳述研究假設, •表示試驗條件的模型, •模型條件的驗證, •包含值的AOV表。 6.討論研究的結果和結論。 7. 相對於以前的研究,解釋此項研究中的發現。 8.相對於石油溢漏的類似處理所做的推斷。

•1154• 第十八章重複測量與交義設計 9.資料表。 練習應用 18.1(環境) 卡晏花蜱(cayenne tick)被認為是對野生動植物、牲畜和人類有害的害蟲。它分佈丁西半球北緯30°到南緯30°的區域內。已經知道這種壁蝨是若下種疾病的潛在攜帶者,但對們的生態知之甚少。為此,進行了卜面的餅究, 以考察這種壁真的生存潛力及其與環境飽和差(SD, saturation deficit)的關係。飽和差是一項環境指標,它與溫度和相對溼度有關,當溫度增加時SD增加,但當相對溼度增加時,SD 下降。因此,SD的高值聯絡於高溫和低相對溼度,這會引起壁蝨經歷最強的脫水。研究中挑選使用了 SD 的5個值(2.98, 4.83, 5.80, 8.88, 13.38mm/Hg)。人工建立起與這些值相應的環境,5只壁被隨機地分配到5種環境之一。在大約3周的研究期間內,每隔兩天記錄一次壁蝨整個身體的水分損失。這些壁蝨的水分損失(mg)給出如下。 SD 2.98 2 3 0.59 0.64 0.75 0.81 0.80 0.87 0.69 0.77 0.58 0.62 4 0.73 0.90 0.94 0.83 0.71 暴露的天數 6 5 7 8 0.76 0.89 0.93 1.01 0.97 1.20 1.14 1.19 1.01 1.10 1.17 1.24 0.88 0.96 1.04 1.09 0.74 0.81 0.88 0.93 9 10 1.08 1.26 1.34 1.20 0.99 1.15 1.38 1.41 1.23 1.03 11 1.23 1.43 1.51 1.31 1.13 4.83 5.80 壁蝨一— 1 2 3 4 5 1 2 3 5 1 2 3 4 5 0.54 0.69 0.77 0.64 0.51 0.64 0.71 0.77 0.89 0.90 1.00 1.06 1.14 1.22 1.34 1.39 0.80 0.91 0.97 1.01 1.11 1.19 1.29 1.31 1.37 1.47 1.54 0.79 0.85 0.89 0.99 1.04 1.05 1.16 1.21 1.32 1.39 1.47 4 0.77 0.82 0.88 0.92 1.01 1.09 1.19 1.27 1.35 1.44 1.58 0.79 0.84 0.91 0.98 1.07 1.14 1.19 1.31 1.37 1.46 1.55 0.72 0.79 0.83 0.94 0.98 1.09 1.12 1.21 1.28 1.34 1.41 0.89 0.94 1.01 1.21 1.27 1.40 1.44 1.49 1.49 1.58 1.63 0.97 0.99 1.07 1.09 1.21 1.30 1.37 1.44 1.54 1.61 1.73 0.85 0.88 0.97 1.05 1.09 1.17 1.24 1.29 1.30 1.23 1.51 0.71 0.78 0.82 0.91 0.94 1.11 1.19 1.23 1.29 1.33 1.43

18.3:一個因子有重複觀測的兩因子試驗 • 1155• 續表 SI 壁蝨 8.88 1 2 4 5 桑籪的天數 1 2 3 4 5 6 7 8 9 10 11 0.93 0.99 1.03 1.14 1.18 1.29 1.33 1.36 1.38 1.54 1.62 1.09 1.14 1.21 1.41 1.47 1.55 1.64 1.69 1.71 1-78 1.83 1.19 1.20 1.07 1.29 1.31 1.50 1.57 1.64 1.74 1.81 1.93 1.05 1.08 1.17 1.25 1.29 1.37 1.44 1.49 1.50 1.53 1.71 1.01 1.09 1.18 1.21 1.29 1.31 1.39 1.43 1.49 1.53 1.63 13.38 1 2 3 4 1.05 1.09 1.13 1.24 1.28 1.29 1.34 1.41 1.51 1.57 1.38 1.40 1.47 1.49 1.51 1.23 1.28 1.37 1.45 1.49 1.23 1.29 1.38 1.41 1.49 1.39 1.43 1.56 1.68 1.74 1.82 1.65 1.74 1.79 1.83 1.88 1.93 1.60 1.69 1.74 1.79 1.87 2.03 1.57 1.64 1.69 1.70 1.73 1.81 1.52 1.48 1.53 1.59 1.63 1.78 a.畫出這些資料的側面圖,顯示對於每個SD的值,平均體重的損失隨時間的變化; b.對於卡晏花蜱,是否隨著飽和差的增加其損失的體重也在增加? 18.2 參考練習18.1。 2.對這一設計,給出一個模型; b.對於此項研究,構造一個方差分析表; c.對於卡晏花蜱,飽和差的增加是否引起其損失的體重也在增加?取a= 0.05; d. 對於每一SD的水平,卡晏花蜱的損失體重在研究期間是否增加了? 18.3(醫學) 為了研究抗組胺劑在對由已知的變態反應源引起的陽性皮膚反應的抑制效果(與一個安慰劑相比較),常常使用一個模型。考慮下列情形。為了尋找用於研究中的20個物件,對許多個人進行了篩選,找出其中對於變態反應源過敏的人。然後,把這20個人隨機地分配到兩個處理組(已知的抗組胺劑和一種外表完全一樣的安慰劑),每組10人。研究開始(藥前)時,測量一下過敏讀數作為基準。然後,每個患者服用指定的藥劑三天。在首次服藥後1小時,2小時,3小時,4小時和8小時後分別測量其過敏讀數。20名患者的皮膚過敏反應抑制的百分比(比起基準讀數來,使用變態反應源引起的腫脹面積的減少)資料給出如下。

•1156• 第十八章重複測量與交叉設計處理患者 1 1 10.5 41.2 43.0 61.4 5.0 -10.2 -12.9 27.1 13.0 28.9 2 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 3.0 -1.5 10.8 15.3 8.7:4.6 -16.6 9.4 - 19.3 -12.8 2 28.2 25.3 20.8 61.6 28.2 27.2 22.1 26.5 19.7 26.1 9.3 - 10.1 20.6 19.8 8.0 5.8 28.4 15.7 15.7 12.3 抑制時間(小時) 3 15.3 27.8 29.3 62.8 31.6 38.1 34.0 38.8 23.5 11.2 1.0 20.2 28.3 25.4 17.5 12.7 32.7 22.7 21.7 0.1 (負表示與基準資料比較起來,腫脹的面積有所擴大。) 4 43.0 28.0 $.2 43.8 19.5 35.5 43.4 28.5 29.4 18.1 15.0 18.3 25.2 31.3 26.6 15.6 34.4 29.8 30.4 21.3 8 29.0 53.2 26.5 19.6 2.3 18.0 34.2 17.4 39.6 16.5 •3.0 13.5 15.8 21.7 16.4 29.6 15.8 23.2 26.1 10.6 日.對於每一組,比較不同時間的均值和標準差; b.對於每一組,以時間為橫軸,平均抑制百分比為縱軸面出資料的圖。抗組胺劑組與安慰劑組看上去是不同的嗎? 18.4 參考練習18.3中的資料。對該設計給出一個模型,並作有重複測量的方差分析來比較兩個組。方差分析的結果與在練習18.3中從圖中得出的判斷一致嗎? I8.5 關於抗組胺劑的作用,我們還可以提出另一個問題:如何定義抗組胺劑作用的起始?對每個處理組,用:檢驗決定一個時間,在此時間處,過敏讀數比基準讀數有顯著的減少。這會導致什麼樣的建議?

18.4 交叉設計•1157• 18.4 交叉設計我們現在考慮18.2節中所討論的單因子試驗的一種擴充。回憶表18.4,我們曾經給出這樣一個試驗的資料:在這個試驗中,雙個患者中的每一個按照一種隨機的順序接受了同樣的三種藥物的治療。對於藥物的一個拉「方安排形成一個試驗設計,當患者或條件不隨時間而變時,它與有重複測量的單因子試驗(即對每位患者做多次觀測並做處理的患考內比較)有相同的優點。 對於這種試驗的情形,一個3×3拉丁方設計由表18.7給出。該設計稱為一個三階段(three-period)交叉設計。 表18.1 一個3X3拉丁方設計序列忠者因子B(階段) 2 1 2 3 # n AI Az A; As AL 3 As AI A2 在這個設計中,3n個患者被隨機地指定到設計的序列(行),每個序列n個。 階段相應於服用藥物的順序。該設計的模型為 Vi H+&+TH(R)+Q十月+Q + EiA 其中6。為第k個序列的固定效應,天a(w,為序列中第1個患者的隨機效應,a:和 B; 分別為藥物(因子A)和階段(因子B)的固定效應。在互動作用項上加星號的原因以後再做解釋。這個設計(三階段交叉設計)的方差分析由表18.8給出。 表18.8 三階段交叉設計的方分析來源 SS df EMS(A,B 固定,忠者隨機) 忠者間序列序列中的患者患者內 A B AB* 誤差總和 SSSeg SSP(Seg) 2 3(n-1) 0+36+3ntsen 六+38 SSA SSB SSAB' SSE TSS 2 +3n0A di+3non 2 a+ 28AB 3(2)(n-1) 9n-!

•1158• 第十八章重複測量與交義設計方差分析中患者間部分的效應的平方和、自由度和期望均方,以及惠者內部分的因子A 和B的效應的平方和、自由度和期望均方都是直截了當的。但注意,在 AB 的互動效應項上加了一個*號,並且這個項的自由度只有2,而不是4。實際上,損失的這兩個自由度在序列的平方和上。事實上,容易證明,AB 互動效應平方和等 SSAB=SSSeq + SSAB* 以後我們就用該式來計算 SSAB*。 例 18.3 12 位男性志戀參加一項研究,以比較一種藥品的三種不同的藥劑形式的效用持續時間。形式1是50mg的片劑,形式2是100mg 的片劑,形式3為緩釋膠囊。 使用三階段交叉設計,對於三個處理階段中的每一個,指定4位志願者。在每一個處理日,給以志願老指定形式的藥劑,並觀察其藥效(血壓下降)的持續時間。試驗中每一個處理階段有一週的清洗時間。樣本資料如下。 序列 1 序列患者 1 2 3 1=4 #=4 11=4 1 AL Az Aa 階段 2 A2 As A」 3 As A1 Az 3 階患者 2 1 2 3 4 1 2 3 4 t 2 3 4 1 1.5 2.0 1.6 1.1 2.5 2.8 2.7 2.4 3.3 3.1 3.6 3.0 2 2.2 2.6 2.7 2.3 3.5 3.1 2.9 2.6 1.9 1.6 2.3 2.5 3 3.4 3.1 3.2 2.9 1.9 1.5 2.4 2.3 2.7 2.5 2.2 2.0 解答下面給出了方差分析的計算機輸出結果。基於這些結果,有階段x處理互動效應的跡象(p=0.0853),而由於處理效應非常顯著(=0.0001),這交互效應看來可以忽略不計。這一點可以從下面給出的圖中得到證實,該圖中對每個序列沿個階段畫出了其平均持續時間。由圖可以看出,最長的平均持續時間是從藥劑形式2觀測到的,然後是形式2和形式1。

18.4 交叉設計•1159• General Linear Modela Procedure Dependent Variable: DURRTION Source Model EETOr Corrected Total DE 17 18 35 Sum of sguares 11.08639889 2.06333333 13.14972222 E Valie 5.69 Pr≥F 0.0003 Source $EQ PATIENT(SEO) TREAT PERIOD TREAT*PERIOD DE 2 9 2 2 2 Type ISS 0.23388689 0.66916667 9.51722222 0.01722222 0.64日88889 F Value 1.02 0.65 41.51 0.08 2.83 FT>E 0.3804 0.7425 0.0001 0.9279 0.0853 Tests of Hypotheses for Mixed Model Analysis of Variance Dependent Variable: DURATIOR Source: SE0 ErrOr: KS(PATIENT(SB9)) DE 2 Type I Ms 0.1169444444 Denominator DE 9 Denominator Hs 0.0743518519 F Value 1.5729 Plot of MEAN DURATION VerSuS PERIOD OF STUDY 3.5 A3--- 3.0A3 DURATION OF EFEECT A2. 2.5 .A2. A2 2.0AI -Al AH 1.51 1.0Pr≥E 0.2595 - 2 PERIOD FORNULATIONS:AL,A2,A3 3

• 1160•