AI 新聞與投資
統計學方法與資料分析引論

第十四章 試驗和研究的設計概念

27 / 34

I號臺的隨機排列為:5,7,3,8,2,4,1,6: N號臺的隨機排列為:L,4,S,7,3,2,8,6。 6.1號臺:S1分給編號為1,8的盆;S2分給編號為2,5的盆; Sa分紛編號為4,3的盆;Sa分給編號為7,6的盆。 舊號臺:S,分給編號為S,7的盆;S2分給編號為3.8的盆; S3 分給編號為2,4的盆;S4分給編號為1,6的盆。 N號臺:S,分給編號為1,4 的盆;S2分給編號為5,7 的盆; Sa分給編號為3,2的盆;S4分給編號為8,6的盆。 我們得到如圖14.4給出的隨機安排。 II SSSS. I SSiS,Si SSSS3 皿 SsSa SSa SiSSS SSSsS S:SSS 圖 14.4 四張臺予上處理的隨機區組排列在這一排列中,四種處理的每一種被隨機地分配給溫室中每一臺上的兩個盆。 現在,如果四張臺子上盆所處的條件之間存在較大的差異,那麼這一安排使得由臺子所處環境造成的差異在4種處理上有更均衡的分佈。此外,每一臺子上處理的隨機化將有助於分散在施加處理之前樹苗間存在的任何差異及每一張臺子上盆間條件的差異。 14.6 確定重複試驗的次數試驗中重複試驗的次數在決定處理均值估計的精度和關於處理均值間差異的假設檢驗的功效方面起著關鍵的作用。在大多數情況下,重複次數越大,估計的精度越高,處理均值的置信區間越精確,假設檢驗的功效也越大。研究人員在使用非常大的重複觀測次數時受到以下條件的約束:進行試驗的費用、處理大量試驗單元所需要的時間及試驗單元的可用性。因此,研究人員必須確定為達到對估計精度

14.6 確定重複試驗的次數,9.39• 或假設檢驗功效的合理要求所需的最少重複觀測次數。 透過給定估計精度來確定簠復觀測次數我們可以透過指定處理均值的置信度為100(1-a)%的置信區間想要達到的長度來確定重複觀測的次數。在第五章中,我們已經給出了一個公式,用來確定保證樣本估計落在真實處理均士個單位的範圍內的機率不小於100(1-a)% 所需要的樣本董。如果令,為重複觀測的次數,。是試驗的標準差,E是希望達到的估計精度,那麼我們可以用下面的公式來計算,的近似值。 有100(1-a)%的把握保證估計落在處理均值,計程車個單位內所需的樣本甘為 E2 使用此公式時,試驗人員必須確定 1.想得到的置信水平,100(1 a)%。 2. 精度水平,E。 3.a的一個估計。。的估計可以從初步研究、過去類似的試驗、有關類似的試驗的文獻或使用一個較粗糙的估計。=(最大值—最小值)/4得到。 我們下面舉例說明這些計算。 例 14.10 某研究人員正在設計一項試驗,以研究在施用四種量的氛肥後山核桃的產量。 她想得到處理均值p1,P42,從3和pg 的估計,並使其滿足:有95%的把握確信估計在真實產量均值士4磅的範圍內。她要確定為達到這一目標所必需的重複觀測次數。 解答從以往的試驗知道,產量的範圍是40磅到70磅(原文誤為50磅,譯者注)。這樣,可給出。的一個估計 a-29-40-7.5 4 從止態分佈表查出 z0.02$=1.96。如該研究人員所指定的那樣,E 的值為4磅,由此我們確定重複觀測的次數為 E' -(1.96)317.5)2 - 13.51 (4)2 因此,為達到所希望的精度,研究人員應在每一處理進行14次重複觀測。

•940• 第十四章試驗和研究的設計概念這個用來確定重複觀測數的方法,沒有考慮第八章中討論的用來檢測處理均值間的差異的 F檢驗的功效。因而,在多數研究中,人們更喜歡使用下述確定重復觀測次數的方法。 透過指定F檢驗的功效來確定重複觀測的次數在包含,個處理的研究中,其中一個目標是檢驗假設 Ho:/1 = p2= …=He H。:並非所有的p都相等國想第八章我們給出的檢驗方法: F=MSI MSE 如果F≥F®.1-1.N-,則拒絕Ho 此處MST 和 MSE 是方差分析表中的均方。重複觀測次數 1= 2 ⋯二1。透過指定以下關於檢驗統計量的引數來確定: 1.顯著性水平,a。 2.兩個處理均值間差異 D=I::|的大小,這個差異在實際中是顯著的。 3.當有任何一對處理均值間的差異大於D=1p:“Ag,l時,犯第1類錯誤的概率。 4.方差。 犯第I類錯誤的機率B(入)由宮由度為v1,v2,非中心引數為的非中心F分佈確定。對於至少有-對處理的均值相差 D個單位或更大的情況,入的最小值如下給出: 1=2D 20 附錄中的表14包含F檢驗的功效,它等於1-B(入)。該表使用引數中=VA/t而不用p:的值。利用該表我們能確定為滿足給定的具體要求所需要的重複觀測次數。下例說明了需要進行的計算。 例14.11 回到例14.10,其中某研究人員正設計一項試驗來研究在施用四種量的氨肥後山核桃的產量。研究人員知道,如果山核桃的平均產量間的差別超過15磅,那麼選用相應於高產量的處理具有一定的經濟意義。因此,該研究人員想確定必需的重複觀測次數以保證:只要有任何一對氮肥施肥量對應的山核桃平均產l之間

14.6 確定重複試驗的次數 •941• 相差15磅以上,就有90%的把握確信 F檢驗會拒絕Ho,從而檢驗出平均產量間存在差異。該檢驗必須要求a=0.05。 解答從以往的試驗知道,山核桃的平均產量在40磅到70磅(原文誤為60 磅,譯者注》之間。因此,給出。的一個估計 8=20-40=7.5 我們有 8 = 0.05,1=4,11=1-1=4-1=3, 此處,是所需的重複觀測次數。另外,D的值為15。所以 ¢ TD2 r(15)2 ¥2162 Y2(4)(7.5)2 = 0.707/F 圖 14.5包含求解這個同題所需要的功效曲線。注意v1=3,a=0.05,且曲線以12 的值為標記。我們要確定,的值,使得當$=0.707 r時檢驗的功效至少是0.9。 =* 60 302015121098 7 0.99 h 山=3 0.93 0.97 =0.96 0.96 0.95 0.94 0.92 0.90 0.80 P=0.75 0.70 0.60 0.50 0.40 0.30 0.20 0.10 ¢= 1.73 2 ¢=2.24 ¢ 圖14.5 方差分析檢驗的功效(a=0.05,t=4)

• 942• 第十四章試驗和研究的設計概念為此,我們要不斷地選擇,的值,直至達到這個必需的閾值。 這種確是,的值的方法是透過反覆試驗實現的。首先我們猜想,=6。其次, 我們計算得 2=4(6-1)=3,$=0.707V6=1.73。在圖14.5中,我們在必軸上確定$=1.73的點,然後從1.73這點向標記為20的曲線畫一條豎直線,我們再在它們的交點處畫一條水平線與標記為“功效=1-p”的軸相交,讀出交點處相應的值為0.75。這樣,如果我們在試驗中進行6次重複觀測,在D=15時,功效只有 0.75,這太低了。然後我們試用r=10,發現功效為0.96,該值可以接受;然而,或許再小一點的,值也可能會達到我們的要求。於是,我們試試r=8,發現功效等於0.89,此值稍稍小了一點點。最後,我們發現當r=9時,功效為0.93。因此,為滿足功效的要求,試驗的每一處理需要9次重複觀測。上述的計算過程概括如下: 在確定完重複觀測次數後,實際情況可能不允許在同一時間或同一地點對這麼多的試驗單元進行完整的試驗。在這樣的情況下,我們可以利用隨機化完全區組設計的思想,按時間或地點劃分割槽組。在例14.11中,我們確定出需要對4個處理做9次重複觀測,即共需要36個試驗單元。假定我們在農業研究中心的一個地點只有12個試驗單元,而該中心有三處這樣的地點,每處都有12塊試驗地。於是,我們可以在每一個地點對每一處理進行三次重複觀察,把地點作為該試驗設計中的區組。 r 6 10 8 9 衰14.1 置量觀測次數的確定 $=0.707F 20 36 28 32 1.73 2.24 2.00 2.12 功效 0.75 0.96 0.89 0.93 14.7小結在這一章中,我們考察了為研究人員提供資訊的各類研究。特別地,我們介紹了幾種用於受控試驗的設計方法,討論了可能影響試驗單元的響應之變異的各種條件和變試。這是極端重要的問題,因為它會影響我們處理均值估計的精度和檢驗統計量的功效。透過運用適當的試驗設計,試驗誤差的方差可以大大減小。在設計的試驗中,重要的一點是隨機化過程。試驗單元被隨機地分配給處理這一點至關重要。不使用隨機化手段,我們將失去估計、置信風間及檢驗統計量的許多統計性質。本章最後部分介紹了在設計的試驗中如何確定重複觀測次數。

14.7 小結•943• 練習 14.1(工程) 研究人員做質量控制試驗以評估灌溉用塑膠管的質量。在這個試驗設計中,共有24根管子,是從兩個生產廠家每家隨機抽取12根得到的。記錄下每根管子五個位置處相應的抗壓強度。管子是在兩種水溫之一和三類硬化劑之一的條件組合下生產出來的。試驗條件如下: 管子號 1 2 3 4 硬化劑 Hi H2 H Hz 管子號 13 14 生產廠象硬化劑一Hs Hs Hs Hs 6 8 9 10 12 生產廠寮 1 1 2 2 1 1 2 2 1 1 2 2 溫度('F) 200 175 200 175 200 175 200 175 200 175 200 175 Hz H Fz H Hs Hs Hs 17 18 19 20 21 22 23 24 1 2 2 1 1 2 2 1 1 2 2 溫度(*F) 200 175 200 175 200 •175 200 175 200 175 200 175 Hi H Hz Hi Hz H 確定該試驗設計中的如下內容。 2.因子。 b.因子水平。 c.區組。 d.試驗單元。 e.測量單元。 f.重複觀測次數。 8.協變數。 h.處理。 14.2 考慮一個你可能要做的研究或試驗,該試驗用於回答你所研究的領域中的研究問題。陳述這一研究問題並說明它為什麼重要,敘述你將如何進行試驗以獲得資料來回答你的問題。在你的描述中要包含以下內容: •研究問題。 •對試驗單元的描述。 •對測量單元的描述。 •處理設計。

•944• 第十四章試驗和研究的設計概念 •設計結構。 • 隨機化方法。 • 重複觀測次數。 •可能的區組劃分。 14.3 對在下面描述的每一試驗,確定設計的重要特徵,像在練習14.1中那樣,儘可能多地包含各項內容以充分地描述該項設計。 a.一位園藝學家要測量位於南德克薩斯的某研究農場的一個果園中的橙子內維生樂C的含量.他對果園中不同地點、不同的產果月份以及每棵樹上的橙子之間維生素C含量的變異感興趣,他把果園分成8個部分,並隨機地從每一部分選了•棵樹。從10月到來年5月期間,正好是果樹結果的時候,他每月從8棵樹的三個不同位置,即頂部、中間、下邊分別摘取10個橙子。園藝學象想監測產果季節中橙子維生素C的含量,並確定長在樹的不同位置的橙子維生素C的含量是否存在比較大的差異。 b.某醫學專寮想比較兩種治療某種疾病的不同療法(T1,T2)。她要在八個醫院進行試驗,並認為響應變數在醫院之間可能有差異。每個醫院有4個監護區,她在每個監護區隨機選出4個患者參與研究。在每一醫院內,隨機地把 T,分配給某兩個監護區,其餘兩個接受療法 T2。一個監護區中的所有患者得到相同的治療。對每一個病人測量了單個的響應變數。 c.在(b)描述的設計中,作如下變動。在每一醫院中,兩種療法隨機地分配給患者,即要求每一監護區中的四個患者中,有兩個獲得 T1,另兩個獲得 Tan d.計劃一個試驗,用來比較三類學校,即公立、私立且非教區附屬的、教區附屬的學校六年級學生的閱讀能力。研究人員在美國五個地區中的每個地區選取兩個大城市進行研究。在每一城市,對每種型別的學校她都隨機地選擇了一所,並在選取的學校中隨機選擇一個六年級的班,記錄下每一班級 20名學生標準化考試的成績。研究人員還關注30個學校間家庭收入水平的差異可能對閱讀能力的影響,因此她還得到了參與研究的每一學生的家庭收入資料。 14.4(善醫)一試驗被設計用來評價不同水平的訓練對狗的健康的影響。兩個訓練水平是L,一每天跑2英里,L2一每兩天跑1英里。在3個月的研究期結束時,將對每隻狗進行呼吸和心血管的健康狀況測試,從中計算出一個健康指數。有 16 只狗可用來做研究,它們的健康狀況良好且個頭基本相同,就飼養情況來說這個個頭屬於正常範圍。下表記錄了 16 只狗的有關性別、年齡的資訊。

狗 1 2 3 性別年齡 5 7 8 M M M M F M 9 狗 9 10 11 12 13 14 15 16 14.7小性別 F F F M M M 結•945、 年齡 8 9 6 & 2 1 6 3 日.為了使研究的誤差方差儘可能小,在分配處理之前你如何對這些狗進行分組?列出每一組中相應的狗。 b.使用隨機數發生器或隨機數表得到一組隨機數。描述你給每個狗分配處理的方法。 14.5(商業) 某計算機雜誌要對用來編制聯邦年度個人所得稅表的四種軟件,根據他們完成表格所用的時間來進行排名。該研究將選取收入少於 100,000 美元的個人,並詳細列舉他們的個人所得稅的扣除額。試確定:為使當任意一對均值之間的差異大於30分鐘時,以顯著水平。=0.05、檢驗功效為0.9 檢驗出平均完成時間存在差異,每一軟體程式需要多少個人。從以往對使用類似軟體的研究中知道,完成時間的標準差可以認為在12.25分鐘左右。 14.6 要做一個試驗來分析六種處理的差異。試確定:為使當任意一對處理均值之間的差異超過20個單位時,在顯著水平0.05、檢驗功效為0.8下檢驗出處理均值之間的差異,需要有多少試驗單元。從以往的研究知道,響應變數的標準差近似為鄉個單位。 14.7(生物)一家大海產食品公司的研究專家計劃調查在三種不同的儲藏溫度下,牡蠣和貽貝的細菌生長情況。研究可利用9個冷藏單元。她計劃給每3個冷藏單元分配一種冷藏溫度,在每一冷藏單元中放一袋牡蠣和一袋貽貝,儲藏兩週時間。在兩週的儲藏期結束時,將把袋取出並從每一袋中抽取兩個樣品測量它們的細菌數。我們所關心的“處理”因子是溫度(水平為:0,5C,10C)和海產品(水平為:牡蠣,貽貝)。她還會記錄下在放入冷藏櫃之前每袋海產品含有的細菌數。確定下面有關試驗設計的每一項內容。 ≥.因子。 b.因子的水平。 c.區組。

• 946• 第十四章試驗和研究的設計概念 d. 試驗單元。 e.測量單元。 f.重複測量的次數。 g.協變數。 h.處理。 14.8 考慮練習14.7。如果僅使用三個冷藏單元,每個冷藏溫度一個冷藏單元,在每一溫度下的那個儲藏單元中,對每一種海產品抽取三個樣本,那麼試驗人員仍得到同樣數目的觀察值.以這樣的方式進行試驗,其潛在的困難是什麼? 14.9(商業)比較四種蛋糕配方的嫩潤程度。研究人員在進行試驗時,先配制用料,然後烘烤蛋糕。對於每一種配方,一次配製只做一個蛋糕。對所有的配方使用同樣的烘烤溫度和烘烤時間。電烤箱足夠大,在任何一個烘烤週期內,都可以任烤箱的P,到P。的位置同時烘烤四個蛋糕。四個位置如下所示: Pi Ps P2 P4 a.如果對每一種配方製作,個蛋糕,討論適當的試驗設計和隨機化方案。 b.假定試驗人員擔心烤箱中四個不同的位置(前面對後面,左邊對右邊)會使蛋糕有顯著的差別,那麼你的設計還合適嗎?如果不合適,給出一個適當的設計。 c.如果要對五種配方進行考察,但每一次只能同時烤四個蛋糕,對(b)中所敘述的設計提出修改意見。 14.10 對下面的每種情況,確定設計是完全隨機化設計、隨機化完全區組設計還是拉丁方設計。如果有處理的因子結構,指出它是兩因子結構還是三因子結構。如果試驗單元不同於測量單元,把兩者都指出來。 a. 由N(銀)肥的3個水平、P(磷)肥的4個水平、K(鉀)肥的4個水平的所有可能的水平組合組成48個處理。隨機地抽選了五個種植花生的農場,然後在每一個農場把48個處理隨機地分配給其中的48塊花生試驗田。 b.十個不同的軟體包被隨機地分配給30名研究生,確定出了他們完成指定任務所花的時間。 c.四種不同的釉料以兩種不同的厚度被塗到陶罐上。用來上釉的爐能同時放置八個罐,上釉需要一天的時間。試驗人員想得到試驗的八次重複測量。因為窯中的條件每天會有一些變化,試驗時間用了八天。在每一天中,塗層厚度和釉料種類的每一組合被隨機地用於窯中的一個陶罐。 14.11 你的一個同事就她正在做的一個試驗來求助於你。在該試驗中,請

14.7 小結•947• 一些消費者來品嚐五種不同配方的肉食品。當一個顧客品嚐了一個樣品後,他或她會就一些特徵為該樣品打分,然後這些特徵分將合併一個總分。因而,一個消費者對每一種配方都給出一個總評分。有關文獻指出在這類試驗中,一些消費者傾向於對所有的樣品都給低分,其他的消費者傾向於給所有的樣品以高分。 a.這兒有兩種可能的試驗設計方法。設計A 將抽取100個顧客組成樣本,在該組中每20位顧客被隨機地分配五種配方中的任意一種,這樣每位顧客只品嚐一種配方。設計B將使用由100個顧客組成的樣本,其中的每一位顧客品嚐所有的五種配方,五種配方的食品將按隨機的次序放在每一顧客面前。你將推薦使用哪一種?說明作出這種回答的理由。 b.當研究人員被問及試驗進展如何時,她回答說有一個配方起來是如此的糟糕,以至於把它給排除在分析之外了。如果選用設計B,那這對於分析來說成問題嗎?為什麼?如果選用設計A呢?為什麼?

15.1 15.2 15.3 15.4 15.5 15.6 15.7 15.8 第十五章標準設計的方差分析引言和案例單因子的憲全隨機化設計隨機化完全區組設計拉丁方設計完全隨機化設計中的因子處理結構隨機化完全區組設計中的因子處理結構處理差異的估計和處理均值的比較小結 15.1 引言和案例在第十四章中,我們介紹了試驗設計中的一些概念,也談到進行科學研究和試驗的過程。在這個科學過程中,研究人員整理提出假設,對試驗(研究)進行計劃, 收集並分析資料,然後得到結論,而這些結論轉而又導致新的假設的提出。試驗設計中的這些概念對於這樣的科學過程是基本的。毋庸置疑,為了從試驗(研究)得到符合邏輯的結論,必須精確清楚地提出假設,認真仔細地設計試驗、實施試驗,怡當地分析試驗。對一個設計的試驗的分析,需要針對該試驗建立一個模型,並清楚地說明這個模型適用的條件。最後,試驗結果的科學報告應當包含資料的圖表,模型條件的驗證,統計分析的總結和關於所提出的研究假設的結論。在這一章,我們討論一些標準的試驗設計及其分析。 15.2 節回顧了第八章中完全隨機化設計的方差分析。這裡主要討論均值的比較。15.3 節和15.4 節對完全隨機化設計進行擴充,重點仍然放在處理均值的比較上,但在這些設討中,必須對“討厭“變數進行控制。對於這種型別的設計,我們將考慮其處理的安排,討論其優缺點,並給出一個模型和對所得資料的方差分析。15.5節介紹因子設計。因子設計主要考慮兩個或更多自變數(因子)對於響應的影響,而不像15.2節至15.4節中的設計那樣去比較處理均值;尤其注意評估每個因子單獨的效應,以及在與其他因子的組合中的作用。並非所有的設計都比較處理均值或考察因子對響應的效應。在15.6節中,我們討論的設計結合了 15.3節和15.4節中的區組設計和 15.5節中的因子設計的特點。本章其餘的內容包括這些試驗設計中處理均值的估計和比較,驗證模型條件有效性的方法,以及

15.1 引言和案例•949• 當標準模型的條件不滿足時,可供選擇的其他方法。 案例:低脂肪大紅腸的配製消費者對飲食健康的關心和對低脂肪食品的要求已經推動了肉製品公司開發各種低脂肪的肉食製品。為了在保證維持產量,極小化製作成本並保持味道鮮美的條件下尋找脂肪的替代品,已經對很多成分進行了考察。發表在 Meat Science, 53:47~57的論文“Utilization of soy protein isoiate and konjac blends in a low-fat bologna (model system)”(1999)中描述的試驗考慮了此類問題。研究者認為,為了在不影響低脂肪肉製品質量的前提下降低生產成本,要用非肉質配料,如大豆蛋白分離物(SPI)代替其中的一部分碎肉塊。以前的試驗雖然已經表明了SPI 在碎肉特徵上的效果,但關於在低脂肪肉製品中的應用效果的研究不多。另外,為了在降低脂肪含的同時改善凝膠和容水效能,已經有人把魔芋粉用於肉製品生產中。 因此,當把肉換為SPI 時,有必要摻入魔芋粉以保持高脂肪製品的特點。 資料收集的設計在該項研究中,要考察的因子有三個:在肉製品中摻入魔芋混合物的型別,魔芋的檢入量以及SPI 替換的百分比。還有許多其他感興趣的可能的因子,包括烹調時間、溫度、肉製品的型別、熏製長度等。然而,研究人員選取了這些因子在大紅腸的商業製作中的常用水平,從而把研究限制在以上三個最重要的因子。從而得到一個具有表15.1給出的12個處理的試驗。 處理 1 4 6 9 10 11 12 表15.1 低脂肪大紅腸研究的處理設計混合物水平魔芋混合物 (%) 0.5 0.5 0.5 0.5 0.5 0.5 1 1 1 1 1 1 KSS KSS KSS KNC KRc KNC KSS KSS KSS KNC KNC KNC SPI (%) 1.1 2.2 4.4 1.1 2.2 4.4 1.1 2.2 4.4 1.1 2.2 4.4

• 950• 第十五章標準設計的方差分析此項研究的目標是評估各種作為部分瘦肉替代品的魔芋混合物,並用一個低脂肪大紅腸模型刻畫這些混合物的作用。評估時使用了兩種魔芋混合物(KSS= 魔芋粉/澱粉和 KNC=魔芋粉/角叉膠/澱粉),它們的水平取為0.5% 和1%,還使用了SPI替換肉蛋白的三個水平(1.1%,2.2%和4.4%,DWB)。 該試驗是一個完全隨機化設計,具有一個2×2×3的三因子處理結構,12個處理,每個處理3次重複。在這36次試驗中,測量了許多響應變數,但我們僅討論對最後製品的組織進行測量得到的結果。這些結果是由一臺 Instron 通用檢測儀 (一種可用來測量組織力學特性的儀器——譯者注)測量得來的。平均響應如表 15.2所示。 資料的數理研究人員接下來按照2.5 節中給出的步驟為統計分析準備數據。他們需要驗證產品結構的質地指標是否正確地得到了記錄,所有計算機檔案是否與現場資料相物合。(表15.2中的資料是用論文中給出的概括統計量模擬出來的) 魔芋水平 (%) 0.5 0.5 0.5 0.s 0.5 0.5 1 1 1 1 1 I 表15.2 低脂肪大紅腸研究中的肉質地指標的均值 SPI 魔芋混合物組織指標 (%) KSS KSS KSS KNC KNC KNC KSs KSS KSS KNC KNC KNC 1.1 2.2 4.4 1.1 2.2 4.4 1.1 2.2 4.4 1.1 2.2 4.4 107.3,110.1,112.6 97.9,100.1,102.0 86.8,88.1,89.1 108.1,110.1,111.8 108.6,110.2,111.2 95.0,95.4,95.5 97.3,99.1,100.6 92.8.94.6.96.7 86.8,88.1,89.1 94.1,96.1,97.8 95.7,97.6.99.8 90.2,92.1,93.7 組織指標平均值 110.0 100.0 88.0 110.0 110.0 95.3 99.0 94.7 88.0 96.0 97.7 92.0 資料的分析研究人員的興趣在於評估低脂肪大紅腸的組織指標與 SPI 的百分比增長之間的關係,並對兩種魔芋混合物在兩種水平下的這種關係進行比較。 我們將在15.5 節末尾討論這個例子中資料的分析。

15.2 單因子的完全隨機化設計•951 • 15.2 單因子的完全隨機化設計我們記得,完全隨機化設計用來比較:個總體(處理)均值p2, (42,•4.。假定有:個不同的總體,我們從中分別抽取容量為713。72,“,7,的樣本。用試驗設計的術語來說,我們假定有m1 +72+⋯+n。個齊性的試驗單元(對之進行測的人或物體),把處理隨機地分配到試驗單元,使得有3.1個單元接受處理1,72 個單元接受處理2,等等。試驗的目標是對這些相應的處理(總體)均值進行推斷。 考慮由表15.3給出的完全隨機化設計的資料。 表15.3 完全隨機化設計處理 1 2 均值 YI Y21 Y:1 22 ½2 …⋯ ¥2 ⋯.. 3im y242 …… $2. …… 對於有:個處理,每個處理有 n:個觀測值的完全隨機化設計,其模型可以寫為如下形式 yi=k+ai +Ei 此處,模型中各項的定義為: vi:接受處理;的第;個試驗單元上的觀測值; p:總的處理均值,未知常數; &::處理;的效應,未知常數; ej:接受處理;的第;個試驗單元的響應的隨機誤差。我們要求各個6j服從均值為0,共同方差為。的正態分佈。此外,誤差之同必須是相互獨立的。 從模型的上述條件可以看出,由第;個處理記錄得到的第;個響應3;服從均值為p+a:、方差為的正態分佈。各處理均值之間的差別在於 Q,即它們所對應的處理效應。因此,檢驗 H0:K1 = #2=…=MH:並非所有 pA:都相等等價於檢驗 Ho:Q1= 82=:=Q=0Ha:並非所有a:都為0 檢驗統計基是用對測盤值關十其半均可.一二0的總平方和進行分解的思想

•952• 第十五章標準設計的方差分析得到的。在第八章,我們曾給出這一總平方和的定義: 我們把總平方和分解為兩個不同的變差來源:一個是處理間的變異,一個是每個處理內部各個3;之同的變異。這第二個變異的來源稱為“誤差”,因為它表示不能被處理之間的差別所解釋的那部分變異。 可以證明,TSS 的分解具有形式當各個處理的重複數相同,即我1= 2=⋯三n,=n時,上述分解成為等號右邊的第一項表示各處理均值:關於總均值 .的變異性的大小,因此稱為處理間平方和(SST),它是各v;間源於處理各均值A:之間的差異的變異性的一個度量。處理間平方和由給出。第二項稱為誤差平方和,它表示v之間未被處理均值間的差異所解釋的變異性。這個變異性表示在實施處理之前各試驗單元之間的差異以及試驗期間各試驗單元所暴露的條件之間的差異。誤差平方和由給出。回想第八章,我們曾經把這些分析總結在如下的方差分析表中。 來源處理誤差總和 SS SST SSE TSS 教15.4 完全隨機化設計的方差分析表 df 1-1 N-1 N-1 MS MST'= SST/(1-1) MSE=SSE/(N 1) F MST/MSE 當Ho:a1=a2=…=a,=0 為真時,MST 和 MSE 均為試驗誤差方差哈的無偏估計,也就是說,當Ho 成立時,MST 和 MSE, 在大量重複抽樣時的均值都等於。這一均值稱為期望均方。這一事實表示為 E(MST)=0 和 E(MSE)= 由此,我們可以期望當H。為真時,F=MST/MSE 的值接近於1。當H。為真,並且各處理均值之間存在差異時,MSE仍然是。?的一個無偏估計

15.2 單因子的完全隨機化設計 •953• E(MSE)=d 然而,MST此時不再是c的無偏估計。事實上,可以證明處理的期望均方為 E(MST)=6+n8r 其中0r=1/(t 1)2a。當H。為真時,某些c:不為0,從而8,大於0。因此, MST有過高估計c的傾向。這樣,比值 F=MST/MSE 將傾向於比1大,於是我們在F分佈的右側尾部拒絕Ho。 具體說來,對於選定的犯第一類錯誤的機率,當計算出來的F值大於 Fa.1-1.N- 這裡Fa. ~1.N-為用a=a,df=1-1,df=N-t在附錄表8中查出的F分佈的臨界值。注意 df,和 df2分別相應於 AOV表中 MST和 MSE 的自由度。 當完全隨機化設計用作比較:個處理均值的試驗設計時,有如下的長處和不足。 完全隨機化設計的長處和不足長處 L.該設計非常容易構造; 2.該設計易於分析,即使在各個處理上樣本容量不同時也是如此; 3. 該設計可被用於有任意個處理的試驗。 不足 1.雖然完全隨機化設計可以用於任意個處理的情形,但最好處理個數比較小; 2.對之實施處理的各個試驗單元必須儘可能一致。任何外部的變異來源都會引起誤差項的膨脹,從而使得對處理均值的差異的探測更加困難。 例15.1 鄉間道路路況安全的一個重要因子是在公路上用反射塗料標出行車線。這些行車線為司機在很少或沒有夜問照明的路上行車提供了參照線路。目前使用的塗料的問題是不能長時間維持其反射效能。一位研究人員進行一項試驗,把三種新型塗料(P2,P3,P4)與現在使用的塗料(P」)進行比較。這些塗料被塗在6英尺長的略段上,響應變甘是使用6個月以後這些標記的反射效能下降的百分比。試驗中共有16個路段,每種塗料被隨機地塗在4個路段上。這些塗料在公路上使用6 個月以後,計算出每個路段反射效能的下降幅度,所得測量值如表15.5所示。

•954• 第十五章標準設計的方差分析路段塗料P, P2 Ps Pa 1 28 21 26 16 表15.5 反射效能測量值 2 35 36 38 25 3 27 25 27 22 4 21 18 17 18 均值 27.75 27 20.25 看起來P。比其他3種塗料能在更長的時間內維持其反射效能,因為它的反射效能下降最少。我們現在透過檢驗假設 Ho:M1 = 12 = H3 = K4 H.:並非所有的pA: 都相等來確認這一點。我們要用前面給出的公式計算各個平方和,並由此建立方差分析表: = = N 400 = 25 16 = (28 - 25)2 + (35 -25)2 + …+ (22-25)2 + (18-25)2 = 692 =4[(27.75 - 25)2+ (25 - 25)2 + (27-25)2 + (20.25-25)2] =136.5 SSE = TSS - SST = 692- 136.5 = 555.5 現在,我們可以得到如下的方差分析表:! 來源處理誤差總和 SS 136.5 555.5 692 3 12 15 MS 45.5 46.292 F 0.98 0.4346 由於值=0.4346>0.05=a,我們不能拒絕Ho。四種塗料在反射效能下降的平均值上沒有顯著差異。 研究人員對例15.5中給出的研究結果不大放心,因為他確信至少有一種塗料比目前使用的塗料有所改進。他考察了在這項研究中所使用的16 個路段的路況

15.3 隨機化完全區組設計•955• 以及交通流量,發現這些道路在該項研究期間的交通流量很低。他決定重新設計這個試驗,以使研究結果更具有一般性。新一輪試驗選取了4個不同的地點,這幾個地點有不同的交通流量。在15.3節我們將討論如何進行這項試驗,屆時我們會發現出現了第二個變異的來源,即絡段的位置。 15.3 隨機化完全區組設計我們現在修改上面反射塗料的試驗,把四個不同的位置考慮進去。研究人員在每個位置上選定4個6英尺長的路段。如果我們隨機地把4種塗料分配給這 16 個路段,可能得到如表15.6所列出的隨機化方案。 表15.6 4種塗料對 16 個路段的糖機分配位置 1 P 2 Pa Pa P2 3 4 P, Ps Ps P. Pa 雖然在該設計中對每一個處理仍然有4個觀測值,但我們所能看到的塗有這 4 種塗料的道路反射性之間的任何差別,都有可能完全歸結於四個位置上遵路條件和交通流量的差別。由於位置和塗料型別這兩個因子是相互混雜的,我們無法確定道路標記的反射效能下降的差異是由於標記的位置不同造成的還是由於做這些標記所使用的塗料不同所造成的。這說明16個道路標記受到一個外部變異來源的影響,即道路標記的位置。如果四個位覺有不同的環境條件或不同的交通流量,那麼這16 個試驗單元就不是齊性的,從而也就不能基於他們來評估4個處理, 即 4 種塗料的效應。 上述所說的完全隨機化設計不適用於這裡的試驗問題。為了考慮在指定處理之前試驗單元之間的差別,我們需要用隨機化完全區組設計。在第十四章,我們談到如何對為試驗單元分配處理的隨機化進行限制,使得在每個位置上,對於4種除料的每一種,都有一個路段使用這種塗料。表15.7給出了這樣的一個隨機化結果。注意,每個位置包含4個路段,這4個路段分別塗有不同的塗料。因而,由於四個位置上的道路條件不同而產生的變異就可以得到評估和控制。這樣,我們就可以用擺脫了位置之間的變異性的樣本均值來進行4種塗料之間的兩兩比較。例

• 956. 第十五章標準設計的方差分析如,如果我們做檢驗 H0:KP,HF=0 H。:KR, KB天0 並且拒絕了 Ho,則pP, MAP,之間的差異就是由兩種塗料的反射性之間的差異造成的,而不是由於位置的差異造成的,因為在四個位置中的每一個上,都有一個路段使用了P,和 P20 • 表15.7 把4 種塗料指定給16 個路段的隨機化完全區組分配位置 1 P2 Ps Pa 2 P2 P4 Pi Ps 3 Ps 4 P Pa P Ps 在第十四章,我們曾經討論瞭如何分別在每個區組中把處理隨機地分配給試驗單元。在本例中,區組就是道路的位置。在同一個位置上的4個路段,比起在不同位置上的路段來,在環境條件和交通流量方面可能更相似些。由此,我們實質上是在進行四個獨立的完全隨機化試驗,每個位置一個。應用隨機化完全區組設計, 我們已經有效地濾除了位置之間的變異,從而能夠在處理均值 AP.,• KPg MAR,KRP,, 間作出更精確的比較。 一般說來,當有外部的變異來源(區組)存在時,我們可以使用隨機化完全區組設計來比較:個處理均值。如果有6個不同的區組,為了濾除區組之間的變異性,我們在每個區組內為:個處理中的每個處理分配一個試驗單元。在上述例子中,我們有 =4處理(塗料的型別)和 =4個區組(位置)。 我們可以給出隨機化完全區組設計的定義如下: 定義 15.1 隨機化完全區組設計是用來在6個區組中比較:個處理的試驗設計,其中每個區組包含:個齊性的試驗單元。在區組內隨機地把處理分配給試驗單元,在每個區組中,每個處理只出現一次。 隨機化完全區組設計具有一些長處和不足,列出如下。 隨機化完全區組設計的長處與不足長處 1.該設計對於有單個外部變異來源的情形,可用於,個處理均值的比較; 2. 其統計分析簡單;

15.3 隨機化完全區組設計•957• 3. 設計容易構造; 4.可以用在有任意個區組和任意個處理的情況。 不足 1.由於區組內的單元必須是齊性的,設計最好用在處理個數相當小的情形; 2.該設計只控制一個外部變異來源(即源於區組的變異)。另外的外部變異來源將傾向於增加誤差項,使得對處理差異的探察變得更加困難; 3. 每個處理對下響應的效應在各個區組中必須是相同的。 考慮表15.8中來自於隨機化完全區組設計的資料。注意,雖然這些資料看上去與完全隨機化設計中的資料(見表15.3)相似,但與試驗單元分配處理的方法是有差別的。 表15.8 隨機化完全區組設計的資料區組處理 1 2 1 Y11 Y21 2 Y12 Y22 b ¥16 y26 … … 均值 y1 $2. … 均值 ½:1 $1 Y:2 $.2 … $。 對於來自於隨機化完全區組設計的一個觀測值,其模型可以寫為形式 3=H+a+B+E 其中模型的各項定義如下: 2:第;個區組中接受處理:的試驗單元上的響應值;:總的處理均值,未知常數; a:處理;的效應,未知常數; 及:區組;的效應,未知常數; 8:第;個區組中接受處理;的試驗單元的響應的隨機誤差。我們要求各個,服從均值為0,共同方差為的正態分佈。另外,這些誤差之同相互獨立。 由我們對模型要求的這些條件可以得出,記錄到的第;個區組中處理;的響應值服從均值為 E(yi)=p+ ai+ B; 方差為品的正態分佈。表15.9給出了表15.8 中的資料的總體均值(期望值)。

• 958、 第士五章標準設計的方差分析表15.9隨機化完全區組設計中 sy的期望信區組處理 1 2 …. 1 E(yu)= 十十 E(y21)= +a2+店 2 E(y22)= +81+B2 E(y22)=p+az+B2 … b E(16) +a+B E(y26)= +a2+多 E(ya) +a+B E(y2=p+0;+P2 ⋯ ECy)= +a+B 關於這個期望值的表做以下幾點說明。第一,任何一對接受相同處理的觀測值(在表15.9中出現在同一行)的均值之間只有區組效應8,不同。例如,y11和 312(接受處理1的兩個觀測值)的期望值為 E(yu)= +a1+B E(ya)=k+a1+B 它們的差為這說明了這樣一個事實:即y11是在區組1中記錄到的,y12是在區組2中記錄到的,但二者都是來自於接受處理1的試驗單元的,因而,沒有處理效應的差異存在, 只可能有區組效應的差異。第二,在同一區組中的兩個觀測值(在表15.9中出現在同一列)的均值之間只有處理效應不同。例如,311和y21都出現在區組1。由表 15.9,它們的均值的差為 E(y11)- E(yz)=(+ai+8i)-(p+a2+Bi)=01-82 它說明了這樣一個事實:即這些試驗單元接受了不同處理,但是在同一區組中被觀測的,因而,二者之間只可能有處理效應的差異存在,沒有區組效應的差異。第三, 對於接受不同處理,並在不同的區組中被觀測的兩個試驗單元,它們的響應值的期望值之間既有處理差異的效應,也有區組差異的效應。比如,觀測值y11和y22的期望值之差為 E(yu)-E(y22)=(k+a1+B)- (+a2+B)=(01-02)+(B1-B2) 利用這些有關隨機化區組設計的模型的知識,我們可以說明過速的概念,並看出隨機化區組設計如何濾除了由區組帶來的變異。考慮一個有t=3個處理(1,2 和33,6=3個區組的隨機化區組設計,如表15.10所示。 衰15.10 有1=3個處理, 3個區組的隨機化完全區組設計區:組 •1 2 3 處理 1 1 3 2 3 1 3 2 2

15.3 隨機化完全區組設計•959• 這個隨機化區組設計的模型是 Yi= ktatB+Ei (i=1,2,3 j=1,2,3) 假設我們希望估計處理2和處理1的平均響應的差,即∞2—81。相應的樣本均值的差 2.— 1.可以作為c2 a」的一個點估計。代入上面的模型,得到 =K+aL+B+E 其中日表示三個區組效應防,B2和Bs的平均值,可表示蘭個隨機誤差 E11,512和 E1s的平均值。同樣,容易得到 2. +Q+B+E 由此 2.-31.=(02-a1)+(E2-E1) 注意區組效應是如何消去,從而留下(E2 E)作為用 2. 1估計a2-01的誤差的。 如果用一個完全隨機設計代替了隨機化完全區組設計,處理就會被隨機地分配給試驗單元,不大可能出現每一個處理在每個區組中都出現的情況。當一個處理在一個區組中出現多於一次時,我們用 2.—1.作為a2—a1的估計,就不能像上面那樣所有區組效應都消去。這樣,估計的誤差就不僅包含E2一百,而且還包含消不去的區組效應,也就是說, 2. 1.=(a2-a1)+[(E2 E」)+(未消除的區組效應)] 因此,隨機化區組設計在比較處理均值時,濾除了源於區組的變異性,從而減少了估計的誤差。 圖 15.1 是一張期望值P;的圖。它表明,不同區組(比如說;和j)中接受相同處理的觀測值的均值之間的差,對於所有處理是一致的,即對i=1.,1 這意味著具有相同處理的均值之間的連線形成一組平行線。 使用隨機化完全區組設計的主要目標是考察:個處理均值p1.,從2.,“,A.之間的差異,這裡A:.為處理;的平均響應。零假設是處理均值之間沒有差異,研究假設是處理均值之間有差異,即 Ho:P1. - P2. =…=隊. H:至少有一個 A.與別的不同這組假設等價於檢驗 Ho:a1= a2 =…= a =0 H:至少有一個a:不為0

• 960• 第十五章標準設計的方差分析處理一處理均值圖符號代表區組 100t 90+ 80; Pi 70 4' 60; 502' 401 1 .2~ / / -2 / 處理圖15.1 隨機化區組設計中的處理均億這兩組假設之所以是等價的,是因為正如我們在表15.9中所看到的那樣,當比較同一個區組中的兩個不同處理的平均響應時,這兩個平均響應的差為 Ai. -HI.'=ai-ai 所以,在H。下,對於給定的區組,這兩個處理有相同的平均響應。透過考察隨機化區組設計的模型,並把總平方和分解為處理效應、區組效應和隨機效應三個部分,我們可以得到上述假設的檢驗統計量。利用表15.8,我們可以引人分解總平方和所需要的記號。這些記號如下。 2i:區組;中處理;上的觀測值 t:處理個數 b:區組個數可1:處理:的樣本均值,了:一言2)9 3:區組;的樣本均情,子,= 二1-105 各觀測值關於它們的平均值的總平方和,與以前一樣,定義為

15.3 隨機化完全區組設計•961• 這個平方和將被分解成三個不同的變異來源:一個是源於處理之間的變異,一個是源於區組之同的變異,另一個則是源於不能被處理差異和區組差異所解釋的所有其他的變異,稱之為誤差。TSS 的分解可以透過對隨機化完全區組設計的模型 i +a++e 的考察得到。模型中的引數有樣本估計: 用一些代數計算可以證明TSS具有如下形式: 我們用上面的引數估計來解釋這個分解中的各項。等號右邊第一項度量了各處理均值:相對於總平均值了.的變異性。因此稱為處理間平方和,它是各個y中由於處理均之間的差異而產生的變異性的一個度量。類似地,第二項度量了各個區組均值相對於總平均值的變異性,稱之為區組間平方和。第三項,稱為誤差平方和,SSE,表示各yy中沒有被處理和區組差異所解釋的變異性。這一項有幾種不同的表示形式: 其中eu=2;一k一ai一月,為用來驗證模型條件的殘差。我們可以把這些計算總結成如表15.11 的AOV表。 表15.11 陳機化完全區組設計的方差分析表來源 S5 df MS ……… F 處理 SST 1-1 MST=SST/(-1) MST/MSE 區組 SSB 6-1 MSB=SSB/(6-1) MSB/MSE 誤差 SSE 總和 TSS b-1 對 Ho:a1 = a2 = 0=0H:至少有一個a不為。

• 962. 第十五章標準設計的方差分析的檢驗統計量為比值 F-MH MSE 當Ho:a1=a2=…=a.=0為真時,MST和MSE 都是試驗誤差方差。的無偏估計,也就是說,當 H。成立時,MST 和 MSE 在大量重複抽樣時的均值都等於。 這一均值稱為期望均方。這一事實表示為 E(MST) = o E(MSE)=02 由此,我們可以期望當H。為真時,F=MST/MSE 的值接近於1。 當H。為真時,MSE 的期望值仍然是。。然而,MST此時不再是?的無偏估計。事實上,可以證明處理的期望均方為 E(MST) = 0+60g 其中&r= -1 Za? 因此,處理均值中大的差異會導致8r有大的取值,MST 的期望值將比 MSE 的期望情來得大。這樣,比值 F=MST/MSE 將傾向於比1大。於是,當我們觀測到的 F 值大於一個F分佈的右側尾部的值時,就拒絕 Ho。 對於一個取定的犯第一類錯誤的機率,上述討論給出了下面的判決規則: 拒絕 H0:01=a2=…=0,=0 當F=MST/MSE 大於 Fa.dt,d 這裡Fw.出,d,是用a=取定的犯第一類錯誤的機率,df = dfvsr =1—1和 dfz =dfnsz=(8-1)(t-1)從附錄的表8中查出的。另一種方法是利用值=P(Edf,此>Fos) 計算檢驗統計量的值,其中的機率是用自由度dfi= 1和df=(1)(-1) 的F分佈計算的。計算出值後,我們比較p值與取定的犯第一類錯誤的機率, 小的p值支援研究假設,而對大的盧值,我們則不能拒絕Ho。 一般來說,僅當考察區組劃分是否有效地減少了試驗單元的變異性時,才討論區組效應,因而不檢驗關於區組效應的假設。然而,我們仍然可以問,在一個試驗中,區組劃分是否提高了處理均值比較的精度。以 MSERcB和 MSEcR分別記一個隨機化完全區組設計和一個完全隨機化設計的均方誤差。兩個設計的精度的一種度量是第;個處理均值估計的方差,雙=:(i=1,2,⋯,t)。對於一個隨機化完金區組設計,:的估計方差為MSERc/b。對於完全隨機化設計,:的估計方差為MSEcR/r,這裡,是每個處理的重複觀測數,滿足關係式 MSEo = MSERTE 或 MSEGR=! MSERCR 數稱為隨機化完全區組設計與完全隨機化設計相比較的相對效率,記為RE (RCB, CR)。MSEca 比 MSERcB大得越多,要想在完全隨機化設計中得到的處理均

15.3 隨機化完全區組設計•963• 值估計的精度與在隨機化完全區組設計中相同,所需要的,就越大。因此,如果區組劃分是有效的,我們可以期望,隨機化完全區組設計中試驗單元中的變異性比完全隨機化設計中試驗單元中的變異性要小,比值 MSEcR/MSERcB會較大,從而, 比大許多。這樣,要在估計p:時達到同樣的估計精度,在完全隨機化設計中所需要的資料董比在隨機化完全區組設計中所需要的要大。當區組劃分沒有效果時,比值 MSEcR/MSERcB將接近於1,r和6相近。 對隨機化完全區組設計相對丁完全隨機化設計的效率的評估,不能用實踐的方法來進行,因為我們並不實施完全隨機化設計。然而,我們可以使用隨機化完全區組設計中的均方,即 MSB 和 MSE,透過公式 RE(RCB,CR)= MSEcR = (6=1)MSB+b(L- 12MSE MSERCB (bt -1)MSE 來得到相對效率 RE(RCB, CR)。當 RE(RCB, CR)遠比1大時,r比大,我們就可以說區組劃分是有效的,因為在完全隨機化設計中比在隨機化完全區組設計中需要更多的觀測值。 例15.2 某研究人員進行「一個試驗,來比較三種不同的殺蟲劑在一種菜豆上的使用效果。為了得到充分的資料,有必要利用4塊不同的主地做試驗。由於這4 塊地的土壤肥力、灌溉條件和避風情況有些差別,該研究人員決定以地塊作為區組,進行隨機化完全區組試驗。每個地塊分為三行,各行之間留有一定距離,以便殺蟲劑能夠限制在一行中使用。每行種植100 粒種子,並使用指定給該行的殺蟲劑。在每一地塊內,殺蟲劑被隨機地分配給塊中的行,使得在該地塊中每一種殺蟲劑有一行使用。關心的響應變數是每行中的出苗數,資料和均值由表15.12給出。 表15.12 例15.2中按殺蟲劑和地塊給出的出苗數地塊殺蟲劑 1 2 3 地坎均值 1 $6 83 80 73 2 48 78 72 66 3 66 94 83 81 4 62 93 85 80 2.對這個試驗,寫出適當的統計模型。 b.進行比較三種殺蟲劑效果的方差分析,取a=0.05。 c.把你的結果總結在 AOV 表中。 殺蟲劑均值 58 87 80 75

•964• 第十五章標勝設計的方差分析 d.計算隨機化完全區組設計相對於完全隨機化設計的相對效率。 解答我們看出,該試驗是一個有6=4個區組,每個區組有:=3個處理的隨機化完全區組設計。其統計模型為 Y= +a+所+Ei= 1,2.3 j=1.2,3,4 從表15.12可知,我們可以用p.=來估計處理均值p4,計算結果為 A1. = 58 p2. =87 A3. =80 看來使用殺蟲劑1的行與使用其他兩種殺蟲劑的行比起來出苗最少。下面我們估。用= .=75,我們得到殺蟲劑效應 a1=58-75=-17 =87-75=12 as =80-75=5 區組效應 B=73-75=-2 B2=66-75=-9 Bs=81-75=6 8A=80-75=5 把這些式子代入平方和,得到 TSS - Z(yi .)= ($6-75)2 + (48-75)2+ …+ (85 - 75)2 = 2.296 SST - 62 (a) = 41(-17)2+ (12)3+ (5)2]= 1,832 SSL-127(R =31(-2)2+(-9)2+ (6)2+ (5)21=438 相減得 SSE=TSS - SST-SSB=2,296-1,832-438=26 表15.13中的方差分析表總結了上述結果。注意,表中某一來源的均方由該來源上的平方和除以其自由度得到。 表15.13 例15.2 中資料的 AOV 表來源處理區組誤差總和 SS 1,832 438 26 2,296 df 2 3 6 MS 916 146 4.3333 F 211.38 33.69 P值 0.0001 0.0004

15.3 隨機化完全區組設計•965• 對處理均值間差異的F 檢驗,即 Ho:a1= a2 = …= a:=0 H:至少一個;不為0 使用比值 MST/MSE。由於計算所得的F值211.38大於由df =2,df =6以及 a=0.05食得的分佈的表值5.14,我們拒絕Ho,認為在三種殺蟲劑下的出苗數有顯著差異(<0.0001)。 接下來我們討論區組劃分相對於完全隨機化設計是否提高了分析的精度。從 AOV 表,我們得到 MSB=146,MSE=4.3333.因而,該隨機化完全區組設計相對於完全隨機化設計的相對效率為 RE(RCB, CR) =(6-1)MSB+604= L)MSE (b - 1)MSE (4-2146+403-164:3333)=9.92 1(4)(3)-1J(4.3333) 即在完全隨機化設計中,為了得到與隨機化完全區組設計中處理均值估計的同樣精度,每個處理需要大約10倍數目的觀測值。這些地塊在物理特徵上有相當大的差異,因此,在這個試驗中,區組劃分起到了關鍵的作用。 例15.2中的結果僅當我們能夠確認模型條件與觀測到的資料的表現相一致時,才是有效的。因此,我們用殘差ew= 一a,一B,來看一看模型的正態性系件,等方差條件,觀察相互獨立的條件在資料中是否看上去得到了滿足。下面的例子中包含了這種分析的計算機輸出結果。 例15.3 這裡給出例 15.2中試驗的計算機輸出結果。對這些結果與用平方和的定義計算的結果進行比較,並說明模型條件是否看上去得到了滿足。 Dependent Variable: NUNBER OE SERDL INGS Source Hodel Error Corrected Total DF 5 6 11 sum of Sqvares 2270.0000 26.0000 2296.0000 Hean Square 454.0000 4.3333 F Value 104.77 Pr>E 0.0001 Source INSECTICIDES FLOTS DF 2 3 Type ISS 1632.0000 438.000 Mean Square 916.0000 146.0000 F Value 211.38 33.69 PrYE 0.0001 0.0004 RESIDUAL ANALYSIS

•966• 第十五章標準設計的方差分析 Variable = RESIDURLS N Mean Std Dev Skewness N:Normal Sten Leaf 200 1 000 0 000 -D -1 00 -20 -3 0 Moments 12 Sum Wgts Sum 1.537412 Variance -0.54037 Kurtosis 0.942499 Pr≤™ # 2 3 3 2 1 1 12 0 2-363636 -0.25385 0.4938 KTest of Normality Boxplot +-----+ *--+ • Variable = RESIDUALS Normnal Probability Plot 2.5+ * ++*+++ **+*+++++ * * +*+++++ -0.5+ +*++++ ++*++++ +++*++ -3.5+++++++ +⋯。 -2 -1 0 -- +1 +2 解答注意我們手算的結果與這裡給出的計算機輸出結果一致。一般說來, 我們的手算結果有一些舍入誤差,從而得到的結果與計算機輸出結果有一些差別。 我們強烈建議,在方差分析中使用計算機軟體程式進行計算,以避免這些潛在的舍入誤差。至於說到模型條件是否得到滿足,我們首先指出,對於假設Ho:殘差服從正態分佈,Shapiro-Wilks 檢驗的p值為0.4389,因而我們不能拒絕Ho,正態性條件看來得到滿足。另外,莖葉圖、盒型圖和正態機率圖也都與殘差服從正態分佈的條件相吻合。圖15.2是一張殘差-一估計處理均值圖。從該圖可以看出,殘差中的變異性不隨處理而變化。

15.3 隨機化完全區組設計•967 殘差 24 A A A AA 0+ A-—A -1 -24 A A A -3+ 40 A 70 預溯值圖 15.2 殘差一處理均值 'Tbo 練習 15.1(數育)某研究人員要確定讓來自於低收入社群的一年級學生參加一個 “良好的開端”的活動是否有助於他們改善在學校的表現。該研究人員得到一個由六個參加了這個活動的孩子和六個沒參加該活動的孩子組成的隨機樣本。這些孩子在家裡從父母那裡得到的支援的型別大不相同,因此,在瞭解了這十二個孩子的家庭環境後,研究人員基於家庭環境的相似性對這些孩子進行了配對。在一年級完成以後,對這些學生進行了綜合智力測驗,結果如下。 測驗得分配對 1 2 3 4 5 6 參加了“良好的開端”的活動 58 73 85 76 88 90 未參加“良好的開端”的活動 47 67 69 62 77 77

• 968• 第十五章標準設計的方差分析 a.參加了“良好的開端“活動的學生是否比不參加該活動的學生有更高的平均得分?a=0.05。 b.給出隨機化完全區組設計相對於完全隨機化設計的效率。解釋你的結果。 15.2 參考練習15.1.用配對:檢驗來分析上述資料,並把結果與練習 15.1 中的結果進行比較。(在隨機化完全區組設計中處理差異的F 檢驗,在只有兩個處理的情形,等價於第六章的配對:檢驗) 15.3(工程) 在火箭推進劑的研製中進行一項試驗,比較由氧化物、黏合劑和燃料作為成分的四種混合物。這四種混合物,按照放入的氧化物的混合比例列出為: 混合物 1 2 3 4 氧化物 0.4 0.4 0.6 0.5 黏合劑 0.4 0.2 0.2 0.3 燃料 0.2 0.4 0.2 0.2 為了比較這四種混合物,為每種混合物準備丫S個不同的樣品用來做試驗。 有5位實驗員。隨機地為每位實驗員在每種混合物中指定一個樣品,要求其測量這些推進劑樣品的推力。資料總結如下: 混合物 1 2 3 4 1 2.340 2,658 2,449 2.403 2 2.355 2,650 2,458 2,410 實驗員 3 2,362 2.665 2.432 2.418 4 2.350 2,640 2,437 2.397 s 2,348 2,653 2.445 2.405 2.找出該試驗中的區紐和處理。 b.給出隨機化的方法。 c.為什麼對於該試驗,在完全隨機化設計和隨機化完全區組設計中更喜歡用後者? 15.4 參見15.3。 嗎.對這個試驗寫出一個模型。 b.估計模型中的引數。 c.用下面給出的計算機輸出結果做方差分析,其中a=0.05。

15.3 隨機化完全區組設計 • 969• d.關於被試驗的四種混合物中最好的混合物,你能給出什麼結論?(注:響應值越高,火箭推進劑的推力越好) e.計算隨機化區組設計相對於完全隨機化設計的相對效率。對所得值給出解釋。區組在減少試驗單元間的變異性方面效果如何?給出解釋。 General Linear Models Procedure For Data in Exercise 15.3 Dependent Var iable:THRUST Source Hodel ErTOr Corrected Total DF 19 Sum of Squares 261713.45 826.30 262539.75 Hear Square 37387.64 68.85 F Value 542.96 PE>E 0.0001 R-Square 0.996853 C.V. 0.336807 Root NSE 8.2981 Y Hean 2463.8 Source M I DE 3 4 Tye I SS Mean Square 261260.95 87096.98 452.50 113.12 F valve 1264.73 1.64 Pr>E 0.0001 0.2273 15.5(心理學)一位在一象大公司工作的工業心理學察做一項試驗,以評價背景音樂對於秘書打字效率的影響。他從眾多的秘書中挑選了一個由七個人組成的隨機樣本。給每個秘書放二種背景音樂:無音樂,古典音樂和激烈的搖滾樂,然後對她們進行標準的打字測驗,以測驗他們的打字速度在出現打字錯誤時給以懲罰。對於每一個參加試驗的秘書,隨機化指定放聽音樂的順序。在下面給出的結果中,得分越高,表現越好。這是一個特殊型別的隨機化完全區組試驗,其中單個的試驗單元用作一個區組,接受所有的處理。 音樂型別無音樂激烈搖滾古典 1 20 20 24 2 17 18 20 3 24 23 27 秘書 4 20 18 22 5 22 6 22 28 7 18 19 16 a. 對這個試驗寫出一個統計模型,並估計你的模型中的引數。 b.對於這三種音樂,平均打字的效率之間有無差異?取a=0.05。 c.對於該隨機化完全區組設計,可加模型合適嗎?(提示:像圖15.1那樣,畫

• 970• 第十五章標準設計的方差分析出資料的圖) d.計算該隨機化區組設計相對於完全隨機化設計的相對效率,並對該值進行解釋。區組在減少試驗單元的變異性方面有效嗎?為什麼? 15.6 參見練習15.5。練習15.5中資料的計算機輸出結果如下。比較這裡的結果和你計算的結果。模型的條件是否看上去得到了滿足? General Linear Nodels Procedure For Erercise 15.5 Dependent Variable:TYPING EFEICIENCY Source Hodel Error Corrected Total Source H $ RESIDUAL,ANALYSIS: Variable = RESIDUAL 8 12 20 R-Sqpare 0.863989 DF 2 6 Sum of Squares 180.28571 28.38095 Nean Sqvare 22.53571 2.36508 208.66667 C.U. Foat HSE 7.208819 1.5379 Tvpe I ss Mean Square 30.9523日 15.47619 149.33333 24.88889 N Mean Std Des Skewness W:Normal Sten Leaf 2 5 1 03 0 001355789 -0 9985211 -1 日 -2 -3 3 Moments 21 Sum Ngts 0 Sun 1.191238 Variance -0.77527 Kurtosis 0.936418 Pr≤F # 1 2 9 7 11 1 F Value 9.53 Pr>F 0.0004 Y Mean 21.333 F Value 6.54 10.52 Er>E 0.0120 0.0003 21 o 1.41904B 2.587721 0.1813 Boxplot 0 +1-+-!+ + 1---+

15.3 隨機化完全區組設計• 971• Normal Probability Plot 2.5+!」 -0.5+ ++*十十十十+ +++*+*++ **t*+ +*+** ***+* *+++ ++*+++++ 1+++++++++ -3.5+ •4 -2 -1 +1 -+ +2 PIOL Of RESIDUAL VERSUS ESTIHATED TREATMENT MEAN FBS I 3+ A 2 A 一中 AA A A A A A 0 -I -4 -3+ -4+ A A A A A A A A A A A ESTIHATED TREATMHENT MEAN

•972• 第十五章標準設計的方差分析 15.7(心理學)一位質量控制工程師想辦一個訓練班,對工人進行全面質量管理(TQM)原理的培訓。要在全公司進行這樣的培訓費用巨大,因而該工程師想看一看四種型別的培訓班中哪一種最有效。響應變數是在參加培訓班後工人生產產值的增加。由於培訓的效果可能與上人事先對於TQM 的態度有關,在參加培訓班以前,就工人對TQM 的態度進行了測試,並依據測試結果把他們分成了五經,每組有四個人。在每個組中,隨機地把這些工人分派到四種型別的班中。工人的產值增量如下。 訓練班型別— 2 A B C 33 38 37 40 42 D 54 50 均值 40.5 41.75 態度 3 39 43 45 55 45.5 —— 均值 4 42 47 $2 62 50.75 62 71 74 84 72.75 42.8 46.6 50.6 61.0 50.25 8.對這個試驗寫出一個統計模型,並估計你的模型中的引數。 b.對於這四種訓練班,平均產值增量之同有無差異?取&=0.05。 c.對於該隨機化完全區組設計,可加模型合適嗎?(提示:像圖15.1那樣,畫出資料的圖) d.計算該隨機化區組設計相對於完全隨機化設計的相對效率,並對該值進行解釋。區組在減少試驗單元的變異性方面有效嗎?為什麼? 15.8 參見練習15.7。練習15.7中資料的計算機輸出結果如下。比較這裡的結果和你計算的結果。模型的條件是否看上去得到了滿足? General Linear Models Procedure For Bxercise 15.7 Dependent Var iable: INCREASE IN PRODUCTIVITY Sum of source Model ETTOr Corrected rotal DF 7 12 19 Squares 3708.0500 55.7000 3763.7500 Hean Square 529.7214 4.6417 F Value 114.12 Fr>F 0.0001

Source A R-Square 0.985201 DE 3 4 RESIDUAL ANALYSIS: Hean Std Der SkewTess W;Norual Stem Leaf 3 7 28 1 029 0 5599 -0 88110 -1 8321 -2 5 -33 3.5+ 15.3 隨機化完全區組設計• 973• C.V. 4.287468 Root MSE 2.1545 Y Mean 50.250 TyPe I Ss Mean Square 922.5500 307.5167 2785.5000 696.3750 F Value 66.25 150.03 Er>E 0.0001 0.0001 Maments 20 Sum Higts 0 Sum 1.712185 Variance 0.207266 Kurtosis 0.985267 Pr<w 20 2.931579 0.149301 0.9725 # Boxplot 1 3 4 1 1 + +--+ * ————* | Normal erobability Plot + *++++ ++*+++ +++*+* ++***+ +***+ -3.5+ *+*+** +++*++ ++++*+ -2 -1 0 ----- -1 +2

• 974• 第十五章標準設計的方差分析 Plot of RESIDUALS VERSUS ESTIHATED TREATHENT MEAN RES! 4 + 3+ 2 + 1+ A A A A A A A A A 0t -1 A A A A A A A A -2 A -3 † -4 4 A $t ESTIHATED TREATWENT MEAN 15.4 拉丁方設計隨機化完全區組設計用於有一個因子,並且實驗員要控制一個外部變異因子的情況。對於有多個可能的外部變異來源的情形,拉丁方設計是適當的設計。考慮下面的例於。 例 15.4 一家大的律師事務所正在研究在四種電子表格軟體中哪一種對他們的秘書班

15.4 拉丁方設計•975, 子更合適。所有這四種軟體都來自於國內知名的軟體公司,因而這幾個軟體的輸出質量都是可以接受的。對這些軟體的最後的選擇取決於哪•種軟體更容易學。 事物所的軟體顧問注意到,學習軟體中各種子程式所用的時間與秘書個人以及所處理問題的型別有關。由於參加到研究中來的秘書不能正常工作,事物所決定從秘書班子中只選四人參加該試驗,並限制他們離開日常崗位的時間。因此,顧問選定了四種型別的問題,並決定讓每個秘書完成一項屬丁其中一種型別的任務。該研究中所要考慮的因子為電子表格軟體:A,B,C,D 秘書:1,2,3,4 問題:1(賬日),1(資料表),皿(概括統計量),I(圖表) 對於顧問來說,秘書和問題型別這兩個因子為必須要考慮的外部變異來源,但不是最主要的。響應變數是秘書完成指定的任務所需要的時間,每個秘書都要完成四個問題。該顧問首先考慮用表15.14給出的隨機化完全區組設計。 表15.14 電子表格軟體研究中的一個隨機化完全區組設計秘書 - 問題 1 I 皿 A B D C 2 A D B C 3 C A D B 4 A D B 在這個設計中,對於每一位秘書,分別把她所要使用的四種電子表格軟體隨機地分配給她所要完成的四個問題。假設問題型別對完成該項任務所需時間有強的影響,比如,第1類問題費時遠比其他問題多,而第N類問題費時最少。那麼,該設計對於軟體A將產生•-個很大的負偏差,因為該軟體三次用於解決第I型別的間題,同時對於軟體C會產生一個正偏差,因為它三次被用於解決第N型別的問題。 這樣,如果用軟體C完成四項任務的平均時間最短,我們不能確定到底是由於軟件C是好程式還是由於四項任務中有三項為第N型別的問題。 此例說明了這樣-種情形,即試驗單元(例中的問題)受到問題的型別和解決問題的秘書這兩個外部變異來源的影響。為了在速除第一個變異來源,也就是秘書的影響的基礎上,再濾除第二個變異來源,即問題的型別的影響,我們可以修改上述的隨機化完全區組設計。為此,我們對隨機化進行限制,使得每個處理出現在每一行(問題型別)和每一列(秘書)。表15.15就是這樣的一個隨機化。注意,電

•976• 第十五章標準設計的方差分析子表格軟體已經這樣被分配到問題的型別和秘書:每個電子表格軟體在每個型別的問題上使用一次,每個秘書使用一次。因此,這種調整使得利用樣本均值進行的電子表格軟體的成對比較,免受由問題型別和秘書的不同而產生的變異的影響。 悽15.15 電子表格軟體研究中的一個拉丁方設計秘書問題 I I ™ 1 A B c D 2 3 4 B C D A C D A B D A B C 這個試驗設計稱為拉丁方設計。一般地,一個拉丁方設計可以用於在有兩個外部變異來源存在的情況下比較:個處理均值,其中我們要把這兩個外部因子分別劃分成為:行和t列,然後把這:個處理隨機地指定給這些行和列,使得每令處理在每行中出現一次,在每列中出現一次(見表15.15)。 拉丁方設計的長處和不足列出如下。 拉丁方設計的長處與不足長處 1.設計尤其適合於在有兩個外部變異來源,每個變異來源有:個水平的情況下,比較:個處理的均值。 2. 分析簡單。 不足 1.雖然對於任何:的值都可以構造出拉丁方,但當5≤≤10時,拉丁方設計曼適合於用來比較:個處理。 2. 任何另外的外部變異來源都會使誤差項膨脹,從而使得對處理均值間的差別的探察變得更加困難。 3.每一個處理對於響應值的效應必須在每一行上近似相同,在每一列上也近似相同。 下面給出拉丁方設計的定義。 定義15.2 一個 X1拉丁方設計包含:行和:列。t個處理被隨機地分配給在行和列中的試驗單元,使得每個處理出現在每一行和每一列中。

15.4 拉丁方設計•977• 拉丁方設計中響應值的模型可以寫為 Yi=p+吸+B+Y+E 其中模型中的項定義如下: 2i:第i行第;列試驗單元上的觀溯值; F:總平均值,未知常數; ck:處理的效應,未知常數; B:第i行的效應,未知常數; Yj:第;列的效應,未知常數; sj:第i行第;列上試驗單元上的響應值的隨機誤差。我們要求各個Ei服從均值為0,共同方差為。的正態分佈。進一步,誤差必須是相互獨立的。 可以得出,在上述模型條件下,在第;行第;列試驗單元上記錄到的響應值服從均值為 E(y) +&R+B+Y 方差為。?的正態分佈。注意,這裡我們不必指明試驗單元所接受的處理,因為一且我們知道了試驗單元處於哪行哪列,它所接受的處理也就知道了。 我們可以用這個模型來說明拉丁方設計如何濾除了由行和列中的變異來源產生的變異。為此,我們考慮一個有:=4處理(I,I,皿,W)的拉丁方設計,其中兩個外部變異來源各有4個水平。該設計在表15.16 中給出。 表15.16 一個4×4拉丁方設討列行 1 2 1 I I 2 3 4 皿 ™ ™ I 3 皿 ™ I 4 ™ I 如果我們希望用樣本均值的差 3一來估計a3一a1,即處理和處理1的平均響應的差,那麼,可以從模型得到和的表示式,計算時留心這些姬理出現在哪一行哪一列。以y;記第;行第;列的觀測值,由表15.16知 + 2 +333+202) 三十a1+ 當(B+阪+月+B)+元(Y+ Y2+ Y3+Y4)+E

• 978• 第十五章標準設計的方差分析其中E」是處理1上四個觀測值的隨機誤差的平均值。同樣, y3== 4 (y13 + yz2 + y31 + y4) -(B1+B2+Bs+B4)+六(Y1+Y2+Y3+Y4)+E3 =隊+ a3+ 樣本均值的差為 a3-a1的估計誤差是可一E1。 如果使用了隨機化區組設計,並且在其中以行作為區組,那麼處理僅在各行內被隨機化,這就很可能有某些處理在同一列中出現多於一次,樣本均值的差也就成為由此,估計的誤差會由於這些消不去的列效應而膨脹。由於同樣的原因,如果在拉丁方設計適用的場合使用了完全隨機化設計,那麼估計的誤差也會由於消不去的行列效應而膨脹。 我們可以對給定的關於模型中引數的假設進行檢驗。特別地,我們可能希望檢驗:個處理均值之間沒有差異這樣一個假設。這個假設可以敘述為 Ho:a1= a2 = …=a.=0(即:個處理均值是相等的) 備擇假設為 H:至少有一個 a:不等於0(即至少有一個處理均值與其他均值不同) 透過考察拉丁方設計的模型,並把總平方和分解為處理效應、行效應、列效應和隨機效應幾項,我們可以得到該假設的檢驗統計量。 各觀測值關於它們的平均值的總平方和,與以前一樣,定義為這個平方和將被分解成四個不同的變異來源:一個是源於處理之間的變異,一個是源於行之間的變異,一個是源於列之間的變異,另一個則是源於既不能被處理差異也不能被行列差異所解釋的所有其他的變異,稱之為誤差。TSS 的分解可以透過對拉丁方設計的模型 Y=R+a+R+Y+E 的考察得到。模型中的引數有樣本估計: 我們用上面的引數估計來解釋這個分解中的各項。等號右邊第一項度量了各處理均值。相對於總平均值的變異性。因此

15.4 拉丁方設計•979• 稱為處理間平方和,它是各個 v;中由子處理均值之間的差異而產生的變異性的一個度量。第一項度量了各個行均值:相對於總平均值的變異性,稱之為行間平方和。第三個變異來源,稱為列間平方和,度量了各個列均值了;相對於總平均值的變異性,它由給出。最後的變異來源稱為誤差平方和,SSE 表示各y;中沒有被處理和行、列差異所解釋的變異性。這一項由 SSE = TSS-SST-SSR SSC 給出。我們可以把這些計算總結成如表15.17的AOV表。 來源處理行列誤差總科 SS SST SSR SSC SSE T$5 表15.17 tX1拉丁方設計的方差分析表 df MS 1-1 MST=SST/(t-1) ~1 MSR=SSR/(t-1) t-1 MSC=SSC/(1-1) (t-1)(12) MSE=SSE/(L-1)(t-2) t-1 F MST/MSE MSR/MSE MSC/MSE Ho:01=02=…=a:=0 的檢驗統計量為比值 H&:至少有一個 ok 不等於0 F-MST MSH 對於我們的模型,有 E(MSE)= 和E(MST)=哈+8T 其中0r=[1/(1-1)1乙喉。當Ho為真時,a& 等於0對於一切二1,…,1成立,從而6=0。由此,當H。為真時,我們可以期望 MST/MSE 的值接近於1。然而,在研究假設 H。下,0. 大於0,因為至少有一個 《x 不為Q。因此,處理均值中大的差異會導致8.有大的取值,MST 的期望值將比 MSE 的期望值來得大。這樣, 我們可以期望 F=MST/MSE比1大。於是,當我們觀測到的F俏大於一個買分布的上尾部的值時,就拒絕 Ho。

•980• 第十五章標準設計的方差分析對於一個取定的犯第一類錯誤的機率,上述討論給出了下面的判決規則: 拒絕 Ho:Q1=a2=…=0,=0 當F=MST/MSF: 大幹 Fo.df,t. 這裡,F。.d,d,是用 a=取定的犯第一類錯誤的機率,d=dlwusr=t-1和 dlfz= dfMsE. =(1-1)(t-2)從附錄的表8中查出的。另一種方法是利用 P值-P(Fa,d>Fdo) 計算檢驗統計量的值,其中的機率是用自由度為d= 1和dfz=(t-1)(2)的F分佈計算的。計算出值後,我們比較p值與取定的犯第一類錯誤的概率,小的p值支援研究假設,而對大的值,我們則不能拒絕Hoo 一般來說,僅當考察行列劃分是否有效地減少了試驗單元的變異性時,才討論行和列的效應,因而一般不檢驗關下行列效應的假設。像在隨機化區組設計中一樣,我們可以與完全隨機化設計比較效率。我們想知道,在一個試驗中,考慮行和列的變異來源是否提高了處理均值比較的精度。以 MSELs和 MSEcR分別記一個拉工方設計和一個完全隨機化設計的均方誤差,以RE(LS, CR)記與完全隨機化設計進行比較時拉丁方設計的相對效率。我們可以用拉丁方設計中的均方 MSR, MSC 和 MSE,透過下列公式來計算相對效率 RE(LS, CR): RE (L.S, CR)- MSECR MSEL- MSR + MSC+(1-1)MSE (t+ 1)(MSE) 當 RE(I.S,CR)遠比1大時,我們就說行和(或)列的變異來源是有效的,因為要想在估計處理均值時獲得同樣的精度,在完全隨機化設計中比在拉丁方設計中需要更多的觀測值。 例 15.5 例15.4中那家律師事物所進行了評價電子表格軟體的試驗,所得資料見表 15.18。利用這些資料回答下列問題。 8,對該試驗,與出一個適當的模型。 b.為比較用這些電子表格軟體完成任務所需的平均時間,做方差分析。取 =0.05。 •把你的結果總結在 AOV 表中。 d.計算拉丁方設計相對於完全隨機化設計的相對效率。 解答我們看出,該試驗設計是一個有:=4行(問題),1=4列(秘書)和1=4 處理(電子表格軟體)的拉丁方設計。一個適當的統計模型為 ij,k= 1,2,3,4 從表15.18可知,我們可以用AA= * 來估計處理效應p。所得估計值為

15.4 拉丁方設計•981• 表15.18 完成任務所需要的時間(小時):拉丁方設計秘書問題行均值 I I 列均值 1 A(0.3) B(1.4) C(0.5) D(1.0). 0.8 2 B(1.8) C(1.4) D(1.5) A(0.5) 1.3 3 C(0.7 D(1.1) A(0.S) B(1.7) 1.0 4 D(1.2) A(0.5) B(1.1) C(1.6) 1.1 1.0 1.1 0.9 1.2 1.05 電子表格軟體平均 A:0.45 B:1.5 C:1.05 D:1.2 Hk = 0.45 ¥2 = 1.5 K3=1.05 K4 = 1.2 看起來用電子表格軟體 A完成任務所花的平均時間較其他三種軟體短一些。現在我們來估計模型引數,並構造方差分析表。回憶A=了,你一可,B= 電子表格軟體效應 &1=0.45-1.05=-0.6 82=1.5-1.05=0.45 a3=1.05-1.05=0 44 =1.2-1.05=0.15 問題效應秘書效應 8=1-1.05=-0.05 7=0.8-1.05=-0.25 B2=1.1-1.05=0.05 Y2=1.3-1.05=0.25 B3=0.9-1.05=-0.1573=1-1.05= -0.05 84=1.2-1.05=0.15 74=1.1-1.05=0.05 代入到平方和公式,有 TSS-2(%i- .)= (0.3-1.05)2+ (1.8-1.05)2 + …+ (1.6-1.05)2 =3.66 SST =12(¢)2 = 4[(-0.6)2+ (0.45)2+ (0)2 + (0.15)2] =2.34 SSR=12(.)=4[(-0.05)2+(0.05)2+(-0.15)2+ (0.15)2]=0.2 SSC-12(= 41(-0.25)2+ (0.25)2+ (0.05)2+(-0.05)2] =0.52 相減得 SSE=TSS -SST- SSB-SSC=3.66-2.34-0.2-0.52=0.6 表15.19中的方差分析表總結了上述結果。對於方差分析表中的每一種來源,其均方由該來源上的平方和除以其自由度得到。

•982• 第十五章標準設計的方差分析來源電子表格軟體問題秘書誤差總和表15.19 例15.5中電子表格軟體研究的 AOV 表 SS 2.34 0.2 0.52 0.6 3.66 df 3 3 3 MS 0.78 0.067 0.173 F 7.8 0.67 1.73 0.1 15 0.0171 0.6025 0.2592 對處理均價差異的F檢驗,即假設 Ho:QI=a2=•=a:=0 H:至少有一個 ax不等於0 的F檢驗使用F統汁 MST/MSE。由子計算所得F 值7.8大於根據 df=3,df2 =6和e=0.05從F分佈表查得的值,我們拒絕Ho,認為四種電子表格軟體的平均完成時間之間有顯著差異(p=0.0171)。看來使用軟體A 比起其他三種軟件平均完成任務的時間要短得多。 下面我們看一看考慮了這兩個外部變異來源,相對完全隨機化設計是否有效地提高了分析的精度。由上面的 AOV 表,我們有 MSR=0.067, MSC=0.173, 以及MSE=0.1。因此,該拉丁方設計相對於完全隨機化設計的相對效率為 RE(LS,CR) =MSR +MSC+(L-1)MSE (t+ 1)MSE 0.067 +0,173+94 1)00.12 = 1.08 (4+ 100.1) 這就是說,要任完全隨機化設計中使得處理均值的估計與在拉丁方設計中具有同樣的精廢,每個處理需要增加8%的觀測值。該拉丁方設計對於精度的改進沒有那麼高,是由於不同型別的問題的完成時間差別很小。不同秘書的平均完成時間之同的差別大一些,但這些差別對總的試驗結果來說沒有產生大的變異。 例15.5中的結果,僅在我們能夠確信模型條件和觀測到的資料相一致時才是有效的。因此,我們用殘差ey=3 p-0n-B一g,來檢查對於這些觀測到的數據而言,正態性條件、等方差條件和獨立性條件是否近似地得到了滿足。下面的例子給出了這樣一個分析的計算機輸出結果。 例15.6 這裡給出例15.5中描述的試驗的計算機輸出結果。把這些結果與用平方和定義算得的結果進行比較,並說明模型條件是否是有效的。

15.4 拉丁方設討 • 983、 解答注意我們手算的結果與計算機輸出的結果基本上相同,差別是由會入誤差造成的。在我們的手工計算中,可能會有大的舍人誤養,而這些舍入誤差可能導致所得結果與計算機輸出的結果不相一致。我們強烈推薦在方差分析的計算中使用計算機軟體程式,以避免潛在的舍入誤差。為了檢查是否滿足模型條件,我們首先注意,對於正態性條件,假設 Ho:“殘差服從止態分佈”的 Shapiro-Wilks 檢驗的p值為p值=0.9098. 因而,我們不能拒絕Ho,正態性條件看上去得到了滿足。 此外,莖葉圖、盒型圖和正態機率圖也顯示出與“殘差服從正態分佈“這個條件的一致性。圖15.3是一張殘差—估計處理均值圖。從這張圖上看出,殘差的變異隨樣本均值變化不大。 殘差 0.351 A 0.30t 0.25+ A 0.201 A 0.15A 0101 A A AA A -0.104 A AA A -0.25+ A A 估計的處理均值圖 15.3 殘差-估計處理均值圖 General Linear Hodels Procedure For Example 15.5 Dependent Variable: TINE TO COMPLETION source Model ErrOr DF 9 6 sum of Squares 3.0600000 0.6000000 Hean Square 0.3400000 0.1000000 F Value 3.40 Pr>F 0.0751

• 984• 第十五章標準設計的方差分析 Corrected Total ource R c T 15 R-Sqvare 0.836066 DF 3 3 3 3.6600000 C.V. Root HSE 30.11693 0.3162 Type I ss Hean Square 0.2000000 0.0666667 0.5200000 0.1733333 2.3400000 0.7800000 RESIDUAL ANAL.YSIS: Variable RESIDUAL N Mean Std Dev Skewess W:Normal Variable =RESIDUALS stem Leaf 3 5 2 05 1 0005 0 05 -0 5 -1 500 -2 5 -3 50 Moments 16 Sum Rgts 0 Sum 0.2 Variance -0.17143 Kurtosis 0.97711 Pr<w # 2 4 2 1 31 2 Multiply stem.Leaf by 10**-1 F Value 0.67 1.73 7.80 Normal Probability Plot 0.35+ 16 0 0.04 -0.6544 0.9098 BoxPlot +-- -1+ *--+--* + —---+ +++*+ *十+*+ **+*+*+ *+*+++ • Y Mean 1.0500 Pr>F 0.6025 0.2592 0.0171 -0.35+ ++*++ ++*++* ++*++ -2 -1 一一。 +2

15.4 拉丁方設計•985• 練習應用 15.9(農業)在西瓜田中做一項試驗,以比較兩種施肥區位(廣播法和帶狀法)和兩種不同的施肥量。最近的研究表明,在西瓜田中廣播施肥方法(在要施肥的區域上廣泛播撒)比施肥於種子附近的帶狀施肥法好。在該試驗中,研究人員希望在每英苗施以160-70-135磅的施肥量上,比較兩種氮-磷-鉀肥的施肥區位 (廣播法和帶狀法)以及兩種品牌(A和B)的微量元素。對兩種區位和兩種微量元素的四種組合用拉丁方田間試驗。 把一塊大面積的瓜田分成行和列,並在這塊田上根據一個拉丁方設計把這些處理隨機地進行分配。對於每一行列的組合,在西瓜出苗30天后,測量一棵西瓜秧苗的晾乾重量。資料如下。 列行 1 2 3 4 1 2 3 4 1 2 4 3 1.75 1.70 1.35 1.45 3 1 2 4 1.43 1.78 1.73 1.36 4 3 1 2 1.28 1.40 1.69 1.65 2 4 3 1 1.66 1.31 1.41 1.73 處理1:廣播,A 處理2:廣播,B 處理3:帶狀,A 處理4:帶狀,B a. 對於該試驗,寫出一個適當的模型。 b.用這些資料做方差分析,給出每一個檢驗的p值和所得到的結論。 15.10(工程)一家石油公司對比較四種不同疙油(A, B,C和 D)每加侖所能跑的英里數感興趣。由於在駕駛特徵和車輛品牌上可能存在很大的差異,這兩個外部變異來源被用做研究中的“區組“變數。研究人員挑選了四種不同品牌的汽車和四位司機。按照下面表中給出的方式,把汽油分配給這些司機和汽車。在每次試驗後記錄下每加侖氣油的平均里程(單位:mpg(英里/加侖))如下。 汽車品牌司機 1 2 3 4 1 A(15.5) B(16.3) C(10.5) D(14.0) 2 B(33.8) C(26.4) D(31.5) A(34.5) 3 C(13.7) D(19.1) A(17.5) B(19.7) 4 D(29.2) A(22.5) B(30.1) C(21.6)

•986• 第十五章標維設計的方差分析 8.對於該試驗,寫出一個模型。 b.估計模型中的引數。 c.做方差分析,取a=0.05。 d.關於最好的汽油,你能得到什麼結論? e.計算拉丁方設計相對於完全隨機化設計的相對效率,並解釋所得到的值。 在減少試驗單元的變異性方面,這些區組變數是有效的嗎?為什麼? f.在將來的試驗中,你是否仍然推薦把汽車品牌和司機都作為區組變數?為什麼? 15.11 下面給出了練習15.10中的資料的計算機輸出結果。 a.比較這裡給出的結果和你在練習15.10中得到的結果。 b.對於這些資料,模型條件看上去得到了滿足嗎?為什麼? OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 General Linear Hodels Procedure Dependent Variable: MILES PER GALION R 1 1 ] 1 2 2 2 2 3 3 3 3 4 4 4 4 C 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 亇 1 2 3 4 2 3 4 1 3 x 15.5 33.8 13.7 29.2 16.3 26.4 19.1 22.5 10.5 31.5 17.5 30.1 14.0 34.5 19.7 21.6 Source Model D 9 Sum of Squares 869.97563 Mean Square 96. 66396 F Value 22.42 Pr>F 0.0006

T+ 0 [- ++ ++++ +5‘2- ++ + + ++++ ++ 1 —---¥ + ---+ 20td×o9 0F860 T0SZBzLT 0 9T +-- E 134寸 # E ST~ £五 LDL520 9FE T sz M≥2 L98$960 sTS0111% 80PEB0'0 ©4BT EA LOTETET ms o sibw uns 91 TS10:0 T000:0 EF9:0 i< 加z"Zz uEaM 下 IF'BS $90 aNTPA a TRU5ON H sgaLMaYS A34 P4S uEeH N iSISKTVNY STOGTSA8 E e2InoS 96€zh sE E905LI52 6ZLLL'2 29L0z ESN 7004 Z9ATE a8lLz:90i 8BILESSL L8TEE:8 BLBEEE6 LE658 568 5L£98^S2 E E 6ZITL6:0 9 Te301 pe250 JOT2 •L86, 長孫上 SI

•988• 第十五章標準設計的方差分析 PLOT OF RESIDUALS VERSUS ESTIMATED TREATMENT MEANS FOR EXERCISE 15.10 RESIDUALS • A 2+ A A^ 11-= A + A A A A A A A -1 -2 -3+ A A A A -+ 15 PRED 15.5 完全隨機化設計中的因子處理結構在第十四章,我們介紹了試驗設計中的兩個要緊,郖隨機化方法和處理結構。 在15.2節,15.3節和15.4節中,我們考慮了隨機化技術以及透過使用區組變數實現對外部變異來源的控制。完全隨機化設計被用來比較:個處理,其中的試驗單元是齊性的,因而處理對試驗單元的隨機化沒有任何約束。15.3節和 15.4節討論了隨機化區組設計和拉丁方設計。在這兩個設計中,試驗單元不是齊性的,必須在隨機分配處理之前把它們分成由齊性試驗單元構成的組(區組)。這就導致了一個在完全隨機化設計中不曾出現的加之於隨機化上的約束。在隨機化完全區組

15.5 究全隨機化設計中的因子處理結構•989• 設計中,涉及到識別試驗單元的一個特徵(風組變),而在拉丁方設計中,則允許試驗者在建立齊性的試驗單元組時使用試驗單元的兩個不同的特徵。 在這一節,我們來討論處理設計,即如何從幾個因子,而不是僅從單個因子的幾個水平來構造處理。這些型別的試驗,出現在要對兩個或更多自變數對響應變的影響進行考察的情形。例如,假定一家公司開發了一種新型家用膠黏劑, 要考察溫度和溼度對於這種膠黏劑的黏結力的影響。在任何一項研究中,都會出現幾個與處理設計有關的問題。首先,我們必須考慮什麼樣的因子(自變數)是最感興趣的。其次,對於每一個因子,必須決定其水平數以及各個水平的實際設定。 第三,挑選出各個因子的水平後,我們必須選擇在試驗中使用的各個因子的水平組合。 因子的選擇以及對每一個因子其適當的水平的選擇,與預算、完成研究的時間有關,最重要的,與試驗者對於當前研究的實際情況的瞭解有關。在很多時候,需要對文獻進行詳細的查閱,以確定在當前這個研究所屬的領域內知識的現狀。當試驗者選定了每個自變數的水平以後,他或她必須決定哪些因子水平組合是最感興趣的並且是可行的。在某些情況下,有的因子水平組合不產生能夠在試驗單元上給出合理的響應的試驗設定,一些組合可能由於毒性或實際操作的困難而不適宜用於試驗中。 如第二章所討論的,考察兩個或更多因子對於響應的效應的一•種方法是一次一因子方法。為了考察某個變數的效應,試驗者變化該變數的水平,而把其餘自變量的水平固定。在保持其餘自變數不變的情況下,對每個變數都進行這個過程。 假設試驗老要考察兩個自變數氮和磷對於某種作物產量的影響。為簡單起見,假定在該試驗中為每個變數挑選了兩個水平:氮的施肥量為每塊地40磅和60磅,磷的施肥量為每塊地10磅和20磅。研究屮的試驗單元是把某個衣場中的一塊地劃分為小塊得來的,面積不大,也相當一致。對於這個試驗,選擇的因子水平組合可能如表15.20。圖15.4是這些因子水平組合的一個圖示。 表15.20 一次一因子方法的因子水平組合組合 1 2 3 60 40 40 磷 10 10 20 從圖15.4可以看出,分別有一個差可以用來估計氮的效應和磷的效應。組合 1 和組合2的響應值的差可以估計氮的效應,組合2 和組合3的響應值的差可以

•990• 第十五章標準設計的方差分析 20-• 105• 氮 . 60 圖15.4 -次一因子方法的因子水平組合估計磷的效應。 表15.21 給出的是該試驗中相應於這三個因子水平組合的虛擬的產量。假定試驗者要用樣本資訊確定給出最大產量的因子水平組合。從表中我們看出,當氮的用量從40增加到60(保持磷肥用量為10)時,該作物的產量增加了。而當磷肥用量從10增加到20(保持氮肥用量為40)時,作物的產量也增加了。由此看來,說 “同時增加氮肥和磷肥施用量會得到重高的作物產量”似乎不無道理。問題在於這個斷言基於這樣一個假設,即一個因子的效應在另一個因子的兩個水平上是相同的。 表15.21 三個因子水平組合的產量觀測值 (產量) 145 125 160? 氮磷 60 40 40 60 10 20 20 上面我們已經看到,當磷肥的用量為10時,把氮肥的用從40麥到60產量發生了什麼變化。但當磷肥的用量為20時,把氮肥的用量從40變到60 產基也會增產大約20個單位嗎? 為了回答這個問題,我們應當把氮肥60磷肥20的因子水平組合應用到另一塊試驗用地並觀察其作物產量。如果這個產量是180,那麼從以上三個因子水平組合得到的資訊就是正確的,從而可以用來預測具有最大產量的因子水平組合。 現在,假定接氮肥和磷肥的高用量施肥,結果得到的產量為110。如果真是這樣,

15.5 完全隨機化設計中的因子處理結構•991, 我們稱兩個因子氮和磷有變互效應。也就是說,一個因子對於響應變數的效應在另一個因子的不同水平上是不同的,此時,用一次一因子法得到的資訊將給出一個錯誤的預報。 上面的兩個在60-20 因子水平組合上的作物產量與三個原始設計點上的產量一起在圖15.5中標示出來。圖15.5(a)說明了兩個因子之同沒有互動效應的情況。銀對於產量的效應在兩個磷的水平上是相同的。相反,圖15.5(b)則顯示廣種兩個因子互動效應的情況。 200- =20 150 - =10 100% 40 60 (a) 200- $150 一一磷=10 磷=20 2 40 60 (b) 圖15.5三個設計點上的產量和第四個設計點上可能的產量我們看到,調查兩個因子對於響應變數的效應的一次一因子法僅適用於這兩個因子沒有互動效應的情況。雖然這一點是透過一個有兩個因子,每個因子各有兩個水平的簡單例子說明的,但一次一因子法的這一•不足,在討論兩個以上因子對於響應變數的效應時更加突出。 不論互動效應存在與否,析因試驗對於考察兩個或更多因子在響應值»上的效應都是有用的。如前所述,每個變數的水平個數的選擇以及這些變數的實際設置是很重要的。但現在,我們假定在一位熟知該研究領域的研究人員的幫助下,已

• 992• 第十五章標準設計的方差分析經做出了這些選擇,那麼我們必須決定在哪些因子水平組合上對y進行觀測。 按照經典的說法,析因試驗不被稱為設計,因為析因試驗講究因子水平的選擇和因子水平組合的挑選,但不討論如何把處理分配給試驗單元。除非另有說明,我們假定處理是隨機地分配給試驗單元的,因而因子水平組合相當於完全隨機化設計中的“處理”。 定義 1S.3 析因試驗是指在自變數的所有因子水平組合上都對響應變數y 進行了觀測的試驗。 看我們前面的例子。如果我們有興趣考察每塊地施用40和60磅這兩個氮肥 (」)水平以及每塊地施用10和20磅這兩個磷肥(2)水平對於作物產量的效應, 就使用一個完全隨機化設計,把表15.22 給出的四個因子水平組合(處理)隨機地分配給試驗單元。 表15.22 作物產量的2×2析因試驗因子水 40 60 60 平組合 ×2 10 20 10 20 同樣地,如果我們希望在兩個水平40 和60上考察 z1,在三個水平10,15和 20上考察z2,我們就在完全隨機化設計中使用表15.23中的六個因子水平組合。 表15.23 作物產量的2×3析因試驗因子水平 40 40 40 60 60 60 組合 H2 10 15 20 10 15 20

15.5 完全隨機化設計中的因子處理結構•993• 例 15.7 某汽車製造廠要考察發動機轉速z1(以每分鐘的轉數來度量)和地面上的行駛速度 x2(以每小時的英里數來度量)對於每加侖油所能行駛里程的影響。研究人員在諮詢了公司的機械師和其他人員後,決定考察工1 的三個水平 800, 1 000 和1200以及z2的三個水平30,50和70。試給出在一個3×3析因試驗中所使用的因子水平組合。 解答由析因試驗的定義,我們將在下列x1和x2的組合上觀測每加侖疙油所能行駛的里程: F1 800 800 800 1 000 1 000 1 000 1 200 1 200 1 200 30 50 70 30 50 70 30 50 70 本節中所給出的析因試驗的例子都有兩個自變數。然而,這裡的方法適用於任意個數的因子和因子的任意個水平。比如,假若我們有四個不同的因子 x1,72, x3和x4,它們的水平個數分別為2,3,3和4,那麼就可以形成一個2×3×3×4析因試驗,其中有2•3•3•4=72個因子水平組合。 對於一次一因子方法和析因試驗方法應該做一個最後的比較。用析因試驗不僅可以得到因子互動效應的資訊,而且在沒有互動效應時,我們可以用更少的觀測值得到關於單個因子效應的至少同樣多的資訊。為了說明這一點,我們考慮前面氮和磷的2×2析因試驗。如果因子之間沒有互動效應,資料就會像圖15.6(a)那樣。為了方便起見,我們把資料重新作成表15.24,並在其中把四個因子水平組合編號為1至4。如果使用了2×2析因試驗,並且在兩因子之間沒有互動效應存在,我們可以得到兩個獨立的差用來考察兩個因子在響應變數上的效應。從表 15.24 可以看出,觀測值1和4之間的差及觀測值2和3之同的差可以用來度過磷的效應,類似地,觀測值4 和3之間的差及觀測值2和1之間的差可以用來度量氮的兩個水平在地塊產量上的效應。 在這同一個試驗中,如果我們使用了一次一因子方法,為了在無互動效應的情況下考察氮和磷各自的效應時得到同樣個數的獨立的差,需要六個觀測值(在表 15.24 中前三個因子水平組合處各兩個觀測值)。

• 994• 第十五章標準設計的方差分析 1水平上肉子! J水平2、因子E 平均響應水平1 水¥2 因子A (a) 1水平2,因子B 平均晌應 •水平1,因子B 水平1 水平2 因子A (b) 平均響應水平1 水平1,四子B •水平2,因子B 上水平2 因子A (c) 圖15.6 2×2 析因試驗中有、無互動效應的說明:(a)因子A 和B間無互動效應:《b)因子A和B間有互動效應:(c)因子 A 和B間有互動效應表15.24 2×2 析因試驗的因子水平組合產量 145 125 165 180 組合 1 2 3 4 60 40 40 60 磷 10 10 20 20 在具有兩因子因子處理結構,重複次數n>1 的完全隨機化試驗中,觀測值的

15.5 完全隨機化設計中的因子處理結構•995• 模型可以寫為如下形式 yi=p+a+B+ ay +Ei 其中模型中的各項定義如下: 3z:因子A第之個水平和因子B第;個水平上的第個試驗單元上的響應; 嚴:總平均值,未知常數; a:因子A第;個水平的效應,未知常數; 8:因子B第;個水平的效應,未知常數; a.pg:因子A第;個水平與因子B第;個水平的互動效應,未知常數; Eik:接受因子A第i個水平和因子B第;個水平的第k個試驗單元上響應的隨機誤差。我們要求這些隨機誤差服從均值為O,共同方差為品的正態分佈,並且這些誤差相互獨立。 由上述模型的條件可以證明,從接受因子A第;個水平和因子B第;個水平的第為個試驗單元上所觀測到的響應服從均值為 E(y)- + a+網方差為的正態分佈。 為了說明這個模型,考慮一個無互動作用的兩因子析因試驗,例如氮和磷的2 ×2 析因試驗: y = 十ai+多+E漲 2×2 析因試驗的期望值如表15.25所示。 表15.25 2×2析因試驗中的期望值因子B 因子A 水平1 水平2 —— 水平1 k+ai+B 1+42+B1 水平2 k+ait8 F+ a2+B2 這個模型假定對於因子A 的任何兩個水平,總體均值(期望值)的差不隨所考慮的因子B的水平而變化。同樣的性質在比較因子B的兩個水平時也成立。例如,不論我們所考慮的因子B 的水平是什麼,因子A的水平1和水平2上的平均響應的差都是a1-a2。因而,對因子A的兩個水平之間沒有差異的檢驗可以寫為 Ho:a1-a2=0的形式。同樣,對於因子A的任何一個水平,因子B的兩個水平上平均響應的差均為B,一B2.因子B的兩個水平無差異的檢驗是 Eo:§一的=0。 這種現象在隨機化區組設計中也看到過。

•996• 第十五章標準設計的方差分析如果模型中項的可加性假設不成立,那麼我們就需要一個帶有解釋互動效應的項的模型。 在每個處理上有n次觀測的2×2析因試驗的期值在表15.26中給出。 表15.26 2×2析因試驗中的期望值,有意復觀測因子B 因子A 水平1 水平2 水平1 8+¢1+81+¢11 K+a2+B+奶21 水平2 H +a1+B+812 p+a2+B2+ 4p2z 從表15.26中可以著到,在因子B的水平1上,因子A水平1和水平2的平均響應的差為 (a1-a2)+(aB11-2821) 但對於因子B的水平2,相應的差為 (a1- az)+ (aB12 - ap2z) 由於對於因子B的不同水平,因子A的水平1和水平2的平均響應的差也不同, 模型不再是可加的,此時我們說這兩個因子有互動效應。 定義15.4 稱兩個因子A和B是有互動效應的,如果一個因子的兩水平上的平均響應的差在第二個因子的不同水平上不保持常數。 在汽油辛烷值的測量中,當結合兩種混合成分形成汽油混合物時,可能發生交互效應。混合物的辛烷性質可能與由考察其成分而形成的期待大相徑庭。任這種情況下,互動作用可能對混合物的性態起正面或負面作用,我們分別說這些成分加強,或削弱了另一個成分。 我們可以用前面圖15.6中的側面圖(profile plot)來詳細解釋互動效應的機念。正如我們在圖15.6(a)中所看到的那樣,當沒有互動效應的時候,對於因子A 的各個水平,因子B的兩個水平上平均響應值的差是一致的。然而,在圖15.6(b) 稱圖 15.6(c)中,我們看到當因子A從水平1變到水平2時,因子B的兩個水平上平均響應值的差也隨之而變。 值得注意的是,互動效應不限於兩個因子。對於三個因子 A,B,C,我們可能有因子A與B之、A與C之間、B與C之間的互動效應,這些兩個因子之同的交互效應可以立即從定義15.4 中得到解釋。如,AC互動效應的存在表明,A的水平上平均響應值的差隨C的水平而變化。因子 A、B、C之間的一個三因子互動效應可能意味著C的水平上平均響應值的差隨因子A與B的水平的組合而變化。

15.5 完全隨機化設計中的因子處理結構•997• 為了對帶有因子間互動效應的析因試驗進行方差分析,我們需要在每個處理 (因子水平組合)處有,>1個觀測值。假定在一個完全隨機化兩因子試驗中,因子A有a個水平,因子B有6個水平,在ab 個處理中的每一個處理中,有n個觀測值。我們來構造該試驗的方差分析。在分解總平方和之前,我們先需要定義以下記號。 yih:接受因子A的第;個水平和因子B的第;個水平的第個試驗單元上的觀測值; 2::因子A的第;個水平上觀測值的樣本平均值,3 ieYik;:因子B的第;個水平上觀測值的樣本平均信,,一計二容啡; 3:因子A的第;個水平和因子B的;個水平上觀測值的樣本平均值,3. = IZP 各觀測值關於它們的平均值的總平方和,與以前一樣,定義為這個平方和將被分解成四個不同的變異來源:兩個來自幹因子 A和B的主效應, 一個是來自於因子A和B之間的互動效應,另一個則是源於不能由主效應和交耳效應所解釋的所有其他的變異,稱之為誤差。TSS 的分解可以透過對模型 Yiik = aitB+ apy + Eik 的考家得到。模型中的引數有樣本估計: =y. B=35.-5. 透過一些代數運算,我們可以證明,TSS 具有下列形式: 我們用上面的引數估計來解釋這個分解中的各項。等導右邊第一項度量了因子A 的主效應,該項可以寫為類似地,等號右邊第二項度量了因子B的主效應,可以寫為

•998• 第十五章標準設計的方差分析第三項度量了因子A 和因子B之間的互動效應,可以寫為 SSAB =M 最後的那一項稱為誤差平方和,SSE,表示各y;中沒有被主效應和互動效應所解釋的變異性。這一項有幾種表示形式。像以前一樣,利用模型定義殘差e波=3洗一-ai一B一a=Y 一3 .0於是另一種形式是SSE=TSS-SSA-SSB-SSAB。平方和的分解總結成 AOV 表,如表15.27所示。 表15.27 完全隨機化兩因子祈因試驗的 AOV 表米源 SS df MS F 主效應 A B SSA SSB a-1 -1 MSA=SSA/(a-1) MSB=SSB/(B-1) MSA/MSE MSB/MSE 互動效應 AB SSAB (a-1)(6 1) MSAB=SSAB/(a 1)(6-1) MSAB/MSE 誤差總積 SSE TSS ab(n-1) ubn-1 MSF=SSE/4b(n-1) 從 ADV 表我們可以看出,如果在每一個處理上僅有一個觀測值,即n=1,那麼誤差有0個自由度。因此,如果因子AB之間有互動效應,並且n=1,則對於互動效應和主效應就沒有有效的檢驗方法。然而,如果因子間沒有互動效應,那麼互動效應項可以當作誤差項使用,把SSE換為SSAB。但n =1 的試驗非常少見,因為在大多數情形,研究人員在進行試驗之前並不知道因子A和B之間是否存在互動效應。因此,為了保證對主效應和互動效應的檢驗是有效的,我們需要 >1。 例15.8 做一項試驗,以確定四種不同的殺蟲劑對於三種柑摘(B(,B,Bs)產量的影響。 對於每一種柑橘,隨機地從果園裡挑選了8棵樹,把每一種殺蟲劑隨機地分配給其中的兩棵,並按照指定的水平使用。試驗期結束時,記錄下柑橘的產量(蒲式耳/每棵樹),所得資料見表15.28., 15.5 完全隨機化設計中的因子處理結構 • 999• 表15.28 果樹產量的3X4析因試驗資料,每個處理有n=2個觀測值殺蟲劑,A 品種,B 1 2 3 1 49 39 55 41 66 68 2 50 55 67 58 85 92 3 43 38 53 42 69 62 4 S3 48 85 73 85 99 8.對於該試驗,寫出一個適當的模型。 b.建立方差分析表,並用a=0.05 進行主效應和互動效應的F檢驗。 c.畫出處埋均值的側面圖。 解答題中所述試驗為一個完全隨機化3×4 析因試驗,其中因子 A,即殺蟲劑有a =3個水平,因子B,即品種有 =4個水平。在兩個因子的12個水平組合上的重複試驗次數為 =2。 a.對於帶有兩因子間互動效應的3×4析因試驗,模型為 Ni= + a:tB+apfy + Ci i= 1,2,3, 4sj = 1,2,3:k=1,2 其中p為每標樹產量的總平均,a:為殺蟲劑第之個水平的效應,月,為柑橘品種第j個水平的效應,ap;為殺蟲劑第;個水平和柑橘品種第;個水平的互動效應。 b.在多數試驗中,我們極力推薦使用計算機軟體程式來得到 AOV 表。但為了說明AOV 表的計算,我們在此例中使用各個平方和的定義來計算。首先,我們估計模型中的引數。為此,我們使用表15.29中給出的處理均值。 表15.29 A 和B的因子組合(處理)的樣本均值殺蟲劑,A 孔種,B 品種平均 1 2 3 殺蟲劑平均值 1 44 48 53 2 $2.5 62.5 88.5 67.83 3 40.5 47.S 65.5 51.17 4 50.5 79 92 78.83 46.875 59.25 78.25 61.46

• 1000 第十五章標準設計的方差分析算得的引數估計如下: 主效應因子A a =53-61.46= -8.46 =67.83-61.46=6.37 =51.17-61.46=-10.29 =73.83-61.46=12.37 因子B 81=Y.1-3 =46.875-61.46= -14.585 B= 2. 元 .= $9.25-61.46=-2.21 B 3 .=78.25-61.46=16.79 互動效應 a1= 1.-1-3.+=67-53-78.25 +61.46 = -2.79 a21= 21-2 1+5 =525-67.83-46.875+ 61.46:-0.745 022=922.-J2.- .2.+J.=62.5-67.83 - 59.25+61.46= -3.12 231= 31-33- 1+ =40.5-51.17-46.875+61.46-3.915 0f32=332.-Js.- 2.+J.=47.5-51.17-59.25+61.46=-1.46 4= 41 4-1+=50.5-73.83-46.875+61.46= - 8.745 QB42= 42.-J4.- 2.+J.=79-73.83-59.25+61.46=7.38 afas= 43.-J4.-33.+J=92-73.83-78.25+61.46=1.38 接下來,我們計算總平方和。 TSS=2(3 - 3.)= (46 - 61.46)2 + (50- 61.46)2 + ⋯+ (99- 61.46)2 =7,187.96 主效應平方和為 SSA =bn)(a:)= (3)(2)[(-8.46)2 + (6.37) + (-10.29)2 + (12.37)2]

15.5 完全隨機化設計中的因子處理結構 • 1001• =2,226.29 SSB =4n (B,)’= (4)(2)[(14.585)2+(2 21)’+(16.79)”] =3,996.08 互動效應平方和為 SSAB =7 (08,)2 = (2)1(5.58S) +(-2.79)’+⋯+(1-38)-] = 456.92 誤差平方和為 SSE = TSS - SSA - SSB - SSAB =7,187.96-2,226.29- 3,996.08- 456.92 = 508.67 這個在每個處理上重複試驗次數為2的完全隨機化3x4析因試驗的方差分析表由表15.30給出。 來源殺蟲劑,A 品種,B 互動效應,AB 誤差總稚表15.30 例 15.8 中水果產量試驗的 AOV 表 SS 2,226.29 3,996.08 456.92 508.67 7,187.96 df 3 2 6 12 MS 742.10 1,998.04 76.15 42.39 23 F 17.51 47.13 1.80 第--個要做的檢驗必須是因子A與B互動效應的檢驗,因為如果互動效應顯著,就可能難以得到主效應的合理解釋。F統計量為 F-Xa-殺話=1.80 MSE 計算所得的這個F值沒有超過F表中與a=0.05,dfy =6,dfg =12 對應的表值 3.00。因此,沒有充分的依據表明殺蟲劑水平與樹的品種水平之間存在互動效應。 透過側面圖我們可以看出互動效應不明顯。圖15.7中畫出了該試驗中各個處理的樣本平均值。 從該圖我們可以看出,對於4 種殺蟲劑,3種柑橘樹的平均產量之間的差大體上相同,也就是說,三個品種所對應的二條線大體上是平行的,因而,品種的水平與殺蟲劑的水平之間的互動效應是不顯著的。由於互動效應不顯著,下一步我們便可以檢驗兩個因子的主效應。這些檢驗分別考察品種之間的差異以及殺蟲劑之間的差異。對於殺蟲劑,F統計過為 F-體-殺始=17.51 42.39

•1002• 第十五章標準設計的方差分析 8F •水平3,困子B,水平2,因子B 半1,因子B 50 405 水平1 水平2 水平3 水平4 因子 A 圖 15.7 例 15.8 中水果產量試驗的側面圖汁算所得的這個值大十F表中與a=0.05,dh =3,dh=12 對應的表值 3.49。因此,我們有充分的依據表明在4種殺蟲劑水平上的平均產量之間有顯著的差別。對於品種,F統計量為 F-S-43-47.13 42.39 這個F值大於F表中與a=0.05,dfy =2,dl=12對應的表值3.89。因此,我們有充分的依據表明在3種柑橘樹的平均產量之間有顯著的差別。在15.7節,我們將討論如何把因子A 和因子B的兩個有差異的水平找出來。 在互動效應顯著的場合,解釋主效應F檢驗的結果時必須慎重行事。首先, 我們應當用樣本均值了;構造側面圖。如果例15.8 的側面影象圖15.8那樣,則說明有在因子A 與因子B(殺蟲劑與品種)之間存在互動效應的表徵。毋庸置疑, 如果 MSF 相對於MSAB 不是很大,那麼互動效應的F檢驗將是顯著的。 對於圖15.8中的側面圖,主效應的F檢驗適用嗎?回答是“適用”,因為其中 •水平3,因子B 應 80安 70 均 60 平 50 40 水平2,因子B •水平1,因子B 水平1 閣15.8 水平2 水平3 水平4 因子A 有顯著互動效應存在時的側面圖, 其中互動效應是有序的

15.5 完全隨機化設計中的因子處理結構 •1003• 的互動效應是有序的,即雖然隨著因子 A的水平的變化,因子B的水平之間差異的大小也在變化,但因子B的各個水平上的均值的順序是不變的。很顯然,在圖 15.8中,因子B的水平3上的均值總是比水平1和水平2上的均值大;同樣,不論在因子A的哪個水平上,因子B的水平2上的均值總是比水平1上的均值大。然而,在此情況下,我們在給出結論時必須十分小心。如果我們發現,對於因子A的所有水平,因子B的水平3上的平均響應比水平1和水平2上的平均響應大,並且因子B的各水平間有顯著差異,我們可能斷言因子B的水平3上的平均值明顯地比其他兩個水平上的平均值高。但是,注意在因子A 的水平1上,因子B的三個水平上的平均響應相差無幾。因此,如果我們使用A的水平1,那麼因子B的三個水平將會產生等效的平均響應。於是,我們得到的關於因子B的各個水平的平均響應之間的差異的結論,在因子A的不同水平上是不一致的;並且可能在因子A 的某些水平上,因子B的主效應的檢驗會相互矛盾。 當互動效應有序時,主效應的檢驗可能是有意義的。然而,並非所有的互動效應都是有序的。圖15.9中的側面圖顯示了一個有顯著的互動效應,並且主效應的檢驗可能導致誤解的情況。無序的互動效應,就像圖15.9中那樣,可能把主效應遮擋起來。不是說主效應的檢驗在統計上是不對的,而是這些檢驗可能導致對試驗結果的不恰當的解釋。在因子A的水平1上,因子B的三個水平上的平均響應之間相差甚少;在因子A的水平了上,因子B的水平3產生的響應比水平2產生的響應大得多;相反,在因子A的水平4上,因子B的水平2產生的平均響應比水平3產生的平均響應大得多。因而,當兩個因子有顯著的互動效應時,因子B的不同水平上的平均響應之間的比較必須在因子A的各個水平上分別進行。這就是說,此時關於因子B的水平的一個結論並不對因子A的所有水平都成立。 當我們的試驗中有三個因子時,計算要複雜得多,但關於主效應和互動效應的解釋與只有兩個因子時相仿。對於A、B、C三個因子,我們可能有A與B之間的算F 80?60 50 40 •水平2,因子B 一水平1,因子B •水平3,因於B 水平1 水平2 水平3 水平4 因子A 圖 15.9 有顯著互動效應存在時的側面圖, 其中互動效應是無序的

• 1004• 第十五章標準設計的方差分析互動效應,A與C之間的互動效應以及B與C之間的互動效應。對於這些兩因子互動效應的解釋,可以從定義15.4 立即得出。如 AC互動效應的存在表明因子A 的各水平上平均響應之間的差異隨因子C的水平而變。與前面所討論的一樣,在解釋主效應時也必須謹慎。三個因子 A、B和C之間的互動效應可能表明因子C 的各個水平上平均響應之間的差異隨因子A與因子B的水平組合的不同而不同。 三因子互動效應的第二種解釋是因子A與B的互動效應的模式隨因子C的水平而變化。這樣,當存在三因子互動效應,並且我們已經在因子C的每個水平上,分別畫出因子A與因子B的兩因子互動效應的側面圖時,一定能夠在這幾張側面圖上看到不同的模式。 對於具有三因子因子處理結構和n>1次重複的完全隨機化試驗,模型可以寫為 Yim = H +aitB+Y + ay+ ali + Byk + apyik + Eihm 其中模型的各項定義如下: Yjm:接受因子A第;個水平,因子B第;個水平和因子C第反個水平的第 m個試驗單元上的響應; 從:總平均,未知常數; q:因子A第:個水平的效應,未知常數; B:因子B第;個水平的效應,未知常數; Y:因子C第個水平的效應,未知常數; a:因子A第;個水平與因子B第;個水平的兩因子互動效應,未知常數; a7決:因子A第:個水平與因子C第k個水平的兩因子互動效應,未知常數; BYy:因子B第;個水平與因子C第個水平的兩因子互動效應,未知常數; apryk因子A第;個水平,因子B第;個水平和因子C第k個水平的三因子互動效應,未知常數; Ejm:接受因子A第i個水平,因子B第;個水平和因子C第k個水平的第 m個試驗單元上響應的隨機誤差。我們要求這些隨機誤差服從均值為 0.,共同方差為?的正態分佈,並且這些誤差相互獨立。 由上述模型的條件可以證明,從接受因子A第主個水平,因子B第;個水平和因子C第個水平的第m個試驗單元上所觀測到的響應服從均值為 E(yskm)= 隊 +ai + B;+ Yx+api tari + BYjk +apYis 方差為的正態分佈。 下列記號用於把總平方和分解為主效應分量,互動效應分量和誤差分量的過程之中。 yikm:接受因子A第;個水平,因子B第;個水平和因子C第個水平的第

15.5 完全隨機化設計中的因子處理結構•1005• m 個試驗單元上的觀測值; .:在因子A的第:個水平上觀測值的樣本平均值, ⋯:在因子B的第;個水平上觀測值的樣本平均值, 3…. acn *:在因子C的第個水平上觀測值的樣本平均值,:在因子A的第;個水平與因子B的第;個水平上觀測值的樣本平均值, ik:在因子A的第;個水平與因子C的第個水平上觀測值的樣本平均值, 來:在因子B的第;個水平與因子C的第個水平上觀測值的樣本平均值, 可湯:在因子A第i個水平,因子B第;個水平和因子C第k個水平上觀測值的樣本平均值,:總樣本平均值, 模型中的引數有樣本估計: ... 二 abcr

• 1006、 第十五章標準設計的方差分析由此,模型擬合的殘差為 eikm=yim- ai-B-7- a-ari-pyn-aiprsk =yin-亞動. 由以上各式,我們可以把因子A有a 個水平,因子B有個水平,因子C有<個水平,並且每個因子水平組合(處理)處有n個觀測值的三因子析因試驗的總平方和分解為主效應(單個因子水平間的變異),兩因子互動作用,三因子互動作用和誤差平方和。 主效應的平方和為兩因子互動效應平方和為三因於互動效應平方和為 SSABC=n二a(aprg.)? - SSAB- SSAC- SSIBC- SEA- SSB -S8C 誤差平方和由 SSE=≥ im(eikm)? -二uam(Sim一可o.)2 = TSS - SSA - SSB - SSC - SSAB - SSAC - SSBC - SSABC 給出,其中TSS=二 m(yim一 .)2。 對於因子A有a個水平,因子B有個水平,因子C有個水平,並且 abe個處理中每個處理上有n個觀測值的完全隨機化三因子析因試驗,AOV 表由表 15.31給出。

來源主效應 A B C 互動效跡 AB AC BC ABC 洖差總和 SS SSA SSB SSC 15.5 完全隨機化設計中的因子處理結構 • 1007• 表15.31 完全隨機化三因子析因試驗的 AOV 表 df MS a-1 6-1 •-1 MSA=SSA/(a-1) MSB=SSB/(b-1) MSC=SSC/(c-1) F MSA/MSE MSB/MSE MSC/MSE SSAB SSAC SSBC SSE TSS (a-1)(6-1) MSAB=SSAB/(a-1)(6-1) (a-1)(c-1) MSAC=SSAC/(a-1)(c-1) (b-1)(c-1) MSBC=SSBC/(6-1)(-1) MSAB/MSE MSAC/MSE MSBC/MSE SSABC(a-1)(1)(c-1) MSABC=SSABC/(a-1)(-1)(1) MSAR/MSE abc(n-1) MSE = SSE/abc(n-1) a6cn -1 從該 AOV 表我們可以看出,如果在每個處理上只有一次觀測,即~=1,那麼誤差平方和的自由度為0。因此,如果模型中含互動效應項,並且n=1,那麼對可互動效應和主效應就沒有有效的檢驗。然而,如果已知某些互動效應為0,那麼就可以把這些互動效應項結合起來作為誤差項,用於檢驗模型中的其他項。但=1 的試驗很少用,因為在多數情況下,研究人員在實施試驗之前不知道哪些互動效應會是0。因而,為了能對主效應和互動效應進行有效的檢驗,我們需要n>1。 當三因子互動效應顯著時,我們必須對兩因子互動效應和主效應做出與三因子互動效應不顯著時不同的處理,這使得三因子試驗的分析有一些複雜。下面的圖15.10給出了三因子試驗分析的一般方法。該圖來自於 G. Milliken 和 D. Johnson 的 Analysis of Messy Duta 一書。 我們將透過分析案例中的資料來說明如何分析三因子試驗。 案例,統計分析由於在三因子試驗中平方和所需要的計算很多,手算可能會導致大的會入誤差,我們用軟體程式計算,所得結果見表15.32。 這個 AOV表中的記號意義如下:I.表示魔芋水平,B表示魔芋混合物的型別, P表示 SPI 的水平。由於三因子互動效應不顯著(L*B*P,P=0.3106),我們接下來考察兩因子交耳效應。三組兩因子互動效應都具有顯著的水平,《L*B, = 0.0008),(1.*P, <0.0001)、(B*P, <0.0001),從而,三個都是高度顯著的。 為了考察三個因子間可能存在的關係,我們需要計算樣本平均值可,可.k.及了班。這些值見表15.33(表中稱這些平均值為“兩種方式平均值”)。

• 1008• 第十五章標準設計的方差分析 (開始三因子互動效應顯著嗎? 否是有多少顯著的兩因子互動效應? 選定第三個因子,在其每個水平上,分析一個兩因子處理結構無兩個或更多分析每一個主效度 • 一個分析不包含在顯著的兩因子互動效盛中的因子的主效應像分析雙向處理結構一樣,分析所有有交互效應的因子對你還要考慮別的第三個因子嗎? 否是像分析雙向處理結構一樣,分析有交互效應的兩個因子用多重比較方法回答所有感興趣的假設結束圖 15.10 三因子試驗的分析方法 •.

15.5 完全隨機化設計中的因子處理結構•1009• 夜15.32, 三因子析因試驗案例中資料的 AOV 表 General Linear Models Procedure Dependent Variable;Texture of Meat: Su of Hean Source Hodel ErTOr Corrected Total DE Squares Square 11 2080.28750 189.11705 24 72.74000 3.03083 35 2153.02750 R-Square C.V. Root HSE 0.956215 1.769387 1.74093 Source DE Type I SS Mean Sqvare Main Effects: L B P 1 1 2 526.70250 113.42250 1090.11500 526.70250 113.42250 545.05750 Interactions: L*B L*E B*P L*B*P 1 2 2 2 44.22250 182.53500 115.84500 7.44500 44.22250 91,26750 57.92250 3.72250 水平(%) 0.5 0.5 1 1 0.5 0.5 0.5 表 15.33 案例中資料的平均值表混合物 SPI(%) KSS * KNC * KSS KNC * * * 1.1 2.2 4.4 1.1 2.2 4.4 1.1 KSS KSS KNC KNC KNC 2.2 4.4 1.1 2.2 4.4 F Value 62.40 PTYE 0.00¢1 F Value Y Mean 98.3917 Pr>F 173.78 37.42 179.84 0.0001 0. 0001 0.0001 14.59 30.11 19.11 1.23 0.0008 0.0001 0.0001 0.3106 兩種方式平均值 99.3 105.1 93.9 95.2 110.0 105.0 91.7 97.5 96.2 90.0 104.5 97.4 88.0 103.0 103.9 93.7

• 1010• 第十五章標準設計的方差分析利用表中的平均值可以畫出魔芋的水平和魔芋的型別,魔芋的水平與SPI 的水平以及魔芋的型別與SPI 的水平之間的互動效應的側面圖,如圖15.11所示。 魔芋水平與魔芋型別互動效座的側面圖 ™.. 110t iN 100+ s- - 90+ 80 + it 魔芋水平 SPI 水平與魔芋型別互動效應的側面圖 -N110+ S 1004Y 90+ 80+ ----+ 1.1 -N S + 4.4 zz 肉替換水平(SPI) 魔芋水平與 SPI 水平互動效應的側面圖 -0.5% -1%- • 110+ 0.5%. 100+ 1% 90+ 80+ ---+ 1.1 0.5% -1% 肉替換水平(SPI) 圖15.11 兩因子互動效應的側面圖

• 15.5 完全隨機化設計中的因子處理結構•1011• 從圖15.11 我們可以看出,肉製品的組織指標平均值隨著肉製品中魔芋型別, 魔莘水平以及SPI 的水平的不同而有相當的差異。當魔芋的水平是1%時,在肉製品的平均組織指標之同相差無幾。然而,在5%的水平上,KNC魔芋所得到的產品的平均組織指標比魔芋混合物KSS的相應值高一些。當考慮SPI 的水平在大紅腸平均組織指標上的效應時,我們可以看到,在SPI的1%的水平上,用0.5% 魔芋和 1% 魔芋產生不小的差異。隨著SPI 水平的增加,差異明顯地減小。還有,在SPI 的1%的水平上,兩種魔芋混合物之同沒有本質的差異,但隨著SPI 水平的增加,用 KNC混合物比用KSS 混合物生產出的肉製品有更高的組織指標。 所有關於三個因子和肉製品平均組織指標的關係的這些觀察結果都需要用多重比較的方法進行確認。我們將在15.7節中討論這種方法。 Univariate Procedure Variable=RES 36 Mean Std Dev 1 .441626 Skewness -0.0663 w:Normal 0.931498 Sum wgts 36 Sum Q Jariance 2.07828 Kurtosis -0.9777 PrAN 0.0349 Variable RESIDUALS stem Leaf # Boxplot 2 6 2 001 1 6788 1 112 11111111122 -0 311 -0 -1 422 -1 99987 -2 10 . -2 -+---+---+-- + Plot of RES*PRED. Legend: A = 1 obs. B = 2 obs,etc. 5t RES 0+ A A A A A A A A ACA AAA AA AAA -5‡ -+ 85 160 PRED 圖 15.12 案例的殘差分析

• 1012• 第十五章標準設計的方差分析圖15.12包含了這些組織指標資料的殘差分析,其中的殘差是用公式 eilkm = yikm -ai-B一i-aR-arik-Brsk- apYih= Jikm一可 . 得到的。 殘差 evkm的概括統計量表明,偏度近似為0,但峰度近似為—1。從基葉圖和盒型圖可以看出,這些殘差大體對稱,但在0附近有一個很高的峰。Shapiro-Wilks 正態性檢驗的p值為0.0349,這表明殘差有一定的非正態特性。然而,由於沒有離群值,並且也沒有幾個殘差的值落在兩個極端的附近,正態性的假設大體上滿足。殘差對估計的處理均值泌,的圖表明,隨著平均組織指標的增加,變異性有輕微的增加。然而,這種增加不足以破壞F檢驗所具有的對於少許模型條件偏離的穩健性。由此,可以認為正態性和等方差條件都能得到滿足,AOV 表中的F檢驗將是有效的。 練習應用 15.12(心理學)一家大的廣告公司專門製作兒童用品的商業廣告。該公司想設計一項研究以調查影響兒童對廣告注意時間的因子。初步的調查表明,兩個可能的重要因子分別是兒童的年齡和廣告產品的種類。公司要確定廣告引起兒童注意的平均時間長度是否因這兩個因子水平的不同而有大的差異。如果確有差異,公司想根據產品型別和目標年齡組來確定商業廣告的新型別。使用的三個年齡組為: A:5~6歲 A2:7~8歲 As:9~10歲挑選的產品型別為: Pi:早餐用穀類食品 Pz:影片遊戲在每個年齡組募集了30名兒童。對於三種產品的每一種,在每一年齡組隨機指定 10名兒童春60秒該種產品的廣告。研究人員記錄下他們在觀看廣告的過程中的注意時間,得到如下資料。 兒童 1 2 3 4 5 A,-P. 19 36 40 30 4 Az-P! 19 35 22 28 1 A3-P. 37 6 28 4 32 A1-P2 39 18 32 22 16 A2-Pa 30 47 6 27 44 As-P2 51 $2 48 39

15.5 完全隨機化設計中的因子處理結構•1013• 兒童 6 7 8 A1- Pi 10 30 5 A2-PI 27 27 As-P! 16 16 AI-P2 2 36 43 9 10 34 21 3 18 8 41 29 18 7 Az-P2 26 33 48 23 16 續表 Ag-Pa 33 56 43 40 51 平均值 22.8 年齡組均值:A1 23.0 19.5 22.0 Az As 25.1 33.8 23.2 30.6 45.6 產品型別均值:P1 Pz 21.4 33.1 a,給出這個設計。 b.為該設計寫出一個模型,解釋模型中的所有項。 c.估計模型中的引數。 d.計算這些資料的平方和,並把所得結果總結在 AOV 表中。 15.13 參見練習15.12。 8.對於兩個因子,即年齡和產品型別,畫出側面圖。 b•進行適當的F檢驗,並從中得出關於年齡和產品型別對於兒童平均注意時間的效應的結論。 15.14 對於練習15.12中的資料,用Minitab 軟體包得到的輸出結果如下。 a.比較從 Minitab 得到的 AOV 表與你在練習15.13中得到的結果。 b.用殘差圖檢查在為使F檢驗有效所需要的條件中,是否有的得不到滿足。 Two-Ray Analysis of Variance Analysis of Variance for Time Source Age Product Interaction Error Tatal 2 1 2 54 59 sS 1320 2052 1341 7932 12645 HS 660 2052 671 147 4.49 13.97 4.57 P 0.016 0.000 0.015

• 1914. 第十五章標準設計的方差分析 Normal Probability Plot of Residuals 0.999 0.99 0.95 0.80 0.50 0.20 0.05 0.01 0.001 -20 -10 0 RES12 10 20 Residuals versus the Fitted Values (response is Time) Residual 20 10 0 -10 -20 -30: • •' • Fitted Value 40 15.6 隨機化完全區組設計中的因子處理結構在前面的一節中,我們把析因試驗定義為在所有自變數的因子水平組合上都對響應變數y進行觀測的試驗。在析因試驗中自變數的因子水平組合被隨機地指定給試驗單元,因而我們可以用完全隨機化設計來調查這些因子對響應變數的效應。 有時,研究的目標使得我們希望調查某些因子對於響應變數的效應,而對於某些其他的外部變異來源要用劃分割槽組的方法子以濾除。這種情況需要使用帶有來自於一個析因試驗的處理的區組設計。為了有效地濾除外部變異來源,從而者重於要調查的這些因子對於響應變數的效應,我們將利用已經學習的區組設計(隨機

15.6 隨機化完全區組設計中的因子處理結構•1015• 化區組設計和拉丁方設計)的知識。我們透過下面的例子予以說明。 例15.9 一位營養學家要研究使用三種新型麵粉做成並在三種不同溫度下烤製出來的麵包中蛋白質含量的百分比。她決定對於九種麵粉-溫度組合,在每一組合上烤制二個麵包,這樣共有27個麵包。對這些麵包測量其蛋白質的百分比。然而,她在任何給定的•天內只能烤九個麵包。提出個適當的試驗設計。 解答由於在一天內可以烤九個麵包,為了得到所希望的那麼多個觀測值,可以在這三天內重複進行3×3析因試驗。設計如下。 衕粉型別第一天溫度 1 2 Y 3 1 第二天溫度 2 3 1 第三天溫度 2 3 A B J Y » y ” 注意,這個設計實際上是一個隨機化區組設計,其中區組為烤制時間,處理是 3×3析因試驗的九個因子水平組合。這樣,利用這個隨機化區組設計,我們能夠在比較這些處理時濾除由於討厭變基烤制時間而產生的變異性。由於這些處理是來自於一個析因試驗的因子水平組合,我們可以在濾除由於烤制時間不同而產生的變異的基礎上,考察兩個因子(因子 A和因子 B)對於響應變數的效應。 例 15.10 對於例15.9中的按6=3的隨機化區組設計進行的3×3析因試驗,構造一個方差分析表,寫出各個變異來源和自由度。 解答1=9,8=3 的隨機化區組設計的方差分析表如下: 來源處理區組誒差總和 SS SST SSB SSE TSS 8 2 15 26

• 1016. 第十五章標準設計的方差分析由於這個隨機化區組設計的處理是一個3×3析因試驗的九個因子水平組合,我們可以按15.5節中的方法把處理平方和進一步劃分為3×3析因試驗中的各個變異來源。修改後的AOV 表為: 來源處理 A B AB 區組誤差總和 SS SST SSA SSB SSAB SSB SSE TSS df 8 2 2 4 2 16 26 在此我們不用 F=MST/MSE 做比較處理均值的綜合檢驗,而是對因子試驗進行方差分析以考察互動作用和主效應。這些F檢驗將使用適當的均方(MSAB, MSA 和 MSB)作分子,用從表中計算出來的 MSE 作分母。(譯者注:注意表中第四行和第六行的兩個 SSB意義不同,它們分別表示因子B的效應的平方和及區組效應的平方和) 練習基本技能 15.15 用圖表給出一個有6=3個區組,每個區組上有一個3×§析因試驗的設計,並寫出完整的方差分析表(包括來源,平方和,自由度)。 15.16 用圖表給出一個有6=2個區組,每個區組上有一個2×4×3析因試驗的設計,並寫出該設計的完整的方差分析表。 15.7 處理差異的估計和處理均值的比較我們已經強調了隨機化區組設計、拉丁方設計和析因試驗的方差分析的重要性。然而,有時我們可能對估計兩個處理(同一因子的不同水平或者不同的因子水平組合)上的平均響應的差更感興趣。例如,一位環境工程師可能對估計修復工作前後湖中溶解氧的平均含量的差更感興趣,而不是要檢驗是否存在差異。因而,這位工程師會提出這樣的問題:“溶解氧的平均含量的差是什麼”,而不是問“清理工

1S.7 處理差異的估計和處理均值的比較•1017• 作前後溶解氧的平均含量有差異嗎?” Fisher的LSD 方法可以用來評估隨機化區組設計、拉丁方設計以及各種設計下的天因子析因試驗中處理均倩的差異。以:記處理之的平均響應,妥:記處理 i的平均響應,n,記每個處理下觀測的次數。這兩個處理的平均響應的差異M一 p:的一個100(1-~)%的置信區間由下式給出。 處理均值差異的100(1-g)%的置信區間其中Se為AOV表中 MSE 的平方根,1a/2可以用a=a/2和MSE 的自由度從附錄中的表2查得。 例15.11 一家公司要比較空中交通管理人員使用的三種顯示幕。對於每種顯示屏幕,在五種不同的模擬緊急情況下進行考察。三十名受過良好訓練並具有相似工作經歷的空中交通管理人員參加了這項研究。把這些空中交通管理人員隨機地分配給顯示螢幕與緊急情況的組合,使得每一種螢幕—緊急情況的組合有兩名空中交通管理人員。對於每一名管理員,記錄他在每一種緊急情況下穩定下來所需要的時間(秒)。這些資料在表15.34中給出。 顯示拼幕,B 1 2 3 表1$.34 顯示螢幕資料(時間以秒計) 緊急情況,A 1 18 16 13 15 24 28 2 31 35 33 30 42 46 3 22 27 24 21 40 37 4 39 36 35 38 52 s 15 12 10 16 28 24 a.構造一個側面圖。 b.作出包括檢驗互動效應在內的方差分析。

• 1018. 第十五章標準設計的方差分析解答 a.樣本均值在表15.35中給出,由這些樣本均值畫出的側面圖見圖15.13。 由該側面圖我們可以看出,對於任意一對顯示解幕,這些管理員的平均反應時間的差在所有五種緊急情況下基本保持不變。顯示螢幕1和顯示螢幕2在這五種緊急情況下都產生了基本相同的平均反應時間,而顯示螢幕3產生的平均反應時間一致地比其他兩種顯示解幕要長。我們下面將要透過考慮反應時間相對於觀測平均時間的變異性,進行假設檢驗來確認這些判斷。 顯示螢幕,B 1 2 3 平均值可⋯ 表15.35 顯示螢幕-緊急情況下的平均反應時間緊急情況,A 1 17 14 26 19.0 2 33 31.5 44 36.2 3 24.5 22.5 38.5 28.5 4 37.5 36.5 54.5 42.8 5 13.5 13 26 17.5 平均修. 25.1 23.5 37.8 .=28.8 5040 530 樣2010顯示螢幕3 螢幕1 顯示螢幕2 2 3 影急情況,A 4 圖 15.13 每種緊急情況下幕均值的圖 5

15.7 處理差異的估計和處理均值的比較•1019• 表15.36 顯示螢幕-緊急情況研究的AOV 表 General Linear Models Procedure Dependent Variable:Y,Stabilization Time Source Hoddel ErrOr Corrected rotal Source D E DF 14 15 29 R-Square 0.974934 DF 2 D*E 4 8 Sum of Squares 4122.8000 106.0000 4228.8000 C.V. 9.230279 Type I SS 1227.8000 28.50.1333 44.8667 Mean Square 294.4857 7.0667 F Vaiue 41.67 Pr>F 0.0001 Root NSE 2.6583 Hean Square 613.9000 712.5333 5.6083 F Value 86.87 100.83 0.79 Y Mean 28.800 Pr>E 0.0001 0.0001 0.6167 b.計算機輸出的方差分析表見表15.36. 第一個假設檢驗是關於兩個因子,即緊急情況和品示幕型別之間的互動效應的檢驗。由於計算所得F值0.79 小於F 的臨界值2.64(相應於a=0.05,df =8和 df=15),沒有充分根據(值=0.6167)表明在緊急情況和顯示螢幕型別之間有互動效應。這就確認了我們透過側面圖所作出的判斷。由於互動效應不顯著,我們接下來檢驗顯示螢幕型別的主效應。計算所得F 值為86.87,大於F的臨界值3.68(相應於 a=0.05,df =2 和 dfz=15),所以我們有充分的依據(值< 0.0001)表明,對於三種顯示螢幕,平均反應時間之間有顯著的差異。 例 1$.12 參見例15.11。研究人員對於三種型別的顯示解幕所產生的平均反應時間差異的大小很感興趣。用95%的置信區間估計這些差異。 解答由於在顯示解幕型別和緊急情況型別之間沒有顯著的互動效應,不同型別的顯示拜幕所產生的平均反應時間差異的大小,在所有五種緊急情況下應大體一致。於是,我們可以在這五種緊急情況上求平均,來考察顯示螢幕型別的主效應:p . =1,2,3。從表15.35,我們得到 1. =25.1 .2.=23.5 y.3.=37.8 《=0.025,df=15 所對應的:值是2.131,G。的估計是

• 1020• 第十五章標準設計的方差分析 S= JMSE = J7.0667 =2.66 兩種顯示螢幕所產生的平均反應時間的差,即p.j.一4.的95%的置信區間的公式為 yi ys士Ea Se 對於顯示螢幕2和3,每種顯示螢幕我們有n;=10個觀測值,於是得到 37.8- 23.5土(2.131)(2.66) 2 vn 14.3士2.54 即,從11.76到16.84。因此,我們有95%的把握斷言,顯示螢幕2和顯示幕3 的平均反應時間的差在11.76到16.84之間。同樣地,我們可以計算顯示螢幕1 和3,以及顯示幕1和2的平均反應時間的差的置信區間。 在用F檢驗確定了有顯著的主效應以後,我們可以繼續做出兩種進一步的推斷。首先,我們可以利用例15.12中的方法求出任意一對因子水平上的均值差的置信區間:對於因子 A,這些差具有形式(i. -A.,而對於因子B,它們有形式隊.J.一隊j。由此也就估計出了這兩個因子效應的大小。其次,我們可以決定這些因子的哪些水平不同於其餘的水平。 如在第九章中所討論的那樣,為了在對因子水平做兩兩比較時控制試驗誤差的大小,我們使用多重比較方法。對於因子A,共有a(a-1)/2對,而對於因子B, 共有6(-1)/2對。與第九章中一樣,選取使用哪一種多重比較的方法也依賴子所做的試驗。所有在第九章討論的方法,如L.SD 法,Tukey 方法,SNK 法或 Schefte 方法都可以應用在隨機化完全區組設計,拉丁方設計或因子的因子試驗的場合。第九章有關這些方法的公式中的量s用MSE 代替,MSE 的自由度可以從 AOV 表中得到,樣本盤*在這裡指所比較的每個平均值中觀測值的個數,以 .為例,即指計算:時所用的資料值的個數。 例15.13 參見例 15.11 和表15.34 以及表15.35 中的資料。用 Tukey的W 方法找出顯示螢幕中的顯著差異。 解答對於 Tukey 的W 方法,我們使用第九章給出的公式其中s為AOV表中的 MSE,自由度w=15,9。(1,w)是用於比較:個不同總體均

• 15.7 處理差異的估計和處理均值的比較•1021• 值的學生化極差(a =a)的上側臨界值。由附錄中的表10,比較三種顯示螢幕,每個樣本均值有十個觀測值時,。(,)的值為 4.0s(3, 15) = 3.67 由於每個均值有十個觀測值,W的值為 W= 9o(t,) 區-3.6770-3.00 出表15.35,各個顯示螢幕上的均值為 y.1. = 25.1 3.2.=23.5 3.= 37.8 首先,我們把樣本均值從小到大進行排列: 顯示螢幕均億 2 23.5 1 25.1 3 37.8 對於差異(絕對值)超過W=3.09的兩個均值,我們認為它們兩今彼此差異顯著。這個多重比較的結果總結如下: 顯示螢幕 2 -1 3 這就是說,顯示螢幕1和2比顯示螢幕3有明顯短的平均反應時間,但在顯示螢幕 1和2之間,我們不能探察出任何區別。 案例,處理差異的比較由於三因子互動效應L*S*P是不顯著的(值=0.3106),我們來考察研究人員感興趣的兩因子互動效應。他們希望瞭解在肉製品中,SPI 的百分比的增加對半均組織指標的影響。這樣,我們需要把平均組織指標的差作為SPI 的百分比的函式來考察。由於在 SPI和魔芋的水平之間有顯著的互動效應(值< 0.0001),在SPI和魔芋的型別之間也存在顯著的互動效應(<0.0001),我們需要進行四個 SPI 百分比的水平上的均值的分離。研究人員擔心不能把各對均俏的差異找出來,所以我們使用Tukey 的方法。 首先,我們分別對於魔芋的兩個水平0.5%和1.0%,比較SPI 的各個百分比所對應的平均組織指標。Tukey 的 W 統計量的值為 W= 9o(t, dferor) 其中 =3,即SPI的百分比的水平數;從 AOV 表知 dfomor =24, 5=3.0308;由於 3.*.基於六個值算出,。=6為在每個魔芋的水平上,SPI 的各個百分比所對應的平均組織指標中的觀測值個數。由此,從附錄中的表10,我們得到 ga (t,dferor)=

•1022、 第十五章標準設計的方差分析 90.05(3,24)=3.53,從而 W -3.53 /3-10308 = 2.51 於是,在a=0.05 的顯著性水平上,任何其差別大於2.51 的一對均價可i-k.一都認為是具有顯著差昇的。結果總結在表15.37中。 魔芋水平 0.5% 1.0% 表15.37 在每個魔芋的水平上,SPI 的百分比所對應的平均組織指標 SPI(%) 1.1 110.0 a 97.5 a 2.2 105.0 b 96.2 a 4.4 9.17 c 90.0 b 在魔芋的水平0.5%上,所有SPI 的三個百分比產生的平均組織指標之間都是具有顯著差別的。SPI 百分比的水平越高,產生的平均組織指標值越小。對於魔芋的水平1.0%,SPI 百分比1.1和2.2所對應的平均組織指標之間無顯著差異,而SPI 百分比4.4所對應的平均組織指標比起1.1 和2.2所對應的平均組織指標來,有顯著的“下降。因此,SPI 的百分比與平均組織指標之間的關係,在不同的魔芋的水平上是不同的。類似地,在兩個魔芋的型別上,對於SPI 的百分比與平均組織指標之間的關係,我們得到如下結果(表15.38)。W 表示式中的所有量與前面一樣,因為在每一個魔芋型別-SPI 的百分比所對應的均值yx上,觀測值的個數為1. 6。因此,W=2.51。 魔芋型別 KSS 表15.38 在每個康芋的型別上,SPI 的百分比所對應的平均組織指標 SPI(%) 2.2 97.4 4.4 88.0 KNC 1.1 104.5 a 103.0 a 103.9 93.7 b •

15.8 小結•1023• 對於KSS,所有SPI 的三個百分比產生的平均組織指標之間都是具有顯著差別的。而對於 KNC,SPI 百分比1.1 和2.2所對應的平均組織指標之間無顯著差異,而SPI 百分比4.4 所對應的平均組織指標比起1.1 和2.2所對應的平均組織指標來,有顯著的下降。因此,SPI 的百分比與平均組織指標之間的關係,對於不同的魔芋的型別是不同的。 15.8 小結在這一章中,我們討論了幾種不同的試驗設計和處理結構的方差分析。所考慮過的設計有:完全隨機化設計,隨機化完全區組設計和拉丁方設計。透過這些設計,我們說明了如何極小化由外部變數帶來的、我們所不感興趣的變異性的效應, 從而對均值做出更精確的比較。因子處理結構可用於調查一個或多個因子對於試驗響應的效應。它既可用於完全隨機化設計,隨機化完全區組設計,也可用於拉丁方設計。比如,一個試驗人員可能希望在用區組劃分方法排除一個或多個外部變異來源之後,考察•個或多個因子對於響應的效應。 對於本章中討論的每個設計,我們給出了設計的方案(包括處理的安排),指出了該設計潛在的長處和不足,建立了該設計的一個模型,並講解了相應的方差分析方法。最後,對於每一個設計,我們討論瞭如何在處理均值間進行多重比較。 值得指出的是,本章所給出的設計僅僅是最基本的設計,而且,我們僅僅考慮了平衡設計的情況,也就是說,對於每一個處理(因子水平組合),所指定給的試驗單元的數目是一樣的。比如,在兩因子析因試驗中、如果在:=a6 個處理中的每一個上,都觀測了完全相同個數的試驗單元,那麼這個設計就是一個平衡設計。平衡設計的公式和分析比非平衡設計要簡單一些。在第十兒章,我們將把這一章的結果推廣到一些非平衡設計上。 重要公式 1.完全隨機化設計中的單因子模型模型:V +a+5i 平方積: 總和 TSS=2:(3i-5.)2 處理 SST=*2:(3. 3.)2-n2:(0:)2 2.隨機化完全區組設計中的單因子模型平方和:

• 1024 • 第十五章標準設計的方差分析總和 TSS=Zi(y -y.)' 處理 SST=62:6y. 區組SSB=12;(3, y.)2 二(B)2 誤差 SSE= 二itea}2=2g(yu-p-a:-$)3= TSS-SST-SSB 3. 拉丁方設計中的單因子模型模型:Yu= +ak+BtY;tei 平方和: 總和 TSS=2w(yi .)2 行 SSR-12.3-3)2-12:(A.)2 列 SSC=+2:(y-3..)2=12() 誤差 SSE=TSS-SST- SSR-SSC 4.完全隨機化設計中兩因子析因試驗模型模型:3 = +a;十月+啊+Ei 平方和: 總和 TSS=2 (y-.)2 因子 A 因子B SSB=an 2 .-.)=an2,(R.) 互動效應誤差勉理均值差的 100(1-a)%置信區間補充練彐 15.17(工程)一位試驗人員要考察一種新型黏結產品的黏結力。考察時的條件設定為三個不同的溫度(280°F,300°F和320°F)和四個不同的壓力(100,150, 200和250磅/半方英寸)。這位試驗人員準備了足夠多的這種新型黏結產品,從而可以在每個溫度-壓力條件組合上測試三個這種產品的樣品。假定試驗人員每天只能測試12個樣品,並且實驗室中的條件日有所變。試給出一個試驗設計,其中考忠到實驗室中不同口期的條件變化,並給出一個圖表,指明在每一個度一壓力組合上的黏結劑樣品。 15.18(教育)要研究兒童虐待對兒童在校表現的影響。兒童虐待分為三種程度,定義如下: “受到虐待的兒童”——受到體罰的兒童;

15.8小結•1025• “被忽略的兒童”—沒有受到充分關懷的兒童; “無虐待”——受到正常關懷並且沒有受到體罰的兒童。 試驗人員從三種程度的兒童中各隨機選取了30名男孩和30名女孩,其中受到虐待的孩子和被忽略的孩子是從州立兒童福利機構的記錄中抽選的,未受虐待的兒童是從當地的一所學校中抽選的。對於所有選中的孩子,記錄了他們參加閱讀、數學和一般科學三門功課的標準分級測驗的成績。 a.假若所有學生都參加第七級測驗,試給出一個設計。 • b.假若把這些孩子等分成三組,分別參加第三、五、七級測驗,試給出一個設計。 15.19(政府)一箇中西部大城市的管理人員正在與分別代表警察、消防和建築監察行業的三個協會就這些行業中僱員的工資進行談判。這三家協會稱,該市這三個行業的起點工資有巨大的差別,而在大多數城市中,這三種行業的起點工資之間沒有顯著差別。為了得到全國範圍內的起點工資的資訊,城市管理人員決定在八個地理分割槽中的每一個地區隨機抽取一個城市,並由此得到該地區這三種行業的起點年薪(單位:千美元)。資料如下。 地區瞀察消肪監察地區平均 1 32.3 31.9 27.9 30.7 2 33.2 32.8 27.8 31.3 3 30.8 31.6 26.5 29.6 4 30.5 31.2 26.8 29.5 5 30.1 30.8 26.4 29.1 6 30.2 30.6 26.8 29.2 7 28.4 28.7 25.3 27.5 8 27.9 27.5 25.9 27.1 均值 30.42 30.64 26.68 29.25 8.給這一研究寫出一個模型,並解釋模型中的所有各項。 b•下面是用 Minitab軟體得到的方差分析結果。這些結果是否意味著在三個行業的平均起點工資之間存在著差異?取∞=0.05. c.給出你的檢驗的顯著性水平。 d.哪兩種工作的起點工資之間有顯著差異? Two-Way Analysia of Variance for Salary Source DF Job 2 Region FrrOr Total 14 23 SS 62.8712 6.5213 0.4607 69.8532 HS 31,4356 0.9316 0.0329 E 955.23 28.31 P 0.000 0.000

1026• 第十五章標準設計的方差分析 15.20 參見練習 15.19。 a。以工作型別和地區作為因子,面出該資料的側面圖。圖上是否顯示出兩個因子之間有互動效應?如果看出有互動效應,你能用這些資料對互動效應進行檢驗碼?如果不能,為什麼? b.地理分割槽變數的使用,比起不分地理區域而直接隨機地抽取八個城市的完全隨機化試驗來,是否提高了效率? c.找出在術來的研究中,可能需要考慮的其他變異來源。 15.21(農業) 為了比較四種錳的施用量(利用 MnSO4)與四種銅的施用量 (利用 CuSOa5HO)對大豆產量的影響,進行一項研究。把一大塊地分成了32個田塊。隨機地為16個因子水平組合(處理)中的每一個指定兩個田塊,然後,在整塊地裡種上大豆,每行間距離3英尺。32個田塊產量給出如下(千克/公項)。 錳鑭按銅平均 1 3 5 7 按錳平均 20 1 558 1 578 1 590 1610 1 558 1 550 1 328 1 427 1 524.9 50 2 003 2 033 2 020 2051 2003 2 010 2 010 2 031 2 020.1 80 2490 2470 2620 2 632 2490 2 690 2887 2 832 2 638.9 110 2 830 2810 2860 2841 2 830 2910 2960 2941 2 872.8 2 221.5 2 278.0 2 255.1 2 302.0 2 264.2 8.指出這一試驗的設計。 b.對於這一試驗.寫出一個適當的統計模型。 c.作出側面圖;這張圖就錳和銅對於大豆產量的效應說明了什麼? 15.22 參見練習15.21。 2.用下面給出的計算機輸出結果,檢驗錳和銅對於大豆產量的效應之間的交互效應,取 a=0.05。

15.8 小結•1027• General Linear Naels Procedure for Exercise 15.22 Dependent Variable: SOYBEAN YIRL.D Source Hodel EFTOr Corrected Total DF 15 16 31 Sim of Squares 9167706.7 32053.5 9199750.2 Mean Square 611180.4 2003.3 F Value 305.08 Pr>F 0.0001 R-Sguare 0.996516 C.V. 1.976839 Root MSE AA.759 Y Mean 2264.2 Source MN CU * IN DE Tye III SS Mean Square 3 3 9 28199.3 9399.8 8935108.1 2978369.4 204399.3 22711,0 F Value 4.69 1486.70 11.34 Pr>E 0.0155 0.0001 0.0001 b. 錳的哪個水平顯示出有最高的產量? c.銅的哪個水平顯示出有最高的產量? d.錳和銅的哪個組合顯示出有最高的產量? 15.23 假定我們有一個完全隨機化三因子析因試驗,水平為3×4×6,在這 72 個處理的每一個上有三次重複試驗。假設三因子互動效應不顯著。 a.寫出一個模型來描述這種試驗中的響應 yim。 b.給出一個這種試驗的完整的AOV 表。 <.草擬能夠描述下列三種兩因子互動效應的側面圖:F!*F2顯著但有序,F2 *Fa不顯著,F」* Fs顯著但無序。 15.24(農業)為了比較不同水平的土壤 pH 值和鈣新增劑對於柑橘樹樹幹直徑增加的影響,做一項試驗。透過每年施用一次自然硫磺(elemental sulfur)、石膏肥料(gypsum)、蘇打灰(soda ash)以及其他成分把pHi 值保持在4,5,6 和7,鈣添加劑使用了三個水平(100,200和300磅/英畝)。2年以後,在每個因子水平組合上考察了三棵樹直徑的增加量。資料如下。

•1028• 第十五章標準設計的方差分析叫H值 4.0 100 5.2 5.9 6.3 鈣 200 7.4 7.0 7.6 300 6.3 6.7 6.1 s.0 7.1 7.4 1.5 7.4 7.3 7.1 7.3 7.5 7.2 6.0 7.6 7.2 7.4 7.0 7.2 7.5 7.2 1.6 7.5 7.8 7.4 7.0 6.9 7.2 7.3 1.0 6.8 6.6 6.4 8.構造一張側面圖。這些資料表明了什麼? b.寫出一個適當的統計模型。 c.進行方差分析,並指明該試驗設計是什麼設計,取a=0.05。 15.25 參見練習15.24。 2.用下面給出的計算機輸出結果檢驗互動效應和主效應,取a=0.05。 b.關於土壤pH值和鈣新增劑對於柑橘樹的平均樹於直徑增加的效應,你得到什麼結論? Ceneral L.inear Hode ls Procedure for Exercise 15.25 Dependent Variable: Increase in Tree Diameter Sum of Source Hodel Error Corrected Total DE 11 24 Squares 9.1830556 1.6266667 35 10.8097222 Hean Square 0.8348232 0.067777日 E Value 12.32 Pr≥E 0.0001

15.8 小結 • 1029• R-Square 0.849518 c.V. 3.691335 Root HSE 0.2603 Y Hean 7.052日 Source FH CA PH * CA DE Type III ss Nean Square 3 2 6 4.4608333 1.4869444 1.4672222 0.7336111 3.2550000 0.5425000 F Value 21.94 10.82 8.00 Pr>E 0.0001 0.0004 0.0001 15.26 參見練習15.24。 日.用 Tukey 的W 方法決定三種鈣(CA)的用量所對應的樹幹直徑的平均增量之間的差異,取a=0.05。 b.你的關於三種鈣的用量所對應的樹幹直徑的平均增量之間的差異的結論, 是否對於所有四個 pH值的水平都是一樣的? Level of ™H 4 5 6 7 Level of CA 100 200 300 Level of FH 4 4 4 5 5 5 5 6 6 7 -- ---YN 9 9 9 9 . Mean 6.50000000 7.31111111 7.40000000 7.0000000 -~一 Mean 6.95833333 7.33333333 6.86666667 SD 0.75828754 0.15365907 0.25000000 0.36400549 N 12 12 12 Ievel of CA 100 200 300 100 200 300 100 200 300 100 --Y--- SD 0.75252102 0.28069179 0.45193188 ------- N 3 3 3 3 3 3 3 3 3 3 Hean 5.80000000 7.33333333 6.36666667 7.33333333 7.26666667 7.33333333 7.40000000 7.63333333 7.16666667 7.30000000 SD 0.55677644 0.30550505 0.30550505 0. 20816660 0.15275252 0. 15275252 D. 20000000 0.15275252 0.15275252 0.17320508

•1030• 第十五章標準設計的方差分析 7 200 300 3 3 7.10000000 6.60000000 0.26457513 0.20000000 - 15.27 參見練習 15.24。 A.用包含在下述計算機輸出結果中的殘差分析確定在做適當的F檢驗所需要的條件中,是否有的條件得不到滿足。 b.如果有任何條件得不到滿足,試給出一種辦法來克服這一困難。 Variable-RESIDUAIS •N Hean Std Dev skewness 1:Normal Homents 36 Sun Ngts 0 Sun 0.215583 Variance - 0.22276 Kurtosis 0.986851 Pr≤N 36 0. 046476 0.699897 0.9562 Variable-RESIDUALS Stem Leaf 5 0 # 1 2 0007 1 03377 0 00337' -0 733 -1 7733000 -2 73000 -33 -4 -5 -6 0 1 Boxplot —----十 +- Multiply Stem. Leaf by 10ft-1 Normal Probability Plot 0.55+ -0.05+

15.8 小結 • 1031• Plot of Residuals*Estimated rreatment Mean Residuals 0.500 + 0.467 + 0.433 + 0.400 + 0.367 + 0.333 + 0.300 + 0.267 + 0.233 + 0.200 + 0.167 + 0.133 + 0.100 + 0.067+ J.033 + 2:000+ -0.033 + -0.067 + -0.100 + -0.133 -0.167 + + -0.200 + -0.233 一0.267 + + -0.300 + -0.333 + -0.367+ -0.400 + -0.433 一0.467 -0.500+ -0.533 + -0.567 + -0.600 + ---十 5.5 A A A A A 一--AA A A A A B AA A B AA ------AA A B A AAA A A A A A A A --十6.0 - --- 6.5 Bstimated Treatment Mean -十--- 8.0 15.28(醫藥)研究人員進行了一項試驗,以比較患者的平均口腔體溫,這些患老在九種高血壓常見處方藥物治療方案中接受了其中的一種。研究人員關心藥物的療效是否與患者的高血壓親亂的嚴重程度有關。把滿足這項研究的推入條件的高血壓患老按照血壓親亂的嚴重程度分為三個水平。然後,為這些患者隨機地指定九種藥物療法之一。研究中的每一位患者,在指定的研究期間,每天早晨6:00 點服用給定的藥物。從早晨8:00廾始,每一個小時量一次體溫,持續10個小時。 在此期間,患者不允許做任何體力活動,並且必須躺在床上。為了擺脫日間體溫變化的影響,記錄下每個患者10次體溫記錄的平均值。這些資料在下面的表中給出。 8.指明這個試驗的設計是什麼設計。 b.寫出一個適當的統計模型,並說明模型中引數的含義。

•1032 第十五章標準設計的方差分析嚴重稞度 1 A 97.8 97.2 97.6 97.2 97.6 B 98.1 98.1 98.0 97.7 $7.7 C 98.0 97.8 98.1 97.8 97.9 2 97.6 97.4 97.3 97.5 97.5 97.8 97.7 97.6 97.7 97.7 97.9 98.1 97.8 97.8 97.6 3 97.5 97.9 97.6 97.6 97.7 97.6 97.7 97.9 97.9 97.8 98.0 97.8 98.1 97.7 98.7 D 97.3 97.3 97.5 97.5 97.6 97.5 97.4 97.5 97.6 97.7 97.9 97.8 97.8 97.8 97.6 15.29 參見練習15.28。 a.對該試驗,完成下面的方差分析表。 來源嚴重程度葯物互動效位誤差總和 SS 0.3628 3.5117 0.5012 2.6520 7.0277 df 藥物 E 97.9 97.8 97.8 97.7 97.8 97.8 97.8 97.7 97.7 97.8 97.7 97.8 97.9 98.0 98.1 F 97.9 97.9 97.8 97.8 97.6 98.0 97.7 97.8 97.9 97.8 97.9 98.0 97.7 97.9 97.9 G 97.1 97.6 97.3 97.7 97.5 97.6 97.5 97.6 97.5 97.3 97.4 97.8 97.4 97.6 97.6 MS H 98.0 97.8 98.0 97.9 98.0 97.9 98.0 97.9 97.9 97.8 97.8 97.8 98.0 97.9 97.8 F I 97.8 98.0 97.7 97.9 97.8 98.0 97.6 98.0 97.9 97.9 98.0 98.1 97.9 98.1 97.9

15.8小結•1033• b.九種藥物所對應的平均體溫之間的差異,是否對於所有的三種血壓紊亂的嚴重程度來說都一樣?取a=0.05。 c. 對於不同的藥物和不同的嚴重程度,平均體溫之間是否存在顯著差異?取 ¢=0.05。 d. 使用側面圖來幫助你討論關於藥物和嚴重程度對患者的平均體溫的效應。 15.301醫藥)一位醫生要考察人們在鍛鍊極限測試中的表現與其超出正常的體重(由標推體重-身高表決定)之間的關係。為此,他抽取了由28 位鍵康成年女性組成的樣本,這些女性是從到社群診所做日常體檢的人當中隨機挑選的,她們的年齡從25歲到40歲。隨機挑選的過程使得在下述四種體重的分類中各抽選七人。 正常體重(比標準體重-身高表中的體重值輕不超過10%) 1%~10%超重 11%~20%超重超重20%以上作為體檢的一部分,要求每個人在帶有測定儀的腳踏車上做運動,直到疲勞為止。記錄下每個人到疲勞的時間(按分鐘計算)。資料如下。 分類正常 1%~10% 超重 11%-20% 超重超重20%以上疲勞時間 25,28,19,27.23,30,35 24,26,18.16.14.12.17 15,18.17,25, 12,10,23 10,9,18,14, 6,4,15 a.指出該試驗設計是什麼設計,並寫出一個適當的統計模型。 b.取c=0.05,進行方差分析。 15.31 參見練習 15.30。 8。為了調查年齡、性別和超出正常的體重對丁疲勞時間的影響,你如何設計一個試驗? b.假定該醫生要研究三個定量變數,即超出正常體重的百分比、年齡和疲勞時間之間的關係,寫出一個可能的模型。 15.32(環境) 為了調查五種不同設計的商用保溫玻璃窗格的熱量損失,進行一項試驗。研究人員為了得到適用於國家大部分地區的結果,決定在五個溫度下對這些玻璃窗格進行評估。這五個溫度是 G°F,20°F,40°F,60°F 和80°F。從每種設計型別的玻璃窗格中抽取10 個樣品,把其中每兩個玻璃窗格樣品隨機地指定給

•1034• 第十五章標準設計的方差分析五個外部溫度設定之一。對於所有的五個外部溫度,內部溫度都控制在70°F。五種玻璃窗格設計的熱量損失給出如下。 a.指出該試驗設計是什麼設計,並寫出一個適當的統計模型。 b.五種玻璃窗格設計的平均熱量損失之間存在顯著差異嗎?取a=0.05。 這裡給出這些效據的 AOV 表。 c.在所有五個溫度上,這五種設計之間的差異是否保持一致?取a=0.05, 並畫出側面圖來說明你的結論。 d. 取a=0.05,用Tukey的W 方法比較五種設計的平均熱報失。 外部溫度設定(‘F) 80 60 40 20 A 7.2,7.8 8.1,8.1 9.0,9.9 9.2.9.8 10.2,10.8 B 7.1,7.9 8.0.8.9 9.2,9.8 9.1,9.9 10.1,10.9 玻璃榭格設計 C 8.1,8.8 8.2,8.9 10.0.10.8 10.1,10.8 11.1,11.8 D 8.3,8.9 8.1,8.8 10.2,10.7 10.3,10.9 11.3,11.9 E 9.3,9.8 9.2,9.9 9.9,9.0 9.3.9.8 9.3,9.9 General Linear Hodel s Procedure for Exercise 15.32 Dependent Veriable: HIAT LOSS Source DF Sum of Sqvares F Value Pr>F Mode1 Error Corrected Total 24 25 49 58.07280000 5.78000000 63.85280000 10.47 0.0001 R-Square 0.909479 C.V. 5.067797 Y Hean 9.48000000 Source T D r*p DE 4 4 16 Tvpe II1 ss 39.77880000 7.32200000 10.97120000 F Value 43.01 7.92 2.97 PE>E 0.0001 0.0003 •0.0073

15.8小結•1035• D 0 b 0 0 ¢ 20 20 20 20 a b C d N 2 2 2 2 2 2 2 2 2 Mean 10.5000000 10.5000000 11.4500000 11,6000000 9.5000000 9.5000000 9.5000000 10.4500000 10.6000000 T Hean 20 40 60 80 10 10 10 10 10 10.7300000 9.9200000 9.8500000 8.6200000 8.3200000 D a b c d N 10 10 10 10 10 Hean 9.01000000 9.09000000 9.日6000000 9.94000000 9.54000000 15.33 參見練習15.24。在這個試驗中,研究人員沒有注意到試驗實際上是在四個不同的柑橘園中進行的,這些柑橘園位於不同的州。柑橘園1中的土壤 pHi 值為4.0.柑橘園2中的土壤pH值為5.0,柑橘園3中的土壤pH值為6.0, 柑橋園 4 中的土壤pH值為7.0. 在每個柑橘園中,為三棵樹隨機地指定三個鈣新增劑水平100,200,300(磅/英畝) 一。資料如下。 柑橋園 pH值 1 2 3 4 4.0 5.0 6.0 7.0 100 5.2.5.9,6.3 7.1,7.4,7.5 7.6.7.2.7.4 7.2.7.5.7.2 鈣 200 7.4,7.0,7.6 7.4,7.3,7.1 7.6,7.5,7.8 7.4,7.0,6.9 300 6.3,6.7.6.1 7.3,7.5,7.2 7.2,7.3.7.0 6.8,6.6,6.4 a.練習15.24 中所得到的關於土壤 pHI 值和鈣對於樹千直徑平均增量的效應的結論,在有了這些新的資訊以後,有何變化? b•設計一個新的試驗,以使土壤pH 值和鈣對於樹幹直徑平均增量的效應能夠得到有效的評估。所有四個柑橘園必須與pH值的四個水平和鈣的三個水平一起用在你的設計中。 15.34(心理學) 為了解不同的強化水平和隔離水平對於兒童回憶能力的影響,進行一項試驗。分析人員從一個相當一致的四年級班組中挑選了由36 個兒童組皮的隨機樣本。試驗中使用了兩個水平的強化(無強化和口頭強化)和三個水平的隔離(20,40,60分鐘)。把這些學生隨機地分配到六個處理組,每個處理組有六個學生。 每個學生要與分析人員共同度過30分鐘。在此期間,該生要記憶一段指定的內容,並按照為他(她)指定的處理組的規定進行相應的強化。這30分鐘過後,按

• 1036• 第十五章:標準設計的方差分析照他(她)所在的處理組的規定,把該學生隔離相應的時間,然後檢驗他(她)對所記憶的那段內容的憶情況。資料如下。 強化水平 20 隔離時間(分鐘〉 40 無強化口頭強化 23 28 t5 24 25 19 18 25 16 22 21 30 25 27 24 29 23 36 28 24 27 21 6 11 17 31 29 35 用這裡給出的計算機輸出結果,得出你的結論。 General Linear Hodels Procedure for Exercise 15.34 Dependent Variable: TEST SCORE Source Model Error Corrected Total DF 5 30 35 Sum of Squares 1410.8889 473.3333 1884.2222 Nean Square 282.1778 15.7778 F Value 17.88 R-Sguare 0.74月791 C.V. 16.70520 Root H$E 3.9721 Source REINEORCE TIME INTERACTION DF Type III ss Hean Sguare 1 2 2 196.0000 196.0000 156.2222 78.1111 1058.6667 529.3333 F Value 12.42 4.95 33.55 60 14 19 38 34 30 Pr>E 0.0001 Y Hean 23.778 Pr>E 0.0014 0.0139 0.0001 15.35(商業)一家食品加工廠測試了一種新型早餐飲料的不同配方。共有 12 種配方,這些配方是由三個甜度水平,兩個卡路里含量水平和兩種顏色搭配而成的。六個評審小組為這12 種飲料配方打了分。 a.指出該設計是什麼設計。 b.寫出一個適當的模型。 c.給出該設計的方差分析表。

15.8 小結•1037 色甜度水平 1 卡路里水平 2 卡路里水平 1 2 3 1 59.5 66.8 $2.0 2 42.5 49.6 39.3 1 54.S 64.7 35.1 2 40.1 50.1 30.2 15.36 對於練習15.35中的試驗設計,算出的方差分析表如下。這個表中缺少了什麼? 來源主效應 A B C 互動效應 AB AC BC ABC 誤差 SS MS H>F 4,149.55556 624.22222 3,200.00000 2 1 1 2,074.76389 624.22222 3,200.00000 75.S1 22.72 116.46 0.0001 0.0001 0.0001 488.52778 203.08333 80.22222 24.19444 1,648.66667 2 2 1 2 60 244.26389 101.54167 80.22222 12.09722 27.47778 8.89 3.70 2.92 0.44 0.0004 0.0307 0.0927 0.6459 15.37 參見練習15.36。假定評審小組之國沒有變異(從而MSE 可以作為誤差的度量),試提取關於這些配方的結論。基於這裡給定的處理均值,哪個配方看起來與眾不同?所看到的一切能夠從一系列側面圖中得到解釋嗎?為什麼? 15.38(人力資源)從一家公司的三個部門分別抽取了12,9,18個僱員組成的隨機樣本,並對他們進行數值打分以評價他們的工作表現。概括資料如下。 部門研究開發營銷 12 9 18 y 21.2 15.4 27.4 8.3 7.3 8.2

•1038• 第十五章標準設計的方差分析 a,指出該設計的型別。 b,寫出一個適當的模型。 15.39 參見練習15.38。取a=0.10進行方差分析,並得到有關結論。 (注:分數越高表現越好) 15.40(醫藥)研究人員對一種約品在四個長度不同的儲存期內的穩定性感興趣。四個儲存期為1,3,6和9個月。這種藥是由30mg/mL. 某種藥品的活性成分製成的。儲存期過後,測量約品中活性成分的含量。這些約品儲存在30°C的恆溫條件下。研究中使用了兩個實驗室,每三個2mL,裝藥瓶被隨機地指定給四個儲存期之一。儲存期終緒時,測定每瓶中活性成分的含量。對於每一瓶藥品,還測世並記錄「其pH值。資料如下。 a.寫出反映每一瓶上的響應值與其因子,即儲存時間長度和實驗室之間的關系模型。 b.列出a中模型的方差分析表,但不必計算平方和。 時間(在 30°C下保存的月數) 1 實驗室活性成分(mg/ml.)pH 3 3 6 6 6 9 9 9 1 1 1 1 1 1 1 1 1 1 1 30.03 30.10 30.14 30.10 30.18 30.23 30.03 30.03 29.96 29.81 29.79 29.82 3.61 3.60 3.57 3.50 3.45 3.48 3.56 3.74 3.81 3.60 3.5S 3.59 時間(在 30°C下保尖驗室存的月數) 1 1 1 3 3 3 6 6 6 9 9 9 2 2 2 2 2 2 2 2 2 2 2 2 活性成分 pH (mg/mL) 30.12 30.10 30.02 29.90 29.95 29.85 29.75 29.85 29.80 29.75 29.85 29.80 3.87 3.80 3.84 3.70 3.80 3.75 3.90 3.90 3.90 3.77 3.74 3.76 15.41 參見練習15.40。下面給出了對於兩個因變數(即y1 =mg/ml.活性成分和32=pH)所進行的方差分析的計算機輸出結果。基於這些分析,提取關於這些2mL.瓶裝藥品的穩定性的結論,取a=0.05。

| 15.8小結 •1039• General Linear Hodels Procedure for Exexcise 15.41 Dependent Variable:HG/ML. Source Madei Error Corrected Total DF 7 16 23 Sun of Sqares 0.4674000 0.0391333 0.5065333 Mean Square 0.0667714 0.0024458 R-Square 0.922743 C.U. 0.165090 Root MSE 0.0495 Source TIME LAB TIME *LAB General L.inear Hodela Procedure Dependent Var iable:pHl DE rYe III SS Mean Square 3 0.2937667 0.0979222 1 0.0912667 0.0912667 3 0.0823667 0.0274556 Source Mode1 ErrOr Corrected Total DE 7 16 23 Sum of Sgvares 0.4201625 0.0447333 0.4648958 Nean Square 0.0600232 0.0027958 R-Square 0.903778 C.V. 1.429232 Root HSE 0.0529 Source TIHE LAB TIHE *LAB DE Type III ss Hean Square 3 0.1144458 0.0381486 1 0.2970375 0.2970375 3 0.0086792 0.0028931 E Value 27.30 F Value 40.04 37.32 11.23 F Value 21.47 F Value 13.64 106.24 1.03 Pr>F 0.0001 Y1 Hean 29.957 Pr>E 0.0001 0.0001 0.0003 Fr>F 0.0001 Y2 Mean 3.6996 PE>E 0.0001 0.0001 0.4038 15.42 參見練習 15.40。與在練習15.40中一樣,同種型別的關於mg/mL 和 plt 的資料在40°C上產生。資料給出如下。 a.下面分別對響應變數y=mg/mL. 和y2 pH給出了相應於練習15.40(a) 中模型的方差分析的計算機輸出結果。三個因子對於藥品的平均活性成分的效應奶何?取 a=0.05。 b. 下面分別對響應變數 y1=mg/ml. 和y2 pH給出了相應於練習15.40(a)

• 1040• 第十五章標準設計的方差分析中模型的方差分析的計算機輸出結果。三個因子對於藥品的平均pH值的效應如何?取 a=0.05,並畫出側面圖來說明你的結論。 c.你的關於儲存期和溫度對於平均pH 值的影響的結論,就兩個實驗室來說, 是否是一樣的? d.你的關於儲存期和溫度對於藥品的平均活性成分的影啊的結論,就兩個實驗室來說,是否是一樣的? 時間{在 40°C下保存的月數} 實驗室活性成分 (mg/mL.) pH 1 1 1 3 3 3 6 6 6 9 9 9 1 1 1 1 1 1 1 1 1 1 1 1 30.08 30.10 30.14 30.03 30.18 30.26 29.90 29.90 29.96 29.81 29.85 29.72 3.61 3.60 3.59 3.39 3.45 3.29 3.63 3.71 3.65 3.51 3.38 3.32 時間(在 40°C 下保存的月數) 1 1 1 3 3 3 6 9 9 9 General Linear Models Procedure for Exercise 15.42 Dependent Variable: MG/ML Source Hode1 EIrOT Corrected Total DF 15 32 47 Sum of Squares 1.1475917 0.0968000 1.2443917 Hean Square 0.0765061 0.0030250 實驗室 2 2 2 2 2 2 2 2 2 2 2 2 活性成分 (mg/ml.) pH 30.12 30.10 30.02 29.90 29.85 29.80 29.75 29.70 29.75 29.65 29.75 29.70 3.80 3.70 3.81 3.70 3.80 3.75 3.80 3.70 3.70 3.64 3.68 3.60 F Value 25.29 Pr>E 0.0001

15.8小結•1041• R-Square 0.922211 c.V. 0.183719 Root MSE 0.0550 Source TIME LAB TINE *LAB TEMP TIME * TEHE LAB* TEME TIMIE *LAB * TEMP General Linear Models Procedure Dependent Variable:pHi DE Type III SS Mean Square 3 0.7360083 0.2453361 1 0.22963333 0.2296333 3 0.1443167 0.0481056 1 0.0184083 0.0184083 3 0.0120750 0.0040250 1 0.0027000 0.0027000 3 0.0044500 0.0014833 Source Nodel BrrOr Corrected Total DE 15 32 47 Sum of Squares 0.9848667 0.1026000 1.0874667 Nean Square 0.0656578 0.0032063 R-Square 0.905652 c.v. 1.547802 Root HSE 0.0566 Source TIME L.AE TIME*LAB TEMP TIME* TEHP LAE * TEMP TIME * LAB * TEHP DE Iype LII SS Hean Square 3 1 3 1 3 1 3 0.2286000 0.0762000 0.5676750 0.5676750 0.0555583 0.0185194 0.0816750 0.0816750 0.0250917 0.0083639 0.0003000 0.0003000 0.0259667 0.0086556 F Value 81.10 75.91 15.90 6.09 1.33 0.89 0.49 F Value 20.48 F Valve 23.77 177.05 5.78 25.47 2.61 0.09 2.70 Y1 Hean 29.937 Pr>E 0. 0001 0.0001 0.0001 0.0192 0.2817 0.3519 6.6914 Pr>E 0.0001 Y2 Mean 3.6583 Pr>E 0.0001 0.0001 0.0028 0.0001 0.0686 0.7617 0.0621 15.43(商業)某製造商的日常原材料供應是不定的,並且受到一定的限制。 該製造商可以用這些原材料生產兩種不同的產品,並且可以調整這兩種產品的生產比例。生產每一種產品時,從單位原材料所獲得的利潤依賴於生產該種產品的持續時間,從而依賴於指定生產這種產品的原材料數量。其他因子,如工人生產, 機械故障,等等,也影響每單位原材料的利潤,但它們對於利潤的效應是隨機的、不可控制的。製造商已經進行了一個試驗,用來考察原材料供應水平,S,和指定給

• 1042• 第十五章標準設計的方差分析兩種產品生產線的原材料的比例,R,對於每單位原材料利潤的影響。最終的目標是對於每天的原材料供應量S,選擇最好的比例R。試驗中選用的原材料的供應水平為15,18 和21噸,指定給兩種產品生產線的比例為 1/2.1 和2。響應值是一天之中單位原材料的利潤(以分為單位)。在每個組合上按隨機的次序重複了三次。這27天的資料列在下面的表中。 涼材料分配的比例(R) 1/2 1 2 15 22.20,21 21,20.19 17,18,16 原材料供應(噸) 18 21,19,20 23.24,22 21.11,20 21 19,18,20 20,19,21 20.22,24 a、基於這裡給出的方差分析結果,給出有關結論,取a=0.05。 b.找出S和R 的兩個最好的組合。這兩個組合有顯著的差別嗎?限定所有成對組合比較的犯錯誤的機率不超過0.05。 General Linear Models Procedure for Exercise 15.43 Dependent Variable:PROFIT Source Model Error Corrected Total Sum of DE 8 18 Squares 93.185185 82.666667 26 175.851852 Mean Square 11.648148 4.592593 F Vaive 2.54 PT>F 0.0482 R-Square 0.529907 C.v. 10.75500 Root HSE 2.1430 Y Hean 19.926 Source RATIO SUPPLY RATIO * SUPPLY DF Type III SS Nean Sguare 2 22.296296 11.14814日 2 4.962963 2.481481 4 65.925926 16.481481 PROE IT MEANS F Value 2.43 0.54 3.59 Pr>E 0.1166 0.5917 0.0255 bevel of RATIO 0.5 Level of SUEELY 15 HEAN 21.00 RATIO 0.5 MEANS 20.00 SUPPLY 15 MEANS 19.33

15.8小結•1043• 0.5 0.5 1.0 1.0 1.0 2.0 2.0 2.0 18 21 15 18 21 15 18 21 20.00 19.00 20.00 23.00 20.00 17.00 17.33 22.00 1.0 2.0 21.00 18.78 18 21 20.11 20.33 15.44(商業) 某製造商經常給居住在另一城市的顧客透過航空郵遞寄送小型包裹,並且在很多情況下,寄出的包裹儘快到達顧客手中這一點是很重要的。有三家不同的公司提供航空郵遞服務,包括接收郵件和在24小時內投遞給收件人。 製造廠家郵送部門的負責人希望知道這幾家公司的郵送速度有無差異,以及郵寄的時間是否有影響。為了瞭解這些問題,設計了一個試驗。包裹在隨機選定的時刻送出,投送每個包裹的公司也是隨機選擇的。顧客記錄下每個包裹到達的時間, 從而可以計算出每個包裹在郵送途中的時間。這些時間被舍入到最接近的小時數。共54個包裹的試驗結果由下表給出。 時間上午下午晚上 8.6,6,12,7,8 7,10,8,11,9,11 13,11,14,11,9, 12 公司 2 11.11,9,10,8,11 10,13,10,12,11,10 12,6,9,9,10,6 3 7,4,6,4,9,7 10,8.6,5,8,6 8,11,9,9,10,12 a.如果先用虛擬變數的方法代替 AOV 方法進行分析,為了在模型中既包含各個主效應也包含各個互動效應,需要幾個虛擬變數?對於這個迴歸模型,R2是什麼? b.什麼樣的依據能夠說明,在一天中的不同時間,最好的公司也不同?用5% 的顯著性水平,你能得到什麼結論?構造一幅圖,以表明這樣的性質,即郵遞公司之間的任何差異隨送出包裹的時間不同而不同。 c有無一家公司看上去比其他兩家好些?你如何用置信區間來比較最好的和次好的公司? General Linear Models Procedure for Exercise 15.44 Dependent Variable:SPE區D

• 1044• 第十五章標準設計的方差分析 Source Hodel EETOr Corrected Total DF 8 45 53 Sum of Squares 154.37037 143.33333 297.70370 Mean Sgvare 19.29630 3.18519 F Value 6.06 Pr≥E 0.0001 R-Square 0.518537 c.U. 19.66822 Root MSE 1.7847 Y Mean 9.0741 Source TIME FIRH TIME * FIRM TIME A A A H H N N N 1 2 3 1 2 3 1 2 3 DF Type III sS Mean Square 38.259259 19.129630 2 50.037037 25.018519 4 66.074074 16.518519 HEAN SFEED FOR TREATNENIS AND EACH FACIOR MEANY TIME --..... 9.33 A MEAN. FIRM 9.167 1 11.00 M 日.000 2 7.16 10.056 3 7.83: 10.00 6.16 11.66 氵 8.66 9.83 F Value 6.01 7.85 55.19 Pr>F 0.0049 0.0012 0.0016 MEAN 9.611 9.888 7.722 15.45(工程) 某紡織公司正在考慮一種合成纖維的三種染色方法。他們希望知道這三種染色方法在質量上是否確有差別。為了幫助判斷,該公司進行了一項試驗。把五種布料各剪為三塊,把這三塊隨機地指定給這三種染色方法,每種染色方法一塊。然後,給這些布塊分級評分,以表明染色的質。結果如下。 染色 A B C 1 74 81 95 2 78 86 99 布料品種 3 76 90 90 4 82 93 87 5 77 73 93

15.8小結•1045• a.指明這個設計的型別。 b.進行方差分析,並得出關於染色方法的結論,取a=0.05。 c•給出該設計相對於不按布料品種進行區組劃分的設計的效率。 General Linear Models Procedure for Exercise 15.45 Dependent Var iable: Q0ALITY Source Model Error Corrected Total DE 6 8 14 Sum of Sqvares 688.00000 274.93333 962.93333 Hean Square 114.66667 34.36667 F Value 3.34 Fr>F 0.0596 R-Square 0.714484 c.V. 6.902248 ROCT MSE 5.8623 Y Hean A4.933 Source DE Tye III ss Nean Sguvare F Value Pr>E DYE SPECIHEN DYE 1 2 3 2 4 Hean 77.40 84.60 92.80 593.73333 94.26667 296.86667 23.56667 8.64 0.69 0.0100 0.6216 SPECINEN 1 2 3 4 5 Hean 83.33 87.67 85.33 87.33 81.00 15.46(心理學)一個試驗測試了工廠中播放的音樂對於工人生產的影響。 試驗中對四種音樂節目(A, B,C,D)和無音樂(E)進行了比較。每種節目一次播放一整天,重複了五次。因而整個試驗持續了5個星期。為了控制各個星期之間,以及一個星期內各日之間的變異,對這個試驗的25天採用了拉丁方設計。每種節目在某個星期一播放一次,某個星期二播放一次,•,某個星期五播放一次;一個星期中每種節目只播放一次. 8.在這五種音樂下,平均生產量看起來有差別嗎?取a=0.05。 ‘b.如果工人的產量之間有差別,哪一種音樂節目比起沒有音樂來,有更高的產量?

•1046•