AI 新聞與投資

標準設計的方差分析協方差分析一些固定效應、隨機效應和混合效應模型的方差分析重複測量與交叉設計

14.1 14.2 14.3 14.4 14.5 14.6 14.7 第十四章引言研究的型別設計的試驗；術語控制試驗誤差試驗單元對處理的隨機化確定重複試驗的次數小結試驗和研究的設計概念 14.1 引言一個試驗的設計是建立一種方案的過程，透過該方案的實施，我們可以根據已記錄下的響應對不同的處理組作出比較。我們可以用許多不同的方法來進行一項科學研究。在某些研究中，研究人員從未受干擾的自然過程或環境來收集信息—例如，一項有關公立，教會及私立學校的二年級學生閱讀得分差異的研究。在另一些研究中，科學家在環境條件受到高度控制的實驗室中工作，而這樣的環境條件，可能是為了進行該項研究完全由人為設定的。有關溫度和溼度對壁蝨生命週期影響的研究就是在實驗室中進行的，因為在壁蝨生活的自然環境中，溫度和溼度是無法人為控制的。對研究中因素的這種控制，使得昆蟲學家更易於用溫度和溼度水平的不同來解釋所得到的結果，因為在整個試驗過程中幾乎所有的其他條件是保持不變的。然而，在自然環境下，許多其他因素的變化也會造成壁蝨生命周期的變化。這樣，在這些人為的環境下，人為控制越多，試驗能刻劃的自然界真實情況就越少。為了使試驗有實用價值，必須在條件的人為控制和反映現實之間保持某種切實的平衡。在這一章，我們將給出一些標準的試驗設計方案，並介紹用來分析從這些試驗得來的資料的方法。 14.2節描述幾種型別的研究，並且給出與設計的試驗有關的幾個名詞術語。在14.3節中，我們將討論在一項研究中，實施試驗之前需要考慮的若於重要元素。在14.4 和14.5節中，討論在設計的試驗中，隨機化對於控制試驗誤差和建立有效的推斷機制所起的作用。14.6 節給出了幾種確定為從試驗資料得到所關心的總體和處理的適當推斷所需要的重複次數的方法。

• 924• 第十四章試驗和研究的設計概念 14.2 研究的型別在第二章，我們討論了觀察研究和設計的研究之間的區別。各種形式的觀察研究，如民意測驗、抽樣調查、流行病學研究等等常被用於許多不同的背景以回答所關心的問題。抽樣調查被用於瞭解國民對有關如控制槍支、利率、稅款、福利、社會安全和國債等問題的觀點的變動。同樣，我們從每日的報紙、雜誌、電視、廣播及網際網路收到其他有關政治、社會、教育和健康問題的民意測驗的結果。在觀察冊究中，所關心的因子（或處理）在我們進行測量時不受控制。例如，一個引起極大關注的公共健康問題是心臟病與飲食中的脂肪含量之間的聯絡。隨機地為志願者指定幾種不同脂肪含量的食譜之一，然後在一段時間內監視他們以觀察是杏患上心勝病，這樣做既不道德而且要花費太多的金錢和時間。由於不能控制所關心的因子（食物中的脂肪含量），科學家必須用觀察研究來解決這一問題。可以這樣做：在心臟病患者和沒有心臟病的人中各抽取一個樣本，然後比較這兩組人的飲食。此外，還必須注意記錄下其他的相關因子，例如，每個人家族的心臟病史、吸菸習慣、日常鍛鍊、年齡和性別等，用以對組間的差異進行調整，排除食物脂肪含量外的其他因子的影響。即使進行了這些調整，我們也很難指稱在食物的高脂肪含量與心臟病之間具有因果關係。事實上，如果在對於其他因素進行了相應的調節後，發現患心勝病組的食物脂肪含量趨向於比不患心臟病組的高，我們將報告說，食物的高脂肪含量與心臟病之間有關聯，而不是說二者之間具有因果關系。換言之，在觀察試驗中，我們從因子（或處理）已經存在的總體中抽取樣本，然後，我們就關心的因子（或處理）對樣本組進行比較。與之相反，在試驗環境受到控制的試驗研究中，我們可以隨機地為作為研究物件的人指定因子（或處理），然後觀察所關心的響應。對於我們上面心臟病的例子，兩者的區別如下：觀察研究：我們分別從心臟病患者的總體和不患心臟病的人的總體中抽取樣本，然後比較這兩組樣本中人的食物的脂肪含量。試驗研究：忽略道德因素，我們將給志願參與者分配幾種不同脂肪含量的食譜（處理）之一，然後在一段時期後，就所關心的響應（心臟病）比較不同的處理。在這一章，我們集中討論設計的試驗。在這類研究中，研究人員透過以下兩種方法中的一種來控制關鍵的因子。方法1：把試驗中的研究物件隨機地分配給處理。例如，給10只老鼠隨機地分配所研究的試驗藥物的4種劑量水平中的一種。方法2：從所關心的不同總體中隨機地選擇研究物件。例如，從大城市和小城市的動物收容所中隨機地選出50 只母狗和50只公狗，然後檢測它們體內是否有

14.3 設計的試驗：術語•925• 犬惡絲蟲。在方法1中，研究人員從一個由具有一致性的試驗單元構成的總體中抽取試驗單元，並且完全控制隨後進行的把試驗單元隨機地指定給處理這一過程。在方法2中，研究人員能控制從處理總體的隨機抽樣，但不能控制試驗單元對處理的分配。在設計的試驗中，很關鍵的一點是科學家遵從試驗開始之前已經建立好的系統方案。這一方案包括如何實施所有的隨機化，如何把試驗單元分配給處理或如何從處理總體中選出試驗單元。外部的因素可能會出現，從而影響試驗單元。這些因素可能是試驗單元中輕微的差別或在試驗進行期間外部環境中的細微差別。隨機化過程保證，平均來說，任何觀察到的不同處理組中試驗單元響應間的較大差別，可被歸因於所關心的因素間的差別，而不是歸因於試驗過程中未受控的因素。試驗方案還應當包括許多其他有關如何進行試驗的內容，其中一些應當包含的事項列如下表： 1.試驗的研究目標。 2.選擇要變化的因子（處理）。 3. 識別試驗單元或試驗環境中可能出現的外部因素（區組因子）。 4. 要測量的試驗單元的特徵（響應變數）。 5.隨機化的方法，即從處理總體中隨機抽樣或者是隨機地給處理分配試驗單元。 6.記錄試驗單元的響應所用的方法。 7. 選擇分配給每一處理的試驗單元的個數，這可能需要指定顯著性水平和檢驗的功效或置信區間的精度和可靠性。 8. 一張完整的可利用的資源和材料的清單。本書第十五章到第十九章講述設計的試驗的分析方法。 14.3 設計的試驗：術語我們將對若干詞語的普通用法和在設計的試驗的框架內為這些詞語和概念所賦予的意義做出區分。更簡潔地說，設計的試驗是一種這樣的研究，它為就一個指定的響應變對多組個體進行觀察、測量和評價提供了一種特定的方案。研究人員在試驗的過程中，控制該方案中的要素以得到資料，並且透過對該資料的統計推斷對所關心的組作出有效的比較。我們用下面例子來說明此處將要定義的概念種術譜。

•926• 第十四章試驗和研究的設計概念例 14.1 研究人員正在研究在何種條件下，商業養殖的蝦能達到最大重量的增加。研究選擇了3種水溫（25°，30°，35）和4種水的含鹽量（10%，20%，30%，40%）。蝦放養在指定水溫機鹽分的容器中。在6周以後，記錄下每一個容器中蝦重量的增加。有許多其他的因素會影響蝦的重量增加，如容器中蝦的密集程度、蝦的種類、蝦的大小及食物型別等。試驗如下進行：研究人員有24只容器可以利用；為研究選定了蝦的種類和苗蝦的大小；容器中蝦的放養密度固定在一個給定的水平上不變：給24只容器中的每一隻分配3種水溫中的一種和4 種鹽分中的一種；規定在研究期間所有其他可識別的條件對於24只容器都相同。事實上，這些量的水平會有一些變化。在容器中養殖6周後，把蝦撈出並稱得重量。在設計的試驗中有兩類變數。被稱為因子的受控制的變數是被研究人員選出用來作比較的。響應變數是被研究人員記錄到的但未受控制的測量值或觀測值。受控的變數形成研究假設所定義的比較組。在我們的例子中，水溫和鹽分是受控變數或因子，蝦的重量是響應變數。設計的試驗中的處理是從子構造出來的條件。因了是透過考察研究假設所提出的問題選擇出來的。在某些試驗中，可能只有單一的一個因子，因而因子的水平和處理是相同的。這類處理設計稱為單向分類。在多數情況下我們有幾個因子，處理是由各因子的水平組合而成的。這類處理設計稱為因子處理設計。對於 14.1 中描述的研究蝦的例子，有兩個因子：具有3個水平（25°，30°，35°）的水溫和具有4個水平（10%，20%，30%，40%）的鹽分。這樣我們可以用兩因子的各水平組合生成3（4）=12個處理。表示這12種處理的因子水平組合如下：（25°，10%）（25°，20%）（25°，30%）（25°，40%）（30°，10%）（30°，20%）（30°，30%）（30°，40%）（35°，10%）（35°，20%）（35°，30%）（35°，40%）在例14.1中使用了24只容器，並且它們被隨機地分配給12種處理，每兩隻容器分到一種處理。在其他情況下，因子的個數可能很大，因此處理的個數也會變得很大，這樣試驗只能考察所有可能處理的一個子集。例如，假定我們正考慮研究下列因素對大豆畝產量的影響。因子有：因子1-5種大豆品種；因子2-3種種植密度：因子3—4種施肥水平；因子4—得克薩斯州的6個地方；因子5——3種灌溉等級。從這5個因子我們能形成（5）（3）（4）（6）（3）=1080個不同的處理。這將使得試驗非常巨大而且費用昂貴。在這種情形下，將從 1080 種可能的處理中選擇一個處理子集米研究五個因子與大豆產量之間的關係。這類試驗稱為部分析因試驗，因為在試驗中實際上只使用了部分可能的處理。為了儘可能多的回答研究人員關心的問題，必須要對選擇哪些處理進行試驗給予極大的重視。

14.3 設計的試驗：術語•927• 一類特的處理被稱為對照處理（control treatment，又譯控制處理），這類處理構成了比較其餘處理的效應的基準。有三種情況特別需要對照處理。首先，試驗進行的條件可能會阻止有效的處理展現他們的效用。在這種情況下，由沒有處理構成的對照處理可能有助於揭示：試驗條件不允許處理顯示它們效應間的差異。例如，做一個試驗，以確定種植西紅柿的菜園中最有效的施氮肥量。如果在向試驗用的土壤中施加氮肥之前，土壤的肥力已經很高，那麼所有施加的氮肥量的不同水平將呈現出相等的效應。然而如果在試驗中使用了由不施氮肥組成的處理，即對照處理，那麼土壤的高肥力就會因為對照處理與施加氮肥的處理有同樣效果而被發現。第二類對照是其他所有的處理都與之相比的標準處理方法。提出幾種新的方法以取代現有的、完善的方法，就屬於這種情況。最後，安慰劑對照被用於試驗期同透過控制餅究物件就可以從研究物件得到一響應值的情形。例如，人們會因為看了醫生並得到處方的治療而表現出疼痛程度的暫時緩解。這樣，在評價減輕病人疼痛的幾種不同方法時，把沒有有效成分的處理即安慰劑在病人毫不知情的條件下分配給…組病人，然後把有有效成分的處理與安慰劑作出比較以確定它們的真實療效。試驗單元是接受我們隨機分配的處理的物理整體，或從一個處理總體中隨機選出的個體。對於例 14.1 有關蝦的研究中，試驗單元是容器。考慮另一個試驗，其中研究人員要用試驗用鼠來檢驗一種新藥各種不同劑量《處理）的差別。如果研究人員隨機地給每隻老鼠指定一個藥的劑量，那麼試驗單元就是單隻老鼠。一旦一個處理分配給了一個試驗單元，就說該處理發生了一次重複。一般來說，我們會對每一處理隨機地分配幾個試驗單元，這樣，對於每一個特定的處理我們將得到若下獨立的觀察值，因而該處理就有幾次重複。在例14.1 中，每一處理我們有2次重複。測量單元與試驗單元不同，它是我們對其進行測量的物理整體。在許多試驗中，試驗單元和測量單元是一致的。例14.1中，與試驗單元一樣測量單元也容器。然而，如果稱量了每個容器中的每隻蝦的重量，那麼由於我們是將處理應用於容器的，故試驗單元將是容器，而測量單元是蝦。例 14.2 考慮下面的試驗。要評估用於煎炸用鍋的四種防護塗料，對四種塗料中的每一種塗料，隨機地指定五隻煎鍋。對於這 20只煎鍋，在每隻煎鍋的3個指定區域測量了塗料的一種抗磨效能指標。確定這個研究中的下述各項：試驗的設計，處理，重複次數，試驗單元，測量單元和總的測量次數。

•928• 第十四章試驗和研究的設計概念解答試驗的設計：單向分類。處理：四種防護塗料。重複：每一處理有五隻煎鍋（即每一處理有五次獨立重複實現）。試驗單元：煎鍋，因為塗料（處理》是隨機地指定給煎鍋的。測量單元：煎鍋的指定區域。總的測量次數：4（5）（3）=60。試驗誤差用來描述被分配給相同處理，並在“相同”的試驗條件下被觀測的各試驗單元響應之間的變異。試驗誤差不為零的原因包括：（a）在接受處理之前試驗單元間固有的差別；（b）記錄測量設施的變異；（c）處理條件設定方面的變異；（d）除 T處理因子以外的所有外部因子對響應變數的影啊。例14.3 回到前面所討論的實驗室中的試驗問題，其中研究人員隨機地把單一劑量的藥物分配給每一隻老鼠，2小時後，測量老鼠血液中藥物的濃度。對於這項試驗，試驗單元和測量單元是相同的，即老鼠。給出該試驗中四種可能的試驗誤差來源。［參見上面的（a）~（d）］解答我們可以寫出如下這些試驗誤差的來源： a.得到處理之前試驗單元同固有的差別。老鼠之間存在細微的生理差別，因此即使對於獲得完全相同劑量水平的兩隻老鼠，2小時後他們血液中的藥物含量也會稍有差別。 b.記錄測量設施的變異。因實驗技術人員確定老鼠體內藥物含量時所用的方法的不同，響應間也會有差異。即使對同一老鼠做幾次血液藥物等級的測量，所測出來的藥物含量也可能會因儀器間的變異，技術人員的不同，或實驗室條件的變動而不盡相同。 c.處理條件設定方面的偏差。如果每一處理有一次以上的重複，那麼處理可能隨老鼠不同而不同。例如，假定對於每一劑量（處理）有十次重複。我們不大可能做到十隻老鼠得到的藥物劑都與處理所規定的完全相等。注射器中的藥量可能會稍有不同，注射並進入血流中的量也會稍有不同。 d.除處理因子外的所有好部因子對響應變數（血液水平）的影響。假定老鼠被放在籠子裡，且在測定血液中藥物含量之前給以等量的食物和水。然而，籠子的溫度、溼度、外部刺激及其他條件可能有些不同，這都會對老鼠的響應產生影響。

14.4 控制試驗誤差•929• 這樣，在試驗期間實驗室內外部條件的這些差別與變異都會對試驗中試驗誤差的大小有所貢獻。為了檢驗研究假設和建立有關處理總體均值函式的信區間，我們需要對試驗誤差方差進行估計。我們將在後續的章節中詳細說明獲得這種估計所用的方法，其中試驗的設計，處理的設計及重複次數都影響到這一方差估計。在大多數基本試驗中，我們只有一個具有！水平的因子，而且試驗單元和測量單元是完全一致的，此時試驗誤差方差的估計是由來自獲得相同處理的試驗單元之響應的方差匯、總而成的。在老鼠血液中藥物水平的試驗研究中，我們把老鼠隨機地分配給四種處理，每種處理十隻老鼠。透過計算每一劑量水平上十個血液藥物水平響應的方差，再把四個單獨的方差估計進行彙總，得到試驗誤差方差的一個估計。例14.4 回到例14.1，假定每一處理被分配給2個容器，且每個容器中放入40只蝦。 6周以後，每隻蝦都稱重。確定試驗單元、測量單元、因子、處理、重複觀測數及可能的試驗誤差來源。解答這是一個因子處理設計，有兩個因子，即是溫度和鹽分。分配給容器的處理由一個溫度水平和一個鹽分水平組合而成。試驗中我們一共有（3）（4）=12 種可能的處理。這12 種處理如下：（25°，10%）（25°，20%）（25°，30%）（25°，40%）（30°，10%）（30°，20%）（30°，30%）（30°，40%）（35°，10%）（35°，20%）（35,30%）（35°，40%）我們然後隨機地把12種處理中的每一種分配給2個容器，這導致每一處理有兩次重複，試驗單元是容器，因為處理是被隨機地分配給單個容器的。40只蝦被放養在一個容器中，6周以後，記錄下每隻蝦的重量。測量單元是單個的蝦，因為它是被測量的物理實體。由此，在該試驗中，試驗單元和測量單元是不同的。幾個可能的誤差來源是，放入容器之前蝦重量間的差異；在6周的試驗期間溫度和鹽分水平維持的準確性；在試驗結束時，稱量個蝦重量的精度；喂蝦的食物過的一致忙（6週期間每隻蝦都給以完全等量的食物了嗎？）及可能影響蝦生長的其他條件的差異。 14.4 控制試驗誤差正如我們在例14.3和例14.4中看到的那樣，試驗中有許多潛在的試驗誤差

• 930• 第十四章試驗和研究的設計概念來源，當試驗誤差的方差較大時，我們推斷的精確性將大打折扣，處理均值的估計將有較大的標準差，這將導致不精確（或較寬）的置信區間，同時也使得假設檢驗犯第I類錯誤的機率較大。因而，能被用於減小試驗誤差的任何技巧都將大大改進試驗，提高推斷的精度。研究人員能夠控制許多種潛在的試驗誤差來源，這些誤差來源包括：（1）進行試驗的程式方法；（2）試驗單元和測量單元的選擇；（3）進行測量和記錄所遵循的方法；（4）試驗單元的區組劃分；（5）試驗設計的型別；（6）協變數的使用。下面我們來討論每一誤差來源是怎麼影響試驗誤差的，研究人員如何使得這些誤差來源對試驗誤差方差大小的影響達到最小。試驗方法如果進行試驗所必需的各程式步驟沒有被仔細、精確地完成，結果會造成響應變數方差的增加。這兒不僅涉及到實施試驗和測量響應變數的工作人員，也包括他們在工作中所使用的裝置。全體工作人員必須在構造處理和進行試驗方面得到良好的培訓。他們的表現對試驗的成功與否有直接的關係，這一點應予強調。研究人員應該在預算的範國內儘可能為技術人員提供能夠得到最精確測量的裝置。在整個試驗過程中，對裝置頻繁、定期地進行維護和校準至關重要。整個試驗期間必須儘可能保持試驗的條件不變。否則，響應同的差異可能是因為試驗條件的變化而不是處理間的差異造成的。當試驗方案的質量不是很高時，響應變數的方差可能會膨脹。進行測量時所用的方法不恰當，儀器的刻度不準確或實驗室內的條件未受控制，可能會導致出現不能真實反映處理對響應變數效應的極端觀察值。極端觀察值也可能因實驗技術人員或資料管理人員的記錄誤差而產生。不管哪種情況，研究人員必須圍繞極端觀察值進行調查，然後決定是否從分析中刪去該觀察值。如果要刪除這樣的值，那麼在最終報告的附錄部分應給出為何不包括該資料的說明。當在整個研究過程中，試驗方案沒有被一致地執行時，會造成兩個可能的後果。一個是響應變數方差的膨脹，另一個是處理均值的估計偏差。例如，假定我們測量注射了四種可能的藥物劑量之一的老鼠體內血液藥物的含量。用於測量藥物注射準確數量的儀器工作不正常。對給定的藥物劑，給第一隻老鼠注射的藥量少於規定的劑量，而給最後一隻老鼠注射的葯量超過規定的劑量。這樣，當血液中藥物的總量被測定後，這些測量值的方差將有所增加，但是處理均值的估計可能是無偏的，因為超甘和不足量也許會相互抵消。另一方面，如果規定得到最低劑量水平的所有老鼠都被注射了過多的藥物，而規定得到最高劑量水平的所有老鼠都未注射足夠的藥物，那麼處理均值的估計將是有偏的。對於低劑量組處理的均值可能估計過高，而高劑量組處理的均值會被估計過低。因此，保證對於所有的試驗單

14.4 控制試驗誤差•931 元試驗方案執行的一致性，對於試驗的成敗是至關重要的。對於實驗室研究或現場研究，保證環境條件的一致性同樣重要。外部因素如溫度、溼度、光照量、暴露於空氣中的汙染物及其他未被控制的因素，如果沒有一致地運用於試驗單元，則會導致研究中方差的膨脹和處理均值估計的偏差。選擇試驗單元和測量單元如果試驗中所用的試驗單元在那些可能影響響應變數的特徵方面不相似，則試驗誤養方差會增加。研究的一個目標是判定獲得不同處理的試驗單元的平均響應是否存在差異。研究人員必須確定所關心的試驗單元總體。試驗單元隨機地從該總體中抽出，然後被隨機地分配給處理，這當然是一種理想的狀態。實際上，研究人員由於出於費用，可用性及道德方面的考慮，他對試驗單元所能作的選擇是受到限制的。然此，從這些試驗資料可能得出的推斷也只能是有限的。如果我們考察潛在的試驗單元的群體，特徵更接近的單元會產生更精確的處理均值的比較。然而，如果試驗單元過分一致，那麼能被作出適當推斷的總體將受到很大的限制。試考慮下面的例子。例 14.5 經營兒童用品的一項營銷活動要利用電視廣告作為其主要的營銷策略。一寮市場調查公司受僱來確定孩子們對廣告的關注時間的長度是否因廣告中的產品類型的不同而有所差異。該調查公司決定考察四類產品：體育器械，健康小食品，鞋和光碟遊戲。該公司從一所紐約市的公立學校抽取了100名四年級的學生參與調查。每25名學生被隨機地分配去看四種產品中的一種商業廣告，記錄下這100個孩子對廣告的關注時間。市場調查公司認為從同樣的學校體制及同一年級水平抽取參與者，所得到的研究物件組具有一致性。這一抽樣方法存在什麼問題？解答市場調查公司認為從同一年級水平和同樣的學校選擇學生，比更一般的抽樣方法更能得到一致的試驗單元集，這一點或許是正確的。然而，這一方法嚴重地限制了從該研究所能做出的推斷：調查的結果可能僅適用於居住在非常大的城市中的四年級學生。包括其他年級和來自較小城市的孩子的抽樣方法可能會提供更為實用的研究結果。透過區組劃分來減小試驗誤差方差當我們認為可以利用的試驗單元間在重要特徵方面有較大差異時，利用區組劃分來減小試驗誤差的方差被證明是非常有效的。根據它們在可能影響響應變數的特徵上的相似性把試驗單元分到各組，這樣做不僅使得各試驗單元的集合或區

• 932• 第十章試驗和研究的設計概念組內部的各單元是相似的，而且當考慮所有的單元時，又不乏對重要特徵的廣泛包涵。分別在每•區組內隨機地分配處理，然後在由相似的試驗單元樹成的組內進行處理的比較，由此得到的處理的比較不會因原先試驗單元集間存在很大差異而被掩蓋。區組設計使得我們能夠把與用來劃分割槽組的特徵相聯絡的變異從試驗誤差中分離出來。存許多準則可以用來對試驗單元進行區組劃分。包括下面幾種： 1.根據研究物件的物理特徵，如年齡，體重，性別，健康狀況，受教育程度等。 2. 密切相關的單元，如雙胞胎或同一窩動物。 3. 試驗單元的空間位置，如相鄰的地塊或同一試驗檯上植物的位置等。 4.進行試驗的時間，如一週中的每一天，因為環境條件可能天天在變。 5. 做試驗的人，因為如果幾個操作人員或技術人員進行試驗，他們之間在如何進行測量或處理試驗單元方面可能會有些差別。在所有這些例子中，我們試圖在每一區組中觀察所有的處理。例如，如果我們研究三條裝配線每一條上生產出有重大缺陷的汽車的數量，可能要用每週的工作日作為區組變數，並一定在每週的所有5個工作日中比較每一條裝配線。利用協變數來減少變異性協變數是指與響應變數有關的變數。我們利用試驗單元的物理特徵來產生區組。例如，在比較一個新食譜和對照食譜對減少狗的體重的效果的研究中，假定被用來做研究的狗的年齡在1歲到12歲之間。我們可以把狗分成三個區組：B1-3 歲以下的，B2-3歲到8歲的，B一8歲以上的。一個更精確的方法是記錄狗的年齡，然後在比較食譜的效果時把它結合到模型中去。在比較新食譜和對照食譜之前，根據狗的年齡對響應變數進行調整，這樣我們會得到一個更精確的比較。不像在區組中那樣使用年齡段，我們在這兒使用狗的確切的年齡，這就減小了試驗誤差的方差。在一項試驗中，選用哪些變數作為協變數取決於該試驗本身。協變數應與響應變數有聯絡，它必須可以測量，且不受處理的影響。在大多數情況下，協變數在處理分配給試驗單元之前就任試驗單元上測量好了。協變數的例子有土壤的肥力、原料中的雜質含量、試驗單元的重量、學生SAT（教育性向測驗）的得分、研究物件的膽固醇含量、田間害蟲的密度。下例將舉例說明協變數的運用。例 14.6 在該研究中，我們將把補充光照（SL.）和部分遮蔽（PS）對大豆產量的影響與正常光照（NL）作比較。正常光照將作為對照。每類光照都隨機地被指定給15棵大豆植株，這些大豆被種植在溫室裡。當組織試驗時，研究人員認識到這些植物的大

14.4 控制試驗誤差 • 933• 小和成熟程度有差別。因此，在試驗開始時，測量出每個植株的高度這個植物活力的可測特徵，並把它作為協變數。這就使得研究人員可以根據植株起初的大小來調整單株大豆的產量。對每一植株，我們記錄兩個量（x，y），其中x是試驗開始時植株的高度，»是試驗結束時大豆的產量。為了確定協變是否對響應變數有影響，我們畫出了關於這兩個變數的圖以認識他們間可能的聯絡。如果二者之間不存在任何聯絡，那麼在分析中就不必使用協變數。如果兩個變甘有關聯，那麼必須在比較三種處理的均值之前用協方差分析的方法對響應變數作出適當的調整。初步評價關聯存在性的方法，對每一處理分別用不同記號面出響應變數對協變量的圖。對於大豆資料，這種圖如圖 14.1所示。 174 16一內素中 15+ 141 13 12十 11+ 10+ 8+！----- 30 --十40 50 圖 14.1 植株高魔對產量的圖；§表示SL C表示 NL,P表示 PS 從圖14.1我們看出，協變數即起初的植株高度和響應變數即產量之間表現出增函式的關係；而且，三種處理的產量看起來也不相同；響應變數間的一些變異既與植株起初的高度有關又與植物獲得的光照有關。這樣，我們在檢驗三種處理平均產量間的差別之前，必須確定跟高度有關的方差的量。我們可以利用方差分析的方法達到這一目的。協方差分析的方法將在第十六章詳細討論。

• 934• 第十四章試驗和研究的設計概念 14.5 試驗單元對處理的隨機化與前面章節中的討論一樣，統計的方法基十這樣的條件，即從試驗中得的資料等同於從正態分佈的響應總體中抽取的隨機樣本。當試驗是從已經確立的處理總體中隨機地抽取試驗單元時，我們實際上可以驗證這一條件是否有效。然而，在那些其中我們要選取試驗單元以滿足特定的準則，或者試驗單元是研究用農場中可利用的小塊地的試驗中，響應值構成來自某個總體的隨機樣本的想法是值得疑何的。當我們隨機地把處理分配給試驗單元，然後觀察響應變數時，要求這些觀察值是獨立的。本書用來估計引數，建立置信區間和進行假設檢驗的統計理論都基於觀察互相獨立這一條件。在更高等的書中，可以看到處理相依資料如時間序列數據或空間相關資料的方法。為了確信得到有效的結果，我們必須保證觀察值是獨立的。如果試驗單元之間存在物理上的關係，那麼這些觀察值就會不獨立。考慮下面的例子。例14.7 假定我們要比較四種根激素（SL,S2,S3,S4）對雲杉樹苗生根密度的影響。32 棵雲杉樹苗被栽種在盆中，這些盆如圖14.2所示的那樣被放在溫室中的試驗檯上。在溫室試驗中，如果溫室中的溫度稍有不同或光照量有些變化，那麼互相靠近的植物可能比互相遠離的植物更能表現出相似的啊應。這樣的響應是正相關的。在其他的背景中，我們可能得到相反的結果，即互相臨近的試驗單元由於對資源的競爭，它們的響應傾向於胡向偏離總均值的兩個相反方向。例如，如果動物從同一個容器裡進食，那它們將會為獲得食物而爭搶。如果一些動物吃的比他們應得的 I SS S:S2 SSSSi I SiSSiS Si SSS 皿 SsSSs Sa SaSgSsSs I SASSSa SS.SS. 圖 14.2 試驗檯上的盆的排放

14.5 試驗單元對處理的隨機化 •935• 份額多，那它們長得較快，而其餘的動物則傾問於較小。為了以最有效的方式進行試驗，技術人員分配激素如下：將激素 S，施給位於第1象限的八棵樹苗；將激素 S2施給位於第I象限的八棵樹苗；將激素 S，施給位於第象限的八棵樹苗；將激素 S4施給位於第I象限的八棵樹苗。假定空調吹遍整個溫室，並且臺子上不同處的溫度有些差別。具體地說，I象限中的盆得到稍涼的空氣，阻象限的盆得到稍暖的空氣。在起初設計試驗時，這些差別是不可識別的。這樣，在此種安排之下，獲得激素S！的植物與獲得其他激素的那些植物相比，可能處於競爭劣勢，因為他們在相對較低的溫度下生長。試驗單元物理上的接近或技術人員做試驗的次序會使得來自這些試驗單元的響應相關。為了避免這類情況的發生，我們需要隨機地把處理分配給試驗單元。隨機分配為資料是獨立的觀察值這一模型條件提供了依據。然而，處理對試驗單元的隨機分配並不完全消除資料值相依的問題，資料之同的相關性也會來源於試驗期間出現的其他情況。因此，試驗人員始終必須要清楚任何能進入試驗環境且導致來自某些試驗單元的響應對其他試驗單元的響應有影響的物理機制。假定我們有N個齊性的試驗單元和：個處理，我們想把r：個試驗單元隨機地分配給第；個處理，此處，rtr2+•+r，=N。該隨機分配包括下面幾個步驟： 1.對試驗單元從1到 N編號； 2.用隨機數表或計算機軟體程式設計以得到1~N這N個數的一個隨機排列； 3. 把1號處理分給隨機數列中前r；個數對應的試驗單元，把2號處理分給隨機數列中接下來的r2個數對應的試驗單元。依此類推，直至把：號處理分給隨機數列中最後：個數對應的試驗單元。我們將在下面舉例說明這一方法的實施。例 14.8 假定我們考察例14.7中描述的研究，其中我們想要比較四種根激素（SJ,S2， Sa, S4）對雲杉樹苗生根密度的影響。可用於研究的樹苗有32棵，而且每類激素被施給8棵樹苗。按照上面概拮的步驟，我們對32棵樹苗從1到32編號。其次，我們得到數1到32的一個隨機排列。利用軟體包，我們得到下面一組這樣的隨機排列數。 31 21 4728 31 24 17 15 13 29922 20 27 25 12 14 518 26 8 30 23 32 11 19 16 610 2 這樣我們就得到下面所示的樹苗對激素的安排：

•936• 第十四章試驗和研究的設計概念樹苗 31 21 4 激棄 S Si Si 樹苗 25 12 14 激素 S， Ss Sis S， 5 Sg 28 Si 18 3 Si 26 24 17 15 13 29 9 22 20 27 S.SL S,S,S2S, S: S S2 830 23 32 11 19 16 610 2 Ss Sa Ss Ss S,SaSSSSaS S 圖14.3顯示了試驗檯上激素對樹苗的安排。編號為1到8的樹苗在試驗檯的第1象限，編號為9到16的樹苗在試驗檯的第I象限，編號為17到24 的樹苗任試驗檯的第象限，編號為25到32的樹苗在試驗檯的第N象限。 I SSaSaS S SSSa I SS.SS SsSSiSs 皿 Sz Ss Sa Sz SSSS， I Ss SsSzS SSSiSa 圖14.3 試驗檯上處理的隨機安排假定32個盆的這種佈置是放在四張不同的臺子上，而不是簡單地放在同一張臺子的四個不同部位。臺與臺之間離得相當遠，研究人員看出四張臺子所處的溫度和光照條件不同。她考察瞭如圖14.3中的安排，並注意到1號桌子上的8棵樹苗中，有4棵被隨機地分配激素1。如果1號臺所處的條件非常有利於根的生長，那麼這將使得試驗產生偏差。另一個可以換用的給處理分配試驗單元的方法稱為隨機化完全區組設計。在這種設計中，試驗單元不是齊性的。研究人員首先必須檢查試驗單元，然後把它們放入各組，使得同一組內的試驗單元比不同組中的試驗單元要相似些。如果每一組中有足夠多的試驗單元，處理將在每一組範圍內隨機化。這種分配方法與在每一組內分別進行完全隨機化設計相一致。這種把處理分配給試驗單元的方法，其步驟如下。假定我們有！個處理和N 個試驗單元。進一步恨定試驗單元可以分成6組，每組含有！個試驗單元。這要求試驗單元的個數N滿足N=。隨機化完全區組設計的隨機化步驟： 1.把試驗單元分成6組，每組含：個齊性的試驗單元。

14.5 試驗單元對處理的隨機化 •937• 2. 在第1組中，對試驗單元從1到：編號。 3. 使用隨機數表或計算機軟體獲得數1到：的一個隨機排列。 4.在第1組中，相應於隨機排列中第一個數字的試驗單元獲得處理1，相應下隨機排列中第二個數字的試驗單元獲得處理2，依此類推。 5.對餘下的各組（區組）重複2~4步的內容。在以上的隨機化完全區組設計中，每個區組只有每一處理的一次重複。我們可以把它推廣到每個區組中每一處理有，次重複的情況。上述隨機化步驟稍作修正同樣適用於具有：個處理，B個區組，次重複的推廣了的隨機化完全區組設計。這些試驗單元將被分成6組，每組含有r個齊性的試驗單元。（注意 N=brt）推廣的隨機完全區組設計的隨機化步驟： 1.把試驗單元分成8組，每組含r個齊性的試驗單元。 2. 在第1組中，對試驗單元從1到rt編號。 3.使用隨機數表或計算機軟體獲得數1到rt的一個隨機排列。 4. 在第1組中，相應於隨機排列中前，個數字的試驗單元獲得處理1，相應於隨機排列中接下來的，個數字的試驗單元獲得處理2。如此繼續試驗單元對處理的分配，直到處理t獲得，個試驗單元為止。 5.對餘下的試驗單元組重複2~4步的內容。我們用下面的例子說明這一步驟。例 14.9 假定四張試驗檯在所處溫度和陽光下的暴露量方面有相當大的差別。栽有樹苗的32個盆中每8個盆被放在一個臺上。我們面臨的情況是，同一臺上的兩盆樹苗所處的條件比不同臺上的兩盆樹苗所處的條件更一致。這樣，我們要進行一個隨機化完全區組設計，其中4 種激素中每一種都被隨機地分配給每一臺子上的其中兩盆。注意這樣我們就有一個 N=32，6=4，r=2的推廣的隨機化完全區組設計。解答 1.32 個盆中每8盆被隨機地放到一個臺上。 2. 對每一臺上的8個盆從1~8編號。 3. 我們得到如下數字1~8 的一個隨機排列：6.7,1, 4,3,8, 5,2。 4. 1號臺上的編號為6和7的盆被分以S1,1號和4號被分以Sz,3號租8 號被分以 S3,5 號和2號被分以S4。 5. 1號合的隨機排列為：1,8,2.5,4,3,7,6；

•938•

第十七章 第十八章

第十七章第十八章