AI 新聞與投資

b.構造檢驗處理效應的方差分析表。對你的檢驗給定一個顯著性水平，並給出你的結論。 19.2 參見例19.1。用最小顯著差異準則，找出哪些處理與其他處理不同，取a=0.05。 19.3 參見例15.1。假定第一個區組（地塊1）中的第一個觀察值缺失。通過估計這個缺失的觀察值進行資料分析，然後取=0.05作方差分析。 19.4參見練習19.3。透過擬合完全模型和簡略模型進行相應的分析，並把你的結論與在練習 19.3中得出的結論相比較。 19.5 參見練習 19.1。擬合筒略模型 yy + ai + ej，以得到SSEz。平方和的下降是對處理效應調整後的區組平方和。驗證透過這個方法計算得到的 SSBwdt 與練習19.1 的計算機輸出結果中第三個模型的平方和列中給出的值一樣。 19.6 參見練習15.3中的資料。假定在火箭推進劑的試驗中，3號實驗員在分析混合物2時，一臺裝置發生了故障。他們沒有返回到實驗室去準備再做一次，而是繼續其餘的試驗，得到推進劑的推力資料。 a. 估計這個缺失值。 b. 用a=0.05作方差分析。 19.7 參見練習19.6。 8.用完全模型和簡略模型進行方差分析，並把你的結果與練習19.6 中所得結果進行比較。 b.如果混合物4和實驗員1處的響應值也缺失，你將如何分析這些資料？ 19.3 有缺失資料的拉丁方設計回想：×1拉丁方設計可以用來在濾除另外兩個變異來源（行和列）的同時，比較：個處理均值。這些處理被隨機地分配，使得每個處理在每一行和每一列內都出現。在這一節中，我們來說明在只有一個缺失觀察值的情況下拉丁方試驗的方差分析方法。對於更復雜的設計，我們將使用擬合帶有缺失觀測值的完全模型和簡略模型的一般方法，就像 19.2節對隨機化區組設計所談到的那樣。在拉丁方設計中，估計單個缺失值的公式為 M-L（Y：+Y1+2）-23：（1-1）01-2）其中3-3.和以分別表示對應於確實觀測值的行、列和處理總和，y•為試驗中所有觀測值的總和，！為拉丁方設計中的處理個數。總平方和、行平方和、列平方和、處理平方和以及誤差平方和分別用第十五章中完全的拉丁方設計中的公式計算，其中把缺失的觀測值用其估計 Aif 代替。處

19.3 有缺失資料的拉丁方設計•1177• 理的均方為平衡拉丁方設計中處理的期望均方的有偏估計。這個偏差由（t-1）（t~2）估計。校正處理平方和由 SSTc=SST-Bias 給出。MSTc=SSTc/（t-1）為 2+t0，的無偏估計。令n=：2—1為該拉丁方設計中觀測到的資料值的個數，我們得到如下當缺失的那個資料用M估計時拉丁方設計的方差分析表。表19.5 有一個缺失僅的拉丁方設計的AOV 表米源行列處理誤差總和 SS SSR SSC SSTc SSE TSS df -1 1-1 1-1 1-3t+2 1-1 MS MSR MSC MSTc MSF. F MST/M$E 例 19.2 一家公司為了挑選投放於一項大規模消費老接受性調查中的長簡襪子，考慮了很多種不同型別的尼龍襪子的性質（如強度，伸縮性等等）。有五種襪子（A,B,C,D稱E）透過了基本的篩選，進入下一輪更嚴格的檢驗。作為這個檢驗的一部分，從每種襪子中挑選5個樣品，5個測試人員分別在§天中測試5種襪子，以比較這些襪子的伸縮性，測試時所用的拉力相同。分配測試樣品時按一個拉丁方的隨機分配進行。拉伸資料（cm）在表19.6中給出。測試員 1 2 3 4 5 1 B 22.1 C 23.5 D 17.4 A 20.3 E 25.7 衰19.6 例19.2中的拉伸資料時間 2 A 18.6 D 16.5 E 23.8 B 23.4 C 24.8 3 C 23.0 A 18.7 B 22.8 E 25.9 D 18.9 4 F 24.3 B 22.0 C 23.9 D 18.7 A 20.6 5 D 17.1 E M A 20.0 C 24.2 B 24.6

• 1178• 第十九章一些非平衡設計的方差分析注總，第2號測試人員E類襪子的觀測值丟失了，同時試驗中也沒有為得到該值重新去做試驗。用這節中的方法估計這個缺失的值。解答對於例中的資料，對應了缺失觀測值的處理、行和列的總和 ¥5=99.70 32.=80.70 Y-5=85.90 y-=520.80 M- 5（80.70+85.90+99-70）-2（$20.80）（5-1）（5-2） = 24.1583 下面我們把缺失觀測信用其最小二乘估計 A 代替，用第十五章的公式計算平方和。測試員時間型別 31.=21.020 Y:1=21.800 V1=19.640 總種 y.=21.79833 Y2.=20.97166 y.2=21.420 32 =22.980 33.=21.580 ¥•3=21.860 33=23.880 Y4.=22.500 3-4=21.900 y4=17.720 y5. =22.920 3.s=22.01166 ys=24.77166 TSS= （22.1-21.79833）2+ （18.6-21.79833） +⋯+ （24.6-21.79833）2 =197.20 SSR =5|（21.020-21.79833） + （20.97166-21.79833）2+⋯+ （22.920 -21.79833）21=15.44 SSC=51（21.8-21.79833）2+ （21.42 -21.79833）2+⋯+ （22.01166 -21.79833）」=1.01 SST=51（19.64-21.79833） +（22.98-21.79833）+ ⋯+（24.77166 -21.79833）2｝ =179.31 SSE=197.20 15.44~1.01-179.31=1.44 Bias= （520.30-80.79-8229-（5-1）90.70|］2 （5-1）（5-2） =13.82 校正的處理=SSTc=179.31-13.82=165.49 這項研究的方差分析表如下。來源測試員時間種類誒差總和 S5 15.44 1.01 165.49 1.44 197.20 df 4 4 4 11 23 MS 3.86 0.25 41.37 0.13 F 316.04

19.3 有缺失資料的拉丁方設計•1179• 當處理效應顯著時，我們可以用下面的公式做兩兩比較。有缺失觀察值的處理與任何其他處理之間的最小顯著差異為對於任何兩個沒有缺失值的處理，最小顯著差異如前，即 /2MSE I.SD=1a/2/ t MSE.的值從方差分析表中得到。對於有多個缺失值的拉丁方設計，用擬合完全模型和簡略模型的方法來調整由丁缺失資料而造成的非平衡設計中的處理平方和更容易些。完全模型如下：模型1:yi= +ak+B;tY;tEi 其中y；為第；行第；列處理上的觀察值。不用估計缺失值，用觀測資料擬合這個模型，我們得到誤差平方和，記之為 SSEI。然後，不用估計缺失值，我們用觀測資料擬合沒有處理效應的簡略模型模型2:3= +B+Y；+E0 又得到一個誤差平方和，記之為SSE2。這兩個誤差平方和的差就是處理的校正平方和： SSTc=SSE2 -SSE，對於處理效應的檢驗為表19.6中給出的F檢驗 F= SSTe/（-1） SSE:/（n -3t +2）其中n為觀測到的資料個數。我們可以用類似的方法得到行和列的校正平方和。透過擬合包含處理效應和行效應，但不包含列效應的簡略模型，我們可以得到用來構造調整後的列平方和的誤差平方和。同樣，我們也可以得到調整後的行平方和。在多數情況下，對列效應和行效應的顯著性檢驗是不感興趣的。練習基本技能 19.8 參見例19.2和下面給出的處理平方和和誤差平方和計算的計算機輸出結果。比較計算機輸出的結果與用估計的缺失值算出的結果。

•1180• 第十九章一些非平衡設計的方差分析 General Linear Hodels Procedure: FULL NODEL FOR EXANPIE 19.2 Dependent Variable: ELONG Source Model Error Corrected Total DF 12 11 23 Sum of Squares 189.95693333 1.44316567 191.400000000 Source INVEST DAY VERSION DE 4 4 4 Type I ss 22.32850000 2.13400000 165.49433333 Source INVEST DAY VERSION DF 4 4 4 Type III SS 14.36883333 0.94283333 165.49433333 General Linear Hodels Procedure: REDUCED HODEL WITHOUT TREATNRENT Dependent Var Lable: BL ONG Source Nodel Error Corrected Total DF 8 15 23 Sum of Squares 24.46250000 166.93750000 191.40000000 Source INVEST DAY DF 4 Type IsS 22.32850000 2..13400000 Source INVEST DAY DE 4 4 TVpe III sS 23.49000000 2.13400000 F Value 120.66 Pr≥F 0.0001 F Valwe 42.55 4.07 315.35 F Value 27.38 1.80 315.35 Pr>F 0.0001 0.0291 0.0001 'Fr≥E 0.0001 0.1998 0.0001 F Value 0.27 FT≥E 0.9646 F Value 0.50 0.05 F Value 0.53 0.05 PT>F 0.7352 0.9952 Pr>F 0.7172 0.9952 19.9 參見練習 19.8。 a.檢各種長簡襪子的平均伸縮性之間的差異否顯著。 b.用最小顯著差異準則確定哪兩種型別的襪子之間有顯著差異。

19.4 平衡不完全區組（BIB）設計•1181• 應用 19.10（環境）—石油公司要比較四種不同品牌（III, I1L,IV）的汽油每加侖所能行駛的英里數。考慮到由於司機和車型的不同，所能行駛的里程會有很大的差異，在下面的拉丁方設計中，這兩種外部變異來源被用做“區組“變數。按照一個拉丁方設計，每個司機用指定品牌的汽油，在標準的跑道上駕駛每一種型號的汽車。然而，當3號司機用11型汽油駕駛第4種型號的疙車時，汽車的化油器發生「故障。這種故障直到研究完成後才被發現，因而無法得到替代的資料。每加侖的英里數如下。司機車型 1 2 3 4 1 IV 15.5 I1 16.3 I1 10.8 I 14.7 2 11 33.9 11 26.6 1 31.1 IV34.0 3 EE 13.2 1 19.4 I 17.1 "1 19.7 4 1 29.1 ™V 22.8 EE III 21.6 a. 估計缺失值，做方差分析，取a=0.05。 b.取a=0.05，用 Fisher的最小顯著差異方法進行處理之間的比較。 19.11 對於練習19.10中的資料，用擬合完全模型和簡略模型的方法進行方差分析。 19.4 平衡不完全區組（BIB）設計本章中到目前為止所討論的設計中的不平衡，都是由於在試驗或資料處理過程中發生了某些事件，從而引起了不可預見的情形而造成的。然而，有時為了實現做試驗的目的，我們不得不犧牲一定的平衡而設計一個試驗。這經常發生在每個區組上的試驗單元個數少於所考慮的處理的個數的情形。考慮下面的例子。例 19.3 一家化學公司的質量控制實驗室需要評定一種塗料的5種不同的形式（A, B， C, D,E）所產生的顏色是否一致。按慣例每種形式取4 個樣品。實驗室有5名技術員來做這項試驗，每個技術員每天最多可以評估4個樣品。因此，不可能進行隨機化完全區組試驗，因為不可能所有形式都被每一位技術員評估。然而，在設計上有可能達到一種部分平衡，即每兩種形式的塗料有相同個數的技術員來評估。表 19.7中給出這樣的一個設計。

• 1182、第十九章：••些非平衡設計的方差分析表19.7 指定塗料給質量控制技術員形式技術員 1 2 3 4 5 D F A c B A C E B 注意，每對形式的塗料由二個技術員來評定。 A A D B E E D B A c 任何隨機化風組設計，如果要考察的處理的個數：比每個區組內可用的試驗單元的個數來得大，就稱之為不完全區組設計。比如說，當有若干含有k（＜t）個試驗單元的大小一致的區組存任或者可以構造出來時，不完全的區組設計就是不可避免的。然而，在一個設計中，有可能達到部分平衡。這樣的不完全區組設計之一定義如下。定義 19.1一個平衡不完全區組（BIB, balancedl incomplete block design）設計中有：個處理，分配到b個區組，滿足如下條件： 1. 每個區組含有（<t）個試驗單元； 2. 每個處理在每個區組中最多出現一次； 3.每個區組包含丸個處理； 4. 每個處理恰好在，個區組中出現； 5.每對處理一起在入個區組中出現。從定義19.1，我們可以得出，一-個設計之為BIB設計，必有 •在一個區組中，每一對處理一起出現的次數相同。 •每個處理被觀測，次。 • 觀測值的個數n必然滿足n= =。 •2=r（R-1/（-1）必為整數。例 19.4 參見例19.3。我們有B=5個區組（技術員）和1=5個處理（形式）。每個區組有天=4個處理，從而k=4＜5=t，這導致不完全區組設計，其中每種形式出現在r=4個區組中。為使該設計是一個 BIB 設計，需要每對形式都由A=r（k1）/（t-1）=4（4-1）/（5-1）=3個技術員來評估。考察表19.7中把各種形式分

19.4 平衡不完全區組（BIB）設計 • 1183• 配給技術員的方案，我們看到每對形式由3個技術員來評估。因此，表19.7中給出的設計為BIB設計。在許多情況下，我們設讓一個試驗時不能完全按照理想來進行，因為並非對所有1，k，b，值的組合都存在BIB 設計。例如，假定我們要考察：=6個處理，並月有6=4個區組，每個區組包含 =3個試驗單元，這樣，每個處理可以被觀測，= 2次。然而，要使設計是一個BIB設計，A=r（-1）/（—1）應為鱉數。但事實上，A=2（3-1）/（6-1）=4/5，顯然不是整數。因而，對於這組處理和區組，我們不能構造出 BIB 設計。BIB 設計有一套方法，同時也有更復雜的不完全區組設計。 Cochran and Cox （1957），Lentner and Bishop （1993）和 Kuehl （1999）的書中有 BIB 設計的表格以及構造這些設計的方法。有些統計軟體（如 SAS 和 Minitab）對於給定的t，R，B種，值可以構造出 BIB設計。一個平衡不完全設計的方差分析，可以透過針對該設計提出的公式進行，也可以像非平衡設計那樣，用擬合完全模型和簡略模型的方法進行。對於表19.8中的方差分析表，我們將給出其簡單的計算公式。表19.8 一個平衡不完全區組設計的方差分析表來源區組處理誤差總和 SS SSB SSTed SSE TSS df 6-1 1-1 MS 一 MSTad MSE F MSTad/MSE 7-1 BIB 設計的模型如下： Yin - H+ai+B+Eis i=1,t;j=1,6;8=1 其中當第；個處理在第；個區組中出現時，nuj =1，否則等於0。出現在模型中的項x為總均值，Q：為第；個處理的效應，B為第；個區組效應，Ei相互獨立並且服從均值為0，方差為品的正態分佈。與前面一樣，從這個模型中，我們按照下面的公式計算出SSB（相對於處理進行了調整的區組平方和）以及總平方和：其中 =r=碗為實際資料值的個數， SSB-≥0-5.）2 其中了.為第；個區組中觀測值的平方和，3..為總平均。然後，我們定義 y= 第；個處理上所有觀測值的和

•1184• 第十九章 .些非平衡設計的方差分析 B（）=包含第；個處理的各個區組上所有觀測值的和相對於區組調整後的處理平方和為 SSTad； = t-1 誤差平方和為 SSE = TSS - SSB- SSTadi 如方差分析表中所示，對於“各個處理的均值沒有差異”的假設，檢驗統計量為 MSTod=MSE。例 19.5 -深大公司在某個地區選取了一個由12 名潛在消費者組成的隨機樣本，以在他們的幫助下比較8種試驗枕頭和一種已經投放市場的枕頭的特徵（例如堅實性和彈性）。從以前的研究中該公司知道，在一段給定的時間內，多數人可以利用其注意力集中的時間評估3個枕頭，因而，公司決定使用表19.9中給出的設計。區組（消費者） 1 2 3 4 5 6 7 8 9 10 11 12 總和 A D G A B C A B C A B C 59 85 74 63 26 31 62 23 49 $2 18 42 表19.9例19.5中的舒適得分處理｛枕頭） B E H D E F E F D F D E 26 92 $2 70 C F I G 98 60 I 85 73 74 76 79 H H I 84 區組總和區組均值 38 69 27 $9 35 30 75 51 43 Ib 81 123 246 153 201 183 126 177 171 174 171 138 207 2 070 41 82 51 67 61 42 59 57 58 57 46 69 $7.s 首先為各種枕頭隨機地指定一個從A到1的字母，然後準備一些臺子，把3種不同種類的枕頭按照表19.9中的安排放到每個臺子上。所有枕頭都用相同的白色枕套封起來，從外表顏色上相互之間沒有區別。枕套上的惟一標記是一個四位

19.4 平衡不完全區組（BIB）設計•1185• 數字的號碼，作為研究人員辨別這些枕頭的標識。所有這些準備停當以後，把12 名潛在的消費者隨機地指定到一個臺子，以比較該臺子上的3種枕頭。這些消費者按舒適程度為每種枕頭打一個分，分值從1到100（分值越高表示枕頭越舒適）。這些枕頭的得分記錄在表19.9中（其中字母表示枕頭型別，A代表已經投放市場的枕頭）。驗證此中使用的設計為 BIB設計。用本節中的公式進行方差分析，取a=0.05 檢驗9種枕頭的平均舒適度得分之間有尤顯著差異。解答我們需要驗證上述設計滿足 BIB設計的所有條件。我們注意到，在此設計中，有9個處理（枕頭），12 個區組（消費者），每個區組有二個觀察值（每個消費者比較3種枕頭），並且每種枕頭由4名消費者為其打分，每個消費者對每一種枕頭至多打分一次。也就是說，t=9， =12， =3， =4，由此，（9）（4）= （12）（3） = 36 下面計算入：A= （k-1）/ 1）=4（3-1）/（9-1） 1，這就說，每對枕頭的型別恰有一名消費者打分。我們可以從表19.9直接驗證這一點。因此我們得出，該研究中的設計為一個 BIB 設計。為便子使用本節中給出的公式進行分析，我們把各個總和和均值作成一個表，見表19.10。表19.10 處理 A B C D E F G H I 總和 Yi 236 93 160 308 359 278 298 205 133 表19.9中資料的總和 B（：） 672 615 630 759 813 714 732 681 594 2 070 Ryi.一Bct） 36 - 336 •150 165 264 120 162 -66 - 195 0 為了說明表19.10中各個值的來歷，我們考慮與處理A有關的各值： Y.=處理 A上所有儃的和 = 59+63+62+52 = 236 Bai=包含A的各個區組上總和的和 = 123+201 + 177+171 = 672 kyi- -B（i）=（3）236-672 =36

• 1186• 第十九章一些非平衡設計的方差分析由表19.9和表19.10中的值計算平方和，我們得到 SSTady = nk（k-1）：（k0-B（：）2- 99元1/016628）（36）（3）（3-1） = 11 727.33 類似地，用表19.9中的區組均值，我們有 SSB =k2 （i-2.）2= 3|（41-57.5）2 +…+ （69- 57.5）2 = 4575 用表19.9中的值，我們得到總平方和 TSS= 2（yi-y.） = 1（59-57.5）2+⋯+ （81 - 57.5）21 = 16 861 以及誤差平方和 SSh = TSS - SSB - SSTad- 16 861-4 575-11 727.33 = 558.67 檢驗9種枕頭的平均舒適度得分之間有無顯著差異的方差分析表由表19.11 給出。由於計算所得的F值41.98大於與df- 8,df2= 16 和 a =0.05對應的表值2.59，我們說9種枕頭的平均舒適度得分之間有顯著差異（值＜0.0001）。來源消費者處理誤差總和 SS 4 575 11 727.33 558.67 16 861 表19.11 例19.5中資料的AOV表 fP 11 8 16 MS 415.91 1 465.92 34.92 35 F 41.98 0.0001 鑑於處理均值差異的F檢驗是顯著的，我們很自然地想看一看哪些處理均值與其他均值之間有顯著的差異。為此，我們引入如下記號：以p；記處理；的均值的估計其中 .為總的樣本均。於是，處理；和處理；的均值之間的差的估計為 Mi-Ai= ［kyw-B（）］-「知込. B（i）］任何--對處理均值之間的最小顯著差異為 LSD - IonJ2AMSE 例 19.6 計算處理均值的估計，並用a=0.05給出所有處理均值對之間的差。

19.4 平衡不完全區組（BIB）設計 • 1187• 解答對於例 19.5中的BIB設計，我們有 •=57.5,t=9.1=1。因此，用表19.10中kyi一Bcn）的一列，我們以來計算估計的處理均值。處理 A B C D E F G H I 59.00 23.25 40.00 77.00 89.75 69.50 74.50 51.25 33.25 36 -336 -150 165 264 120 162 -66 - 195 61.50 20.17 40.83 75.83 86.83 70.83 75.50 50.17 35.83 注意，比較原來的處理均值可：與最小二乘均值估計Ai，可以看出，有的均值變大了，而有的均偵變小了，這與處理所在的各個區組總和的相對大小有關。由十 MSE=34.92, dfEror =16，我們得到 LSD= ta ZANSE -2.12v 12（3）（34.92）（9）（1） = 10.23 下面把這9個最小二乘均值估計按升序列出，並附以用L.SD比較各對均值差異顯著性的結果，其中在同一條線上面的兩個處理彼此之間的差異是不顯著的。 B I C 20.17 35.83 40.83 H A F G D E 50.17 61.50 70.83 75.50 75.83 86.83 另外，處理的調整後的平方和以及相應的F 檢驗的計算也可以透過擬合兩個

• 1188•

第一九章 一些非平衡設計的方差分析

第一九章一些非平衡設計的方差分析