們所要講到的新的內容是,我們可以把這兩個模型納合成一個形如 Y=Bo+BIx1+e 的模型,其中B0和B:為未知引數,:為隨機誤差,x,是一個虛擬變數,其意義如下。我們令 x1 =1 如果觀察值是從觀測站2得到的 1=0 如果觀察值是從觀測站1得到的對及觀測站1得到的觀察值,我們把z,=0代入到模型,得到 3-B+B(O)+E=B+E 因此,B=隊,即觀測站1上觀測值的總體平均。類似地,把z1=1代入到我們的模型,得到 =B0+月(1)+E=B0+31+e 由於B= 1以及8+日必等於 42,我們有B1 =M2 K1。即觀測站2與觀測站1;
•686. 第十二章多元迴歸與一般線性模型上觀測值的平均差異。 聯絡y與定性自變數“觀測站”的模型y=B+B21+e 可以擴充至定性變數有多於兩個水平的情形。我們可以使用多於一個的虛擬變數來做到這一點。考慮一個這樣的試驗,其中定量變數有四個水平。我們稱這些水平為處理。我們可以寫出模型其中 x1=1 如果是處理2,1=0其他 2=1 如果是處理3,z2=0其他 1如果是處理4, 3=0其他為了解釋這個方程中的各個8,構造一個期望值的表很方便。由於e的期望 (為0,y的期望值的一般表示式為 E0y)=80+B121+B 2+BE3 處理1上觀察值的期望值由在上式中令z1=0,x2=0,23=0得到,代入後得 E(y)=Poo處理2上觀察值的期望值由在上式中令 1=1, 2 0,23=0得到,代得到處理3和處理4上的期望值。這些期望值總結在表12.2中。 表12.2 有四個水平的試驗的期望做處理 1 Ely)=Bn 2 ECy=B+B 3 ECy=B+B 4 E(y)=風+的如果我們用p1表示處理1上的均值,p2表示處理2上的均值,等等,那麼從表 12.2 得到 MI=B0 H2=B+B H=B0+B3 MA=B+B 關於其中的8解方程,得到 Bo=HI B1=M2-隊1B2=43-從1的二44—從1 這些處理均值之間的任何比較都可以用8來表示。例如,比較 4 —#3可以寫為 Bs-B2,#3-#2可以寫為及一B1。 例 12.2 考慮一個假想的試驗,其中有四個處理(I=4),並且這四個處理上的均俏已
12.1 引言和案例•687• 知。如果 I=7,A2=9,A3=6,H4 =15,試確定模型 y=Bo+B1x1+Bzx2+Bs s+E 中Bo,81,B2 和防的值,其中 x1=1 如果是處理2,1=0其他 x2=1 如果是処理3, 2=0其他 3=1 如果是處理4,x3=0 其他解答基於我們從表12.2 中看到的,得 Bo=從1 A1=M2-隊1 把41,K2,43和p.4的已知值代入得 B=7 01=9-7=2 P2=M3-HL BS=HA- 1 B2=6-7=-1 Bs= 15-7=8 例 12.3 參見例12.2。用表示p3-#2 和p43-pA,並做8之間的減法來檢查你的答案。 解答利用8和之間的關係,我們可以看出 82-81=(p3-41)-(p2-M1)=13-42 以及 B2-Bs=(13- pi)-(H4-ML)=K3-F4 用及的值計算相應的差,得 32-81=-1-(2)=~3 和 P2-B=-1- (8)=-9 這些計算結果分別與p3-A2和p3-p4 的已知結果一致。 例 12.4 用虛擬變數為具有:個處理的試驗寫出一個模型,並識別其中的B。 解答我們可以寫出如下形式的模型其中 11=1 如果是處理2,z1=0 其他
•688• 第十二章多元迴歸與一般線性模型 2=1 如果是處理3, 2=0其他: • -1=1如果是處理1,2:-1=0其他該模型的期望值表為處理 1 E(y)=p 由此,我們得到 2 E(y)=B+ … t E(y)=+1 B= pI B1= 2- 1 … B-1= A:- MI 在上述給出的描述方法中,響應變數與定性變數“處理”相聯絡,對於處理的: 個水平,我們在模型中用虛擬變數加入了:-1個B。關於有多個定性自變數的模型,我們將在第十五和十六章中進行進一步的討論,在那裡,我們將考慮幾個不同的試驗設計的方差分析。 12.2 一般線性模型現在,重要的是我們可以看到,對於聯絡一個響應變數和一組定量自變數的多元迴歸模型以及聯絡»和一組定性自變數的模型,都可以用一個一般的模型來表示。這個模型稱為一般線性模型,具有如下形式: .對於多元迴歸模型,其中的表示定量自變數(如水的重量或體積)、自變數的冪和自變數的交叉乘積。我們已經在12.1 節中討論過幾個迴歸模型;本章後面以及