AI 新聞與投資

究一個新向題時，應定期複習本章的內容，以便記住統計推斷的基本原理。重要公式 1.對於獨立樣本，V1和y2近似正態，好=吃，#1 42 的100（1-a）%置信議間為 31- 32士balzip on n2 其中（nL-1）s｝+（n2- 1）s 『p T.S.： N1 +12-2 且df=n1+ 72-2 2. 對於獨立樣本，31和y2近似正態，好=0，K1-42 的：檢驗為 31 $2）-Do df= n1+ 72-2 SP/mI 1+1 72 3. 對於不等方差，獨立樣本，31和y2近似正態， 1-2的：‘檢驗為 T. S.：/'= （91-$2）-Du df= （n1-1）（n2-2）（1 c）（1-1）+ 2（n1 1） si/m1 其中（=- 遼+泣 4.對於不等方差，獨立樣本，31和y2近似正態，A1 2 的100（1 a）%置信區間為（$1-32）士talzinl 其中，：分位數具有自由度 df = （a1-1）（n2-2）（1-c）（n1-1）+c（n2 1）

6.7 小結•347• 而 s/nL 品+綠 5.基於獨立樣本的 Wilcoxon 秩和檢驗 Ho：兩個總體分佈相同。（≤10， 2≤10） T. S.：T，樣本1的秩和（1， 2>10） 1.S.：* - のT 其中，T表示樣本1的秩科，企沒有等秩的情況下當（n1+ 2+1） 12 6. 差值近似於正態時的配對：檢驗 2-Dn T.S.：t= Sa/Vn df n-I 其中ne是差值的個數。 7.對配對資料，差值近似正態時，ks 的100（1-a）%置信區間為 8. 基於配對樣本資料的 Wilcoxon 符號秩檢驗 Ho：差值分佈關於 D。對稱 T. S.：（n≤5O）T，或T+，或T+與T-中較小者，依賴於 F。的形式 T. S.：n≥50 •=T一些其中，在沒有等秩的情況下 KT （n土12 a = n（n +1）（2n.+1） 24 9.獨立樣本：41 12 的100（1-a）%置信區間估計形如 1一2士E 時所需的樣本容量 EZ 10. 獨立樣本：檢驗（41-42 所需的樣本容量 a.單側檢驗：n =2021 +3A）？

•348• 第六章兩總體中心值的比較 b.雙側檢驗：n =202L%a/2+ sg）2 11. 配對樣本：41-#2的100（1-a）%置信區間估計形如a士E時所需的樣本容量 F2 12. 配對樣本：檢驗p1-P2 所需的樣木容量 20g（2o+aa2 a. 單側檢驗：n、雙的於驗：n-203lag＋s2 補充練習 6.37（工程）有人建議用一種新合金製造鋼樑。公司的治金專家設計了個研究方案來比較新合金和目前使用的合金之同的強度。分別用每種合金製造 10 根梁。測定這20 根梁的承重能力，結果如下：粱老合金新合金 1 2 3 4 5 23.7 24.0 21.1 23.1 22.8 26.6 32.3 28.0 31.1 29.6 6 25.0 28.5 7 25.3 31.2 8 22.6 23.6 9 23.3 29.1 10 22.8 28.5 a．我們感興趣的總體是什麼？ .分別求出用新舊合金製造的梁其平均承重能力的90%置信區間。 c•給定a=0.01，問：新合金的平均承重能力是否大於舊合金的平均承重能力？並求出檢驗的p值。 d.在（b）和（c）中使用的統計方法，其所需的前提條件是杏滿足？ e. 用新合金製造大梁要比用舊合金費用高很多，所以只有當新合金的承重能力比舊合金高至少5噸時，才選用新合金。根據這個標準，你是否建議公司用新合金？ 6.38（醫學）長跑運動員認為適度地暴露於臭氧環境可增加肺容量。為了調查這種可能性，研究人員將老鼠放在濃度為2ppm 的臭氧環境中30天。在研究前和實於臭氧中30天后，分別測出老鼠的肺活量（tnl）。見下表老鼠暴露前彖露後 8.7 9.4 2 7.9 9.8 3 8.3 9.9 4 8.4 10.3 9.2 8.9 9.1 8.8 8.2 9.8 8.1 8.2 8.9 9.4 10 8.2 9.9 11 ‡2 8.9 7.5 12.2 9.3

6.7 小結•349• 8.已知 a=0.05，問：是否有足夠的理由相信臭氧可增加肺容量？並給出檢驗的p值。 .估計暴露於臭氧環境後老鼠肺活量增加量的95%置信區間。 c.經研究，調查人員稱臭氧能增加肺活量。該試驗支援這一論斷嗎？ 6.39（環境）在關於新機場對環境影響的研究中，研究人員測量了各種噴氣式飛機在輪子剛離開地面幾秒種之後的噪聲水平。這些飛機包括窄體和寬體，下表列出了15架寬體飛機和 12 架窄體飛機的噪聲水平（單位：分貝）寬體飛機 109.5 107.3 105.0 117.3 105.4 113.7 121.7 209.2 108.1 106.4 104.6 110.5 110.9 111.0 112.4 窄體飛機 131.4 126.8 114.1 126.9 108.2 122.0 106.9 116.3 115.5 111.6 124.5 116.2 a.兩種飛機的噪聲水平是否不同？給出檢驗的顯著性水平。 b.估計兩種飛機平均噪音水平差值的95%置信區間。 c.你怎樣選擇研究所需的飛機？ 6.40（農業）某昆蟲學家正在研究 F，和F2兩種黛劑中哪種燻劑能夠更有效地控制菸草上的寄生蟲。為了比較這兩種票劑，在9塊土質，排水、防風性皆不同的土壤上種植菸草。再將每塊土地分成大小相同的兩小塊。隨機地將 F，施用於其中一小塊土地上，F2施用於另一小坎土地上。從每塊地上選取50株菸草，每小塊各 25株。數一下寄生蟲的個數，資料如下表所示：地塊藥劑F，票劑F2 1 77 76 2 40 38 3 11 10 4 31 29 5 28 27 6 50 48 7 53 51 8 26 24 9 33 32 a.我們感興趣的總體是什麼？ b.給定a=0.01，問：這些資料是否提供了充分的證據表明施用不同的黛劑其平均寄生蟲水平存在差異？並求出檢驗的p值。 c.估計施用兩種集劑所導致的平均寄生蟲水平差值的90%置信區間。 6.41 見練習6.40。在另•個試驗設計中，隨機地將 F，施用於某9塊土地上，F，施用於另外9塊土地上，而不考慮土地的型別。這種試驗方法會導致什麼問題？ 6.42（環境） 1989年3月24日，Ex.zon vlde 號油輪在阿拉斯加擱淺之後，大約有 3500噸原油被洩露到 Prince William Sound 海區。在論文“The deep ben-

• 350．第六章兩總體中心值的比較 thos of Prince William Sound, Alaska, 16months after the Ezzon Valdex oil spill” ［Marie Pollution Bulletin （1998），36:118~130］中，作者報告了關於原油洩露之後對深海生物的評價。研究中選取了 13個地點，其中7個點位於石油流經路線，另6個點在路線之外。在1990年7月1日到30日一段時間內，採集了水下40米和100米處環境和生物資料。其中一個變是生物豐富度（每平方米生物個體數）。資料如下表所示：地點 40米 100米 1 5,124 3,228 2 2,904 2,034 3 3,600 3,256 地點 40 米 100米 1 1,336 1,676 2 394 2,008 3 7,370 2.224 石油流經路線之內 4 2,880 3,816 石油流經路線之外 4 6,762 1,234 5 2,587， 2,438 6 4,416 4.897 7 1,408 1,346 5 744 1,598 6 1,874 2,182 a.將兩深度資料混合，路線內外的生物豐富度是否有差異？ b.估計兩類地點生物豐富度差的95%置信區間。己知a=0.05 c.（a）（b）中方法所需條件是什麼？ d. 檢查這些條件是否已滿足。 6.43 題目見練習6.42。利用6.42中兩深度的混合資料回答下列問題： 8.用 Wilcoxon 秩和檢驗法估計路線內外生物豐富度是否存在差異？ b.（a）中方法所需條件是什麼？ c.這些條件是否已滿足？ d. 討論：檢驗和 Wilcoxon 秋和檢驗所得結論有什麼不同。 6.44 題日見練習6.42。研究人員同時也檢驗了深度對生物豐富度的影響。 a.將四個資料集畫成並立盒形圖以證實深度對生物豐富度的影響。 b.對於每個深度，評價路線內外生物豐富度的差異。已知& =0.05 c.在40米處和100米處你的結論一致嗎？ 6.45 題目見練習6.42~6.44。 a.討論命題“石油洩漏對生物豐富度沒有負面影響，事實上，它似乎增加了生物豐富度”的正確性。 b.對這項研究的一個可能的批評是：路線外6個點與路線內7個點在許多方面不具備可比性。假定研究人員現有路線內7個地點洩漏前生物豐富度

6.7 小結•351，的資料。可用哪種方法評價原油洩漏對生物豐富度的影響？用這種資料而不是用練習6.43的資料有哪些優點？ c. 用原油洩漏前後的資料評價原油洩漏對生物密度產生的影響可能會出現哪些問題？ 6.46 資料見練習3.13。 a.新療法是否看起來比標準療法使得平均生存時間更長？a=0.05。 b. 估計使用新療法時平均生存時間的95%置信區間。 c.估計使用新療法與標準療法時平均生存時間差的95%置信區間。該置信區間與（a）的結論一致嗎？ d. （a）~（c）所用方法的條件是否滿足？ 6.47（教育）某知名大學教育學院的研究小組設計了一個研究方案用來評價以下猜想：老師的期望會對學生的成績產生影響。將200名成績相當的學生隨機地分到試驗組或對照組。試驗組的老師被告知這些學生都是班級中成績很好的人，且最有可能在標準化考試中取得較大進步。而對照組的老師卻不被告知學生的任何情況。在學期初和學期末對這些學生進行了標準化考試。兩次考試的分數變化情況見下列圖表。試驗組對照組樣本容量 100 100 均值 26.5 17.0 標準差 24.2 9.1 100 分數變化 50 0 試驗組對照組試驗組和對照組盒形圖（均值以實心圓點表示） a.是否可看出試驗組平均成績變化較大？ b.給出檢驗的p值。

•352• 第六章兩總體中心值的比較 c.估計兩組學生平均分數變化的差。 d. （a）-（c）所用方法的條件是否滿足？ e.用非技術術語，也就是說，用非統計術語敘述關於兩組結果差異的結論。 6.48 題目見練習6.47。有批評認為，差別很大的教學方法和學生能力可能會影響研究的結果。因兩組中老師和學生都不同，所以不可能知道分數的差異是源於老師的期望，學生能力的內在差距還是不同老師的教學方法。給出其他研究方法以解決其中一部分問題。 6.49（醫學）某試驗旨在比較癲癇病患者對兩種藥品D」、D，的平均吸收時間。隨機抽取20個癲癇病忠者進行研究。其中10個服用 D1，另外10個眼用 D2。將血管中藥物達到某一特定水平的時間記錄如下：患者 1 藥品 D1 19.8 藥品 D2 23.0 2 45.4 37.3 3 32.0 11.4 4 24.5 60.6 5 47.2 72.1 6 18.1 41.4 7 $0.2 42.6 8 47.2 43.8 9 16.8 42.8 41.2 65.3 a.是否有足夠的理由認為兩種葯品的平均吸收時間存在差異？ b.給出檢驗的顯著性水平。 c.試估計兩種藥物平均吸收時間的差。 d.（a）~（c）所用方法的條件是否滿足？ 6.50（工程）透過每天月測所消耗的原材料數甘，建築公司經常需要估計工地施工的進度。公司希望知道這種估計的精確度是否與工地型別有關。考慮兩類工地：高層建築和一層建築。從公司數百個工地負責人中隨機選出9個參加這項研究。每個負責人在某一天對兩工地所用的磚數進行估計。估計數址與實際數量（單位：幹塊磚）的差別列於下表。質責人高層一層 1 0.9 -1.6 2 1.1 2.5 3 0.7 1.1 4 0.3 -1.0 5 1.3 1.2 6 1.6 1.4 7 -0.8 1.9 8 1.4 1.8 9 1.7 1.9 a.已知 a=0.05，問：是否有足夠的理由證明對兩類工地的估計存在差異？給出檢驗的值。 b.試估計對兩類工地進行目測估算的平均精確度的差。 c.（a）和（b）中所用方法的條件是否滿足？並解釋之。 6.51（生物）為了評價一種抗高血壓藥物的有效性，進行了一項研究。從同一品種的高血壓老鼠中隨機選出3組，每組20只。第一組服用小劑量的藥物，第二組服用大劑量的藥物，第三組為無治療對照組。注意，負值表示血壓的升高。根

6.7小結•353• 據計算機的輸出結果回答下列問題： a.已知a=0.05，試比較對照組和大劑量組的平均降壓量，並給出檢驗的顯著性水平。 b.估計大劑量組和對照組平均降壓量差的95%置信區間。 c.（a）和（b）中所用方法的條件是否滿足？並解釋之。 100 * 50 0 -50 Row 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Low Dose -45.1 - 59.日 58.1 -23.7 64.9 12.1 10.5 42.5 48.5 -1.7 -654 -17.5 22.1 -15.4 96.5 -27.7 -16.7 39.5 1 小劑量 2 大劑量血壓資料的盒形圖 High Dose 54.2 89.1 89.6 98.8 107.3 65.1 75.6 52.0 50.2 60.9 92.6 55.3 103.2 A5.4 70.9 29.7 40.3 73.3 3 對照組 Control 18.2 17.2 34.8 3.2 42.9 -27.2 42.6 10.0 102.3 61.0 - 33.1 55.1 84.6 40.3 30.5 18.5 29.3 -19.7

•354．第六章兩總體中心值的比較 19 20 -4.2 -41.3 21.0 73.2 37.2 48.8 To-sample T for Low Dose vs Control N Mean StDev SE Mean Low Dose 20 3.8 44.0 9.8 Control 20 29.8 34.0 7.6 95& CI for mu Low Dose-mu Control：（-51.3，-0.8） T-Test.mLow Dose- mu Control （vs not. .）：T=-2.09 B-0.044.DE-35 Two-sample T Eor High Dose vs Control N Hean stDev SE Mean High Dose 20 68.4 24.5 5.5 Control 20 29.8 34.0 7.6 95 & CI tor mu High Dose-mu Control：（19.5, 57.6） T-Test nu High Dose-mu Control （vs not =）；T=4.12 P=0.0002 DE = 34 Two-sample r for Low Dose vs High Dose N Mean StDev SE Mean Eow Dose 20 3.8 44.0 9.8 Eigh Dose 20 68.4 24.5 5.5 95 * CI for mu Iow Dose-mu High Dose：（-87.6，-41.5） T-Test mu Low Dose = mu High Dose （vs not =）： T=-5.37 P=0.0000 DE =29 6.52 題目見練習6.51。 a.已知a=0.05，試比較對照組和小劑組的平均降壓量，並給出檢驗的顯著性水平。 b.估計小劑量組和對照組平均降壓量差的95%置信區間。 c.（a）和（b）中所用方法的條件是杏滿足？並解釋之。 6.S3 題目見練牙6.51。 a. 已知a=0.05，試比較大劑量組和小劑組的平均降壓量，並給出檢驗的顯著性水平。 b.估計小劑組和大劑量組平均降壓量差的95%置信區間。（a）和（b）中所用方法的條件是否滿足？並解釋之。 6.54 在練習6.51~6.53中，我們根據同一資料集中相應的部分資料進行了三組假設檢驗。定義整個試驗的第I類錯誤率為檢驗任意一組假設時至少犯一次第I類錯誤的機率。 a.如果在& =0.05水平下檢驗每一假設，試估計整個試驗的第I類錯誤的機率。

6.7 小結•355• b.給出一種檢驗方法以確保整個試驗的第I類錯誤的機率不超過0.05。 6.55 （工程）某回收鋁罐加工者很關心從兩種來源回收的鋁罐其雜質（主要是其他金屬）的含量。在試驗室對樣本進行分析得以下資料（每百千克產品中雜質的幹克數）：來源I:3.8 3.5 4.1 2.5 （均值=3.617，標準差=0.676）來源I：1.8 2.2 1.3 5.1 3.6 4.3 2.1 2.9 3.2 3.7 2.8 2.7 4.0 4.7 3.3 4.3 4.2 2.5 5.4 4.6 a.計算混合方差和標準差。 b.估計平均雜質水平差的95%置信區間。 c.該加工者在a=0.05水平下能否得出這樣的結論，即，平均雜質水平差並不等於零？ 6.56 為比較兩種計算機電子製表程式的效能，將學生分成每三人一組，每組均根據自己的喜好來選擇電子製表程式，以解決相同的標準會計和金融方面的問題。記錄每個小組所花的時間（分鐘）。下表列出了利用應用最廣泛的兩種製表程式解決問題所花費的時間，同時列出的還有樣本均值，樣本標準差和樣本容。程式 A B 39 43 36 57 38 27 42 35 52 53 45 33 時間 41 50 31 44 28 30 7i 50 56 54 49 37 63 29 s N2 51.50 10.46 10 38.00 8.6716 a.計算混合方差。 b.根據這個方差，求總體均值差的99%置信區間。 ^•依據此區間，在a =0.01水平下，均值相等的零假設是否應被拒絕？ 6.57用分離方差法（方法）重做練 6.56中的（b）和（c）。在此例項中種方法更為合適？方法的選用很關鍵嗎？ 6.58 題目見練習3.32。對於陸地和水生鳥類，DDE 與PCB 的平均比值是否仔在顯差異？利用a=0.05，並給出檢驗的顯著性水平。 6.59 為評價有學位的護士是否比註冊護士接受過更為綜合的訓練，研究人員作了一項研究來對此進行比較。州護士執照辦公室分別從兩組中隨機選出50 名護士，並對她們進行了護士資格考試。分數見以下圖表。 Two-Sample T-Test and Confidence Interval Two-sample T for Degreed vs RH N Hean StDev Degreed 50 399.9 17.2 $E Mean 2.4

•356• 第六章兩總體中心值的比較 RN 50 354.7 30.9 4.4 95 % CI for mu Degreed-mu RN：（35.3, 55.2） T-Test mu Degreed = mu RN （vs>）：T=9.04 450 400P=0.0000 DF = 76 數試分考 350300 有學位的護士註冊護士有學位的護士和註冊護士成績的盒形圖（均值以實心圓點表示） a.護士執照辦公室是否能得出這樣的結論，即，有學士學位護士的平均分數高於註冊護士？給定 a=0.05。 b. 給出檢驗的近似p值。 c. 估計兩組護士平均分數差的95%置信區間。 d. 只有當分數差別大於40時，才視為有實際意義。平均分數的觀察差異值是否有實際意義？ 6.60（社會）設計了一項研究旨在比較市中心的食品價格是否高於市郊。將一籃食品分別在市中心的n個店和市郊的n個店進行估價。假設兩處的價格服從正態分佈，市中心店的價格範圍為 115 美元至 135美元，市郊店的價格範圍為 100美元至120美元。如果我們以95%的把握認為平均價格差的估計值與真正值相差不超過4 美元，那麼，需要的樣本容量是多少？ 6.61 題目見練習 6.60。隨機選出13 個市中心店和 14個市郊店進行研究。每店對該籃的估價列出如下。食品店郊區市中心食品店郊區市中心 109.11 131.76 106.94 121.39 118.37 122.37 111.09 130.47 117.74 125.81 109.48 134.47 113.59 122.15 117.49 135.47 117.74 128.26 108.68 129.90 113.00 129.24 122.97 134.72 111.87 126.17 113.00

6.7小結•357• a.估計在兩地該籃食品的平均價格差。 h.該研究是否實現了練習6.60 中規定的目標？ .是否有充分的理由認為市中心食品的價格較高？用非統計術語敘述你的結論。 d.你可能犯了哪類錯誤，第］類還是第II類？ 6.62 考慮第6.1節關於石油洩漏的案例。 a，我們感興趣的總體是什麼？ b.除了植物密度，還有那些因素可表明石油洩漏對沼澤有影響？ c.描述如何隨機地選取研究中所用的土地。 d. 假定研究人員在石油洩漏5年前曾測量過石油洩漏地區20塊成片土地上的植物密度資料。根據這一資訊，試給出另一種分析方法。 6.63（政治科學）公共職位的競選者必須公佈他們在競選中的花費。政治科學象認為女候選人一般很難募集到款項從而她們的花費要比男候選人低。假定下表中列出的資料為從某州立法機關職位竟選者中隨機選出的男女候選人的花費資料。這些資料是否支援上述論斷？競選費用（單位：千美元）候選人男性女性候選人男性女性 1 169 289 11 298 425 2 3 206 257 334 278 12 13 269 256 386 356 4 294 268 14 277 342 5 252 336 15 300 305 6 283 438 16 126 365 7 240 388 17 318 355 8 207 388 18 184 312 9 230 394 19 252 209 10 183 394 20 305 458 a. i.用非專業術語敘述零假設和備擇假設。 i.用統計術語或符號敘述零假設和備擇假設。 b.估計女性候選人與男性候選人競選費用的差。 c.在0.05水平下，此差異在統計意義上是否顯著？ d.此差異有實際意義嗎？ 6.64 題目見練習6.63。若要用：方法分析資料，需滿足那些條件？根據圖表確定在練習6.63 中的資料是否滿足這些條件。 Two-Sample T-Test and Confidence Interval Two-sample T Eor Female vs Male N Mean StDer SE Mean

• 358• 第六章兩總體中心值的比較 Female 20 245.4 52.1 12 Male 20 350.9 61.9 14 95% CI for mu Female-mu Male：（-142， -69） T-Test mu Female = mu Male（vs not =）：T= -5.83 Both use Pooled StDev = 57.2 P= 0.0000 500 400 DF = 38 競選費用 100 女性候選人男性候選人女性候選人與男性候選人的盒形圖（實心圓點表示均值） 6.65（環境）對一地區進行煤的露天開採後，開採公司必須將土地恢復到開採前水平。因 pH 值是決定土地適於播種哪種植物的重要因素，故應考慮 pH值的變化。在開採之前，將這片地劃分為格子地塊，並從中隨機抽取15塊，測出它們的 pH 值。開採完之後，將土地復原，在同樣的15塊地上測量pH值。見下表：地塊開採前開採後地塊開採前開採後 1 10.02 10.21 8 10.08 10.30 2 10.16 10.16 9 10.05 10.17 3 9.96 10.11 10 10.04 10.10 4 10.01 10.10 11 10.09 10.06 5 9.87 10.07 12 10.09 10.37 6 10.05 10.13 13 9.92 10.24 7 10.07 10.08 14 10.05 10.19 15 10.13 10.13 a. 州土地辦公室對資料進行了分析，並給出了計算機輸出結果。對土壤復原後的平均 pH 值變化進行檢驗，問，其檢驗的顯著性水平是多少？ b. 州土地辦公室所檢驗的研究假設是什麼？ c.估計開採前後平均 pH值變化的99%置信區間。 d. 因：檢驗顯示在土壤復原後pHi值具有明顯差異，故土地辦公室欲對此公

6.7 小結•359• 司進行罰款。你認為這些資料是否支援這一決定？並根據（a）和（c）的結果解釋之。 6.66 題目見練習6.65。基於土地辦公室在假設檢驗中所作的結論，他們可能犯了以下哪類錯誤（從a，b，c，d中選一項）。 a.第I類錯誤。 b.第I類錯誤。 c. 第I類錯誤和第I類錯誤。 d. 兩類錯誤都沒有。 6.67 題目見練習3.13。用下列圖表分析對應於標準療法和新療法的生存時間。 Two-Sample T-Test and Confidence Interval Two-sample T for Standard vs New N Mean StDev SE Mean Standard 28 15.68 9.63 1.8 New 28 20.71 9.81 1.9 95 % CI for mu Standard-mu New：（-10.2,0.2） T-Test mu Standard = mu New（vs<）： T=-1.94 P= 0.029 DF = 54 Both use Pooled StDev = 9.72 40 30 20 10 0 標準療法新療法標準療法和新療法盒形圖（均值以實心圓點表示） a.這些資料是否支援研究假設：新療法比標準療法有更長的生存時間？ b. 估計新療法增加的生存時間的95%置信區間？ c. 若要用t檢驗分析資料，需滿足哪些條件？這些條件滿足嗎？ 6.68（社會）為確定中產階級家庭中不工作的婦女是否比工薪階層家庭中不工作的婦女有更多的志願協會成員資格，進行了一項研究。隨機抽取家庭主婦

• 360• 第六章兩總體中心值的比較作為樣本，並詢問她們丈夫的職業及本人的會員資格情況，根據其丈夫的職業將這些婦女分為中產階級和工薪階層，計算平均每組具有志願協會成員的資格數。15 箇中產階級婦女中，平均每名婦女的成員資格數為1=3.4，方差S1=2.5,15個工薪階層婦女中，平均每名婦女的成員資格數為 2=2.2，方差s2=2.8。 a.利用這些資料構造兩組婦女平均成員資格數差的95%置信區間。 b.這些資料是否支援研究假設：中產階級婦女成員資格數要多於工薪階層？ 6.69〔政府）某地區美國稅的審計員以3月15日之前的退稅申報的樣本進行檢驗，以判斷今年納稅人的退稅額是否大於去年。隨機抽取每年100個退稅額作為樣本。資料如下：均值方差樣本容量去年 320 300 100 今布 410 350 100 a. 這個審計員的研究假設是什麼？ b.進行假設檢驗，你能得到什麼結論？ c.假設檢驗所需的條件是什麼？該資料集是否滿足這些條件？為什麼？ 6.70（社會）“美國小姐”大會的官員稱：若要在大會中勝出，才智比美貌更為重要。為評價這一論斷，隨機抽取55個前才智竟賽的獲勝者和53個前泳裝競賽的獲勝者。檢驗兩組的平均獎金額是否顯菁不同。前者的平均獎金額是8645 美元，標準差為5829美元；後者的平均獎金額是9198美元，標準差為8185美元。計算兩組平均獎金額差的95%置信區間。並說明此區間是否支援該官員的論斷。 6.71（商業）一個訪美的法國人認為歐洲製造的磁帶播放時間比美國的長。為證實或反駁這一論斷，從法德兩國製造的磁帶中隨機抽取一個樣本，再從美國製造的磁帶中隨機抽取另一個樣本。根據樣本資料計算的結果如下：祥本容量平均播放時間（秒）標準差外國產 14 207.45 41.43 美國產 14 182.54 37.32 國外生產的磁帶播放時間是否更長？給定a=0.05。 6.72（政府）一個位於華盛頓的聯邦機構定期提供PL/1 課程，其中PL/1

6.7小結•361• 為在該機構內部編寫程式時所用的一種計算機程式語言。第一•周由外部諮詢公司的人授課，第二週由本機構的一計算機職員授課。結果如下：外部教師授課本機構人員授課 38 46 42 33 53 38 37 60 36 58 48 $2 47 44 47 45 44 51 這些資料是學員1周內的總分數（雖大可能值為64）。假定分數可反映教學成果，這些資料是否能充分證明兩個教師的教學成果存在差異？ 6.73（醫學）公司領導很關心某種藥品藥效保持的時間。從當前生產線F 隨機抽取10瓶藥品，記為樣本1，分析它們的藥效。將它們儲存一年，再進行分析，這樣得到第二個樣本，記為樣本2。所得資料如下：樣本1 樣本 2 10.2 10.5 10.3 10.8 9.8 9.8 9.6 10.1 10.2 10.1 10.6 9.7 10.7 9.5 10.2 9.6 10.0 9.8 10.6 9.9 用標準統計軟體 SAS對這些資料進行分析。相關結果輸出如下： Variable:POTENCY TTEST PROCEDURE SANPLE N Mean Std Dev Std Error Variances 1 10 10.37000000 0.32335052 0.10225241 Unequal 2 10 9.83000000 0.24060110 0.07608475 Bqual For HO: Variances are equal, F' = 1.81 DF=（9,9） Prob>F = 0.3917 T 4.2368 16.6 4.2368 18.0 DE Prob>/zI 0.0006 0.0005 .研究假設是什麼？ b.1和：'統計量的值等於多少？對於該資料集來說，為什麼它們相等？ c.1和：'統計量的p值為多少？為什麼它們不相等？ d.在a=0.05水平下，兩種檢驗對此研究假設所作的結論是否相同？ e.1和：‘檢驗，哪一個更適合於分析該資料集？ 6.74 考慮兩種方法改進氣式飛機的發動機以減少噪音。將兩個系統安裝在同樣的飛機上。為比較兩架飛機的噪音，在主體機場的跑道正下方安裝了噪音記錄裝置。每當飛機降落到機場時，就記錄其噪音水平。用SAS軟體對這些數據進行分析，相關結果如下：

• 362．第六章兩總體中心值的比較 TTEST PROCRDURE variable: NOISE System N H R Hean Std Dev Std Error Variances 42 99.67299428 11.30050001 1.74370501 Unequal 20 93.30597443 10.15740464 2.27126473 Equal For HO:Var iances are equal, F' = 1.24 DF = （41,19） Prob>F'= 0.6290 DF Prob>|r 2.2236 41.3 0.0317 2.1400 60.0 0.0364 a．研究假設是什麼？ b.z和：統計量的偵等於多少？對於該資料集來說，為什麼它們不相等？ c.1和：'統討量的值是什麼？ d. 在a=0.05 水平下，兩種檢驗對此研究假設所作的結論是否相同？ d. 1和：‘檢驗，哪一個更適合於分析該資料集？ 6.75（農業）對16頭奶牛進行研究。隨機抽取8頭（第一組），讓其僅飲用清水，其餘8頭（第二組）飲用液體乳清。另外每頭牛每天可獲得7.5kg 穀物，並且可以任意食用青草。儘管兩組奶牛的產奶情況（比如說產量或奶中脂肪含量）並無顯著差異，但每日青草的食用量𨚫引起了研究人員的興趣。資料如下：組1 組2 15.1 6.8 14.9 7.5 14.8 8.6 14.2 8.4 13.1 8.9 12.8 8.1 15.5 9.2 15.9 9.5 a.根據這些資料檢驗研究假設，即兩組牛的平均青草食用量存在差異。 b.估計兩組牛平均青草食用量的差。 6.76 題目見練習6.75。下表列出了在研究之前16頭奶牛的體重（幹磅）。奶牛樣本1 樣本2！ 12.3 22.7 2 16.0 20.1 3 15.6 17.9 4 12.4 21.0 14.2 20.5 6 18.6 19.5 7 16.6 20.6 8 15.8 21.4 a.這些資料是否能充分證明在研究之前兩組牛的體重存在顯著差異？ b.假定我們要根據16頭牛的體重資料重新設計研究方案。你怎樣將兩種食物分配給這些牛以減少它們體重差異的影響？ 6.77（工程）一個工業公司欲對幾種用於火箭推進劑的混合物進行試驗，這些混合物是由四種成分—鎂，硝酸鹽，硝酸鍶，黏合劑—按不同比例混合而成的。試驗發現有兩種混合物發出的火花亮度比其他的要高。混合物1中四種原料比例分別為0.40，0.10,0.42 和 0.08，混合物2中四種原料比例分別為0.60，

6.7 小結•363• 0.27,0.10和0.05。準備20份不同的混合物（每種混合物10份），並檢測出其火花亮度。資料如下（以 1000個燭光單位計）。混合物1 185 深合物2221 192 201 215 170 210 215 202 204 190 196 175 225 172 230 198 214 202 217 a.將資料繪成圖。哪種檢驗可用於比較兩種混合物的平均亮度。 b.給出檢驗的顯著性水平，並解釋之。 6.78 題目見練習6.77。根據樣本資料而不是統計檢驗回答，兩種混合物的平均亮度差是多少？ 6.79 題目見練習6.77。對於這兩種混合物，假定我們要檢驗研究假設： KL<#2，並假定總體服從正態分佈，具有共同標準差。=12，若要求檢驗滿足：當 FI—#2≥15時，a=0.05,8（Ma）<0.10。則所需樣本容是多少？ 6.80 引數資料盤中癲癇病研究的資料。對這些資料進行分析得到以下輸出結果。研究中需測量的變數是服用安慰劑（Placebo）的病人和服用藥品氟柳雙胺（progabide）的病人8個星期後的發病次數。 Two- Sample T-Test and Confidence Interval Two-sample T for Placebo vs Progabide N Mean StDev SE Mean Placebo 28 7.96 7.63 1.4 Progabide 31 6.7 11.3 2.0 95 % CI for mu Placebo-mu Progabide：（-3.8,6.3） T-Test mu Placebo = mu Progabide（us>）：T=0.50 P= 0.31 DE=57 Both use Pooled StDev = 9.71 a.資料是否支援猜想：藥品可以減少癲癇病人的發病次數？在水平=0.05 下進行：檢驗和 Wilcoxon 檢驗。 b.哪種檢驗更適合於此項研究，為什麼？ c.估計兩種病人平均發病次數的差。 6.81（社會）在一個南部大城市的居民中進行一項關於焦慮的研究，參與研究的居民在12個焦慮症狀前依據有無選擇“是”，或”不是”。每個人的焦慮得分從 1到12，最高分表示出現了每一種焦慮症狀。隨機選取 50個居民，按性別分類，將他們的測試結果列下下表。根據這些資料檢驗研究假設：男性和女性的平均焦慮分數存在差異。給出檢驗的顯著性水平。

• 364．

第五章和第六章的內容為後面的統計推斷（估計和檢驗）奠定了基礎。當你研