AI 新聞與投資
統計學方法與資料分析引論

第二章 資料的描述

5 / 34

括)將在有關x方法,方差分析和迴歸的章節中加以討論和擴充。 重要公式 1.中位數,分組資料中位數二1+嚴(0.5n-656) 2. 樣本均值 2fy 3. 樣本均值,分組資料 4. 樣本方差S’=- 5.樣本方差,分組資料 n -1 6. 樣本標準差 s=Vs~ 7. 樣本變異係數。CV= 補充練習 3.58(環境)為了控制商業核電站在發生熄火時造成嚴重的反應堆心損壞的風險,在需要時啟動的應急柴油發電機必須有很高的可靠性。論文“Empirical Bayes estimation of the reliability of nuclear-power emergency diesel generators.(核能應急柴油發電機可靠性的經驗 Bayes估計)”[技術度量(Techmometrics)(1996)38: 11-23]收集有七個核電站發生事故時的資料。下列資料是從 1982年到1998年某一個站的柴油發電機在失效之間成功啟動的次數。 28 50 193 55 4 7147 76 10 0 84091 062 26 15 226 54 46 128 4 105 40 273 164 7 55 41 26 6 《注意:樂油發電機的失敗並不一定造威核電站反應堆心的損壞,因為所有的核電站都備有若干應急柴油發電機。〉 a.計算在失效之間成功啟動次數的均值和中位數。 b,哪一個度量看上去最能代表資料的中心? c.計算極差和標準差s。 d. 用極差近似的方法來估計s。近似值與真實值如何接近? e.作區間分別數出在兩次失效間隔中,落入三個區間的成功啟動次數。把這些數變為百分數,並與經驗準則中的百分比作比較。 1. 為什麼你認為你的百分比與經驗準則中相符不好? 3.59(環境)佛羅里達大學的口腔醫學院作出一項承諾,利用學生可自己掌

3.8 小結•121• 握進度的教學材料,例如錄影帶,幻燈片和教學大綱來教授所有課程,以期所有學生都能以適合於自己能力的進度進行學習,並且指導人員在與學生接觸的過程中有更多的時間留給個人諮詢。已經開發了一套這樣的教學材料,並首批對50個從頭至尾學習了這門課的學生進行了試驗。下面的測量值是這些學生完成被要求的所有材料所花費的時間(小時)。 16 8 33 21 34 17 12 14 27 6 33 25 16 7 15 18 25 29 19 •27 5 12 29 22 14 25 21 9 4 12 15 13 11 6 9 26 5 16 s 9 11 S4 523 21 10 17 15 a.計算完成時間的眾數,中位數和均值。 B.猜測s的值。 c.利用快捷的公式計算s的值,並與(b)中答案作比較。 d.你認為經驗準則充分地描述了這些資料的變異性嗎?解釋你的理由。 3.60(商業)消費者報告雜誌(Consumer Report)1998年2月號提供了24種牌子的紙巾的價格。由於各種品牌的紙巾每捲紙的張數不同,下面給出了每種紙巾每張紙和每捲紙的價格。 品牌 1 2 5 6 7 10 11 12 13 14 15 16 每卷價格 1.$9 0.89 0.97 1.49 1.56 0.84 0.79 0.75 0.72 0.53 0.59 0.89 0.67 0.66 0.59 0.76 每捲紙的張數 50 55 64 90 60 52 72 80 52 85 80 85 80 80 80 每張紙的價格 0.0318 0.0162 0.01$2 0.0155 0.0173 0.0140 0.0152 0.0104 0.0090 0.0102 0.0069 0.0111 0.0079 0.0083 0.0074 0.0095

•122.