Mr.林:呵呵,對照這幾道題的錄入結果,你就清楚了!如圖3-27所示。 二分法第3題第25題弔31趑第一第二第三東嬰本安中安第40題建議增加對員工的業務培訓多重分類法第25題第31題選項一選項二選項三第一第二年三由要王要正期年月 2001 第40題建議增加對員」工的業務培訓」 圖3-27 問卷錄入結果小白仔仔細細地對比了圖3-26和圖3-27,然後說道:哦,我明白了! 3.3 本章小結 Mr.林緩了緩,接著說:巧婦難為無米之炊——資料準備的內容就跟你介紹完了。小白,現在我們來回顧一下,今天主要講了兩方面的內容。 * 認識了資料的特點與要求,它是以欄位和記錄的形式儲存在資料表中,資料型別主要有字元型和數值型兩大類。瞭解了資料表的六點要求。 * 熟悉了幾種資料來源,學習了資料匯入方法與調查問卷常見的五種題型及錄入格式。 小白以迅雷不及掩耳盜鈴之勢接過話:您介紹的方法我都在本子裡記下了! Mr.林:嗯,不錯!不過,提醒一下,“巧婦難為無米之炊”的下半句是“懶婦不為有米之炊”。做資料分析是個辛苦活兒,收集一組組資料,統計一個個指標,建立一層層關係,重複一次次檢查•都需要我們親力親為,嚴格把關,容不得半點疏忽,這也是之前提到的嚴謹負責的態度。 所以,做資料分析首先得克服惰性,你需要認真貫徹到實踐中去,剛剛所講的內容都得多操練幾遍才能熟練掌握。後面我會詳細講述資料處理的過程,不過•• Mr.林學著一休哥的語氣:在這之前,我們先“休息,休息一會兒”。 65
第4-章三心二意—一資料處理何為資料處理資料清洗資料加工資料抽樣曼技術部倪東海提供 1%的錯誤=100%的失敗⋯⋯
第4章三心二意—資料處理發件人:牛董收件人:小白抄送:人力資源部主題:請協助開展員工滿意度專案分析 Dear 小白: 2010年年度員工滿意度的問卷調查已經結束,請聯絡人力資源部提取問卷錄入結果,協助人力資源部開展員工滿意度資料分析, 務必在一週內給我資料分析結果。 如有問題,與我聯絡。 牛董 2011.1.11 這天剛上班,小白就收到牛董的這封E-mail,沒想到任務來得這麼快,於是愁眉不展地呆坐了很久。昨天才剛跟Mr.林學了點基礎知識,現在任務就來了。資料拿到後該怎麼辦?要怎麼處理?要提煉出哪些資訊出來?牛董想看到哪方面的結果?小白覺得一籌莫展,無從下手。沒辦法,“兵來將擋,水來土掩”,只能再次向Mr.林請教。 4.1 何為資料處理小白向Mr.林介紹完情況後,Mr.林不慌不忙說道:正好!昨天已經介紹了資料準備,今天準備教你資料處理。呵呵,聽完我今天這堂課,完成牛董的任務就是小菜一碟!老規矩,欲練神功先修內功,做資料處理首先要做到“三心二意”。 4.1.1 “三心二意”處理資料小白不解:三心二意?開玩笑吧,只聽說做事要一心一意,而資料處理怎能三心二意呢? Mr.林:別急啊!汪涵大叔說,要做個讓父母放心,讓愛人開心,讓領導省心,對女人善意,對男人隨意的“三心二意”的好男人。作為一名資深資料分析師,對此我深有體會。做資料處理也要“三心二意”。小白,你要認真聽好咯! ◎ 信心資料分析師都知道,要經過無數次對海量資料的收集整理、邏輯運算、分析彙總和論證檢驗,才能得出一個簡潔的結果。所以,成千上萬的資料在資料分析師眼裡不過是家常便飯,你首先得有信心,先藐視它們,再幹掉它們! 看小白一臉土色,Mr.林繼續補充道:我給你講個老故事壓壓驚。某小子去少林寺學武,師 67
68 >> 誰說菜鳥不會資料分析(入門篇) 傅讓他天天拍水缸。小子拍了一週,手掌紅腫,師傅說繼續;小子拍了一個月,瀕臨崩潰,師傅還說繼續;小子拍了半年,心想你這老頭在敷衍我,老子我不練了,拂袖而去。回家,敲門, 一掌,門碎。小子哭著回到山中長跪。什麼叫信心?信心是指未看見任何未來時,你依然懷抱希望,堅持下去。 Mr.林說的這番話比一罐紅牛還奏效,小白頓感精神十足:真給力!唯有相信,才有可能。 謝謝師傅! ◎ 細心 MT.林:資料處理做的可都是細活兒,五大三粗的人幹不了!為什麼?毫不誇張地說,一個數字能影響一個結果,一個結果能影響一個決策,一個錯誤的決策能毀掉一個公司!資料分析師有一個公式: 1%的錯誤=100%的失敗 “千里之堤,潰於蟻穴”在資料分析中的例子比比皆是,所以,我們絕對不能對任何一個細微之處掉以輕心。另一方面,資料分析師還要對差異非常敏感,一個異常值可能就是問題的癥結所在。 ◎ 平常心當別人在酒吧喝酒、唱歌,而你還在加班,一遍又一遍地核對資料時;當你辛辛苦苦處理資料,Exce1很久都沒有響應時;當你廢寢忘食製作報表,即將接近尾聲,電腦突然宕機或斷電時……你還能保持淡定嗎? 所以,處理資料要有一顆平常心—平淡、平等、平靜地對待問題。加班加點時不能急躁焦灼,遇到問題時不能退縮放棄,找不出原因時不能敷衍偽造,權威壓力之下也不能跟著人云亦雲。也許你會說,人吃五穀,豈無六慾?可資料分析師就得修煉一顆平常心,不為感性所牽引, 洞悉事物本質,完全實事求是。對於資料分析師來說,只有資料、事實和規律,其他神馬都是浮雲! 小白:您講得太對了!除了信心、細心和平常心的“三心”外,還有哪“二意”? Mr.林:誠意、合意! ◎ 誠意記得上大學時追一漂亮MM被拒,人家對我說:“你連我性格、喜好都不知道,憑什麼說喜歡我?“大學畢業應聘第一份工作被拒,人家對我說:“你連我們公司是幹什麼的都不知道,憑什麼要錄你?“這兩個經歷告訴我:做任何事情,無論是追女孩,找工作,還是學東西,如果只是抱著隨便看看的心態,就只能得到隨便看看就能得到的東西。 所以,小白,要成為優秀的資料分析師,就得誠心誠意。同時,誠意還包含了誠實、尊重事實的含義,就像我最開始跟你說過的,嚴謹負責是資料分析師必備素質之一,只有嚴謹負責的態度,
第4章三心二意—資料處理才能保證資料的客觀、準確。資料分析若失去了真實可信的本質,就等於喪失了其尊嚴和價值。 ◎ 合意合意就是滿足需求方(領導、運營部門等)的分析目的與需求。剛入職的朋友經常會遇到這樣的情形,自己沒日沒夜地加班,含辛茹苦寫出來的資料分析報告,卻因為不符合需求方的目的和要求,被要求重新返工。所以,做分析前,先要了解清楚需求方想要什麼,在做的過程中,要不斷反饋細節和進度,確保你做的與需求方想的在同一軌道上執行。 小白問道:要是我覺得他們想的不對咋辦? MT.林:你可以給他們一些建議,但是如果他不採納你的建議,切記不要一意孤行,自己埋頭苦幹! 小白:哇,您開場就給我上了一節職場啟蒙課!真是受益匪淺,感激不盡! 4.1.2 資料處理的內容 MT.林:呵呵,誰叫我“好為人師”呢,那現在開始進入正題咯!首先問你,資料準備的工作做得怎麼樣啦? 小白:我打電話給人力資源部的同事,他們已經將錄入結果發給我了,不過是文字形式的, 我再用您教我的文字匯入方式轉換成我們需要的Excel格式,這就給您看看資料。 小白開啟轉換好的Excel檔案,傻眼了:這Excel表格像一群唧唧喳喳的麻雀一樣,折騰得小白心裡不得安寧,如圖4-1所示。 C 873 175 175#1D136#A_B_B. 10302 718-408-4184 874 176 176#1D42#B_C.B_E 10314 212-775-3412 875 177 177#1D135#A_B_A 11361 212-340-5502 876 178 178#1D177#B_C_B. 10169 646-354-5674 877 179 179#1D186#A_B_B. 11413 917-363-2471 878. 180 180#1D63#B_C_A_I 11207 347-625-6847 879 181 181#1D10#A_C_A_ 11366 917-613-6421 880 182 182#1D90#A_B_A_I 11220 347-346-9229 881 183 183#1D131#C_C_A 10122 917-785-7273 882 184 184#1D142#A_B_A 10112 718-245-5292 883 185 185#1D94#B_C_A_I 10013 646-391-9926 884 186 186#1D158#D_D_A 11209 917-647-6620 885 187 187#1D83#C_C_A_ 11418 917-350-9472 886 188 188#1D189#D_D_B 10028 718-377-3801 887 189 189#1D84#C_C_A_I 10451 917-612-4762 888 190 190#1D43#A_B_A_I 10158 646-519-3002 G 4273 #邦井 4274 4275 01/14/08 08:01D 4276 01/14/08 09:09E 4277 01/14/08 11:41E 4278 01/14/08 15:10 4279 01/15/08 08:440 4280 01/15/08 13:10: 4281 01/15/08 14:04E 4282 01/15/08 16:310 4283 01/16/08 09:51E 4284 01/16/08 13:540 4285 01/16/08 14:48= 4286 01/17/08 09:26D 4287 01/17/08 10:300 4288 01/17/08 13:20: HIJKLE e ED DAED mImD c D 圖4-1 員工滿意度調查—初始資料表 Mr.林:你認為它應該是什麼樣?規規矩矩的一出來就是你想要的樣子?告訴你吧,我們工作中遇到的常常是這種雜亂無章、殘缺不全的資料。這個時候你得有清潔工的精神,一點一點將它弄得井井有條、乾乾淨淨。運用下面我教你的資料處理步驟,你想要它變成啥樣,它就能變成啥樣! 69
>> 誰說菜鳥不會資料分析(入門篇) 第一步,資料清洗。顧名思義,資料清洗就是將多餘重複的資料篩選清除,將缺失的資料補充完整,將錯誤的資料糾正或刪除。最後的資料狀態應該是“多一分則肥,少一分則瘦”。 第二步,資料加工。經過清洗後的資料,並不一定是我們想要的資料,例如身份證號碼,其實我們只想抽取裡面出生年月的資訊。所以,還要對資料欄位進行資訊提取、計算、分組、轉換等加工,讓它變成我們想要的資料表。 完成這兩步,我們就可以對資料進行分析了,這個過程如圖4-2所示。 數擱原表腔齊的資料表我要的資料表我嬰的字絨!我嬰的字候?我賽的字紋了數擱清洗資料加工入 70 圖4-2/資料處理的步驟 Mr.林:小白,理解了嗎? 小白:明白!這不就跟炒土豆絲六樣嗎?第一步,將土豆洗得乾乾淨淨,削掉土豆皮,切成土豆絲,這就類似資料清洗咯,可以說是量的變化吧;第二步就是加工,你要做蒸土豆絲,炸土豆絲,還是炒土豆絲,你想做什麼就按照不同的方法進行烹飪、加工。 同樣,根據你需要的資料,採取不同的手法改造、加工。這感覺像是質的變化了。 Mr.林聽完笑道:這都能想到吃,I服了U! 小白有點不好意思:這不是做個類比方便理解,融會貫通嘛。 Mr.林:呵呵,我們來做下總結。資料處理就是根據資料分析的目的,將收集到的資料,用適當的處理方法進行整理加工,形成適合資料分析的要求樣式,它是資料分析前必不可少的階段。 小白:記下了。 4.2 資料清洗 Mr.林笑了笑:既然我們已經有了資料,現在是不是到了洗土豆的時候了? 小白皺了皺眉頭:可是我不喜歡洗土豆,髒兮兮的,不知道從何下手。我們拿到的資料也是,一點也不清爽,密密麻麻地擠成一團兒⋯⋯
第4章三心二意——資料處理 Mr.林哭笑不得:就屬你最懶!所以,接下來我就要先教你資料清洗的技巧。清洗資料包括三部分:清除掉不必要的重複資料、填充缺失的資料、檢測邏輯錯誤的資料。做這些工作的目的是為後面的資料加工提供簡潔、完整、正確的資料。 4.2.1 重複資料的處理 Mr.林:先給你講個真實案例,這也是我的朋友參加一次應屆生招聘面試的經歷。他發現大部分應屆生都說自己精通Excel、Word、PPT。那到底是不是真的精通呢?於是,他問了一道簡單的Exce1問題“用幾種不同的方法可以找出一張表中的重複資料”,並讓所有應聘者都作答。有個小子憋得實在不行,擠出了一個字“數”! 小白滿臉通紅:其實我也不知道⋯••• Mr.林笑笑說:呵呵,沒關係,所以我說幹什麼工作都要有“誠”意。重複資料的處理在我們的資料處理中是非常普遍的,雖然方法有很多,但學起來一點都不難。不信,跟著我來玩玩。 下面是我擷取的一列“員工編號”的資料,如圖4-3所示,教你幾個處理重複資料的方法。 2 3 4 5 6 7 8 9 10 11 A 編號 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 思考:有幾種找出重複值的方法? 圖4-3 處理重複資料 ◎ 函式法 Mr.林:首先,介紹一個用函式識別重複資料的方法,這裡要用到COUNTIF函式。 公式金鑰 COUNTIF(range, criteria):對區域中滿足單個指定條件的單元格進行計數。 要計數的單元格範圍。 計算條件,其形式可以為數字、表示式或文字; 例如,條件可以表示為 32、“32”、“>32”或 “apples”。 圖4-4 公式金鑰 -COUNTIF 71
>>1 誰說菓鳥不會資料分析(入門篇) 72 STEP 01 STEP 02 STEP 03 利用COUNTIF函式識別重複資料的具體操作如下。 選中B2單元格,然後輸入函式公式:=COUNTIF(A:A, A2)。 選中C2單元格,然後輸入函式公式:=COUNTIF(A$2:A2, A2)。 將公式複製到B3:C11的所有單元格,效果如圖4-5所示。 A B 重複第二次重編號標記復標記 1 D 重複項公式 E 第二次重複項公式 1 2 3 4 5 6 7 8 9 10 11 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 1 1 2 3 3 3 2 1 1 2 3 2 1 =COUNTIF(A:A,A2) =COUNTIF(A A,A3) =COUNTIF(A. A,A4) =COUNTIF(A A,A5) =COUNTIF(A.A,A6) =COUNTIF(A A,A7) =COUNTIF(A A,A8) =COUNTIF(AA,A9) =COUNTIF(A A,A10) =COUNTIF(A A,A11) =COUNTIF(AS2:A2,A2) =COUNTIF(AS2:A3,A3) =CQUNTIF(AS2:A4,A4) =COUNTIF(AS2: A5,A5) =COUNTIF(AS2:A6,A6) =COUNTIF(AS2:A7,A7) =COUNTIF(AS2:A8,A8) =COUNTIF(AS2 A9,A9) =COUNTIF(AS2 A10,A10) =COUNTIF(AS2 A11,A11) 圖4-5 利用COUNTIF函式識別重複值 Mr.林:B列中的結果代表的是每一個員工編號出現的次數,所以B列中大於1的單元格所對應的員工編號即重複的編號。 沒等Mr.林說完,小白忙插上一句:為什麼還要加上C列?這有什麼不同嗎? Mr.林解釋道:C列查詢的是出現了兩次及其以上的重複項,以C9對應的“A466074”為例, 結果“3”代表了從A1至A9,A466074是第三次重複出現。因此,篩選出C列中等於1的數即可找出資料中所有非重複項,如果對B列進行篩選,則無法完整找出非重複項。 小白恍然大悟:哦,原來如此。 ◎ 高階篩選法 Mr.林:提到篩選,我就告訴你另一個找出重複資料的方法。其實在Exce1裡,可以直接利用篩選功能篩選出非重複值。具體操作如下。 STEP 01 選擇資料單元格區域AI:AI1。 STEP 02在“資料” 選項卡上的“排序和篩選”組中,單擊“高階”按鈕,彈出“高階篩選” 對話方塊。 STEP 03 選擇“將篩選結果複製到其他位置”選項,在“複製到”文字框輸入B1區域,再勾選 “選擇不重複的記錄”核取方塊,單擊“確定”按鈕,篩選效果和步驟如圖4-6所示。 小白驚呼:哇,好神奇!這個方法好,太方便了!
第4章三心二意—資料處理 10 11 編號 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 清除、盥新應用排宇高選排序和簡選高階炸選方式 ◎在原有區域顯示篩選結果() ◎ 將篩造結果複製到其他位置 (2) 列表區城心): 德造1SA$1:$A$11 條件區城 (): 復申倒①): 路選1$B$1 編號回選擇不置復的記錄(A667708 A310882 請足取溯 A356517 A520304 A776477 A466074 A218912 圖4-6 利用篩選功能處理重複值條件格式法 Mr.林笑道:別急,還有更神奇的方法呢!Exce1 2010裡面還內設了標識重複項的功能,選擇“開始”一“條件格式”一“突出顯示單元格規則”一“重複值”,就可以把重複的資料及所在單元格標力不同的顏色,如圖4-7所示。 圖條件格式, 突出顯示單元格規製() 專案選取規則① 資料條(D) 大丁(⑤- • 小於 ⋯ •旺介於(B…,甜時圓E 圖際集四新建規則(N).。 清除規則!(©) 日答溫規則().• • 文字包含日. 發生日期(A)-- • 編號 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 重複宜(其他規則(M). 圖4-7 用條件格式標記重複值小白:這個法子也不錯,還能標為不同的顏色,這樣更容易識別重複資料了。 ◎ 資料透視表法 Mr.林:呵呵,其實資料透視表一樣能計算資料重複的頻次,而且比COUNTIF函式還來得方 73
>> 誰說蘋鳥不會資料分析(入門篇) 便,只要簡單地拖動相應欄位即可。 用資料透視表統計各資料出現的頻次,出現2次及以上就說明該資料屬於重複項;如果統計結果為1,則說明該資料沒有重複出現。現我們仍以員工編號為例查詢重複資料,具體操作步驟如下。 STEP 01 單擊“插入”選項卡,在“表”功能組中,單擊“資料透視表”按鈕。在彈出的“創建資料透視表”對話方塊“選擇一個表或區域”中選擇資料來源單元格範圍“重複數據!$A$1:$A$11”,如圖4-8所示。 ISTEP 02繼續在彈出的“建立資料透視表”對話方塊“選擇放置資料透視表的位置”中選擇“現有工作表”,並指定位置“重複資料!$8$]”,如圖4-8所示。 B CDE 5 10 11 12 12 編號 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 建立效據跡視表請選探要分析的數狢 ◎ 選擇一個表破區域(S) 表/區城(): 重複資料!$A$1:SA$11 • 使用外都數発源(D 22X 廷報名禰造擇放置資料透視表的位置 〇新工作表 (E) ◎ 現有工作表 () 位置C): 重複資料1$B$1 STEP 03 74 確定取消圖4-8 重複資料查詢操作示例將“編號”欄位拖至行標籤,再將“編號”欄位拖至數值彙總區域,如圖4-9所示。 D F G H C 計數項::編號編號 A218912 A310882 A356517 A466074 A520304 A667708 A776477 總計 E 資料透視表宇列表 •彙總選擇要新增到報表的欄位: 回編號 1 1 3D 在以下區墩問拖動宇段: 丫報表篩選二列標籤 1 10 園-行標鑑編號口推遲佈局更新二數值計數項:編號• 電新圖4-9 重複資料查詢結果示例透過資料透視表的分析,我們可以得知員工編號A466074重複出現3次,A776477重複出現2次。 Mr.林:小白,你看這不就找出重複資料了。 小白:沒錯,真好用!簡單、方便、快捷!
第4章三心二意—資料處理 ◎刪除重複資料 Mr.林喝了口水,繼續說道:最後,介紹三種刪除重複項的方法。先介紹最簡單的方式,直接利用選單欄裡〝刪除重複項”選項。 方法一:透過選單操作刪除重複項 STEP 01 選擇A1:A11資料區域。 STEP 02 在“資料”選項卡上的“資料工具”組中,單擊“刪除重複項”。 STEP 03 在“列” 區域下,選擇要刪除的列,單擊“確定” 按鈕。 STEP 04 Excel 將顯示一條訊息,指出有多少重複值被刪除,有多少唯一值被保留。單擊“確定”按鈕,完成操作,如圖4-10所示。 編號 A667708 A310882 A356517 A520304 A776477 A466074 A466074 A466074 A776477 A218912 葷復項除重複項若要冊除重複值,請選擇一個或多個包含重複值的列。 【E全選() 品取消全選 (列囗編號 2區口資料包含標題 () 確定取消編號 A667708 A310882 A356517 A520304 A776477 A466074 A218912 icrosoft Excel 發現了3 個重複值,已將其冊除:保留了?個唯一值. 此值息是否有幫助2 圖4-10 透過選單操作刪除重複項方法二:透過排序刪除重複項 Mr.林:之前,我們採用函式識別重複值的方法得到了如圖4-5的COUNTIF輔助列。可以利用該輔助列採用排序的方法刪除重複資料,如圖4-11所示。 STEP.01 選中“第二次重複項”中任意一個有資料的單元格。 STEP 02 選擇“開始”主選項卡一“編輯部分”功能區一“排序和篩選”一“降序”,於是得到了重新排序的資料,其中前三項是重複項(因為數值大於1)。 STEP 03 刪除前三項所在的行,就OK了! 75
>> 誰說菜鳥不會資料分析(入門篇) 編號重複第次標記重複項 3 3 3 2 編號 A466074 A466074 A776477 A667708 A310882 A356517 A520304 A776477 A466074 A218912 琲序和篩選 • 1 升序(S) 降序(⑨ 空定義排序()⋯ 篩選(E 《清除(心重新應用1 A466074 A466074 A776477 A667708 A310882 A356517 A520304 A776477 A466074 A218912 重複第次標記重複項 3 3 3 2 2 2 3 1 圖4-11 利用排序功能刪除重複項方法三:透過篩選刪除重複項同樣得到圖4-5所示的輔助列後,選中“第二次重複項”中任意一個有資料的單元格,然後選擇“資料” 主選項卡一“排序和篩選”功能區一“篩選”,就會在列標籤中出現下拉選單,單擊下拉選單,挑出不等於1的數值,篩選後就得到非重複項了。具體操作如圖4-12所示。 A B C 21 升序(S) X! 海旁(2 按賾色排寧口第二公里復場按我數李蒲選(B 76 碉定取灘每於(E).. 不夠於1大於(9. 大於或第於(0. 小於(. 小於配等於(Q今於10. 10個最大約值①..。 臺於平均值④ 民於平均價(Q) 合定義簡選(E. 自定義自動歸選方式顯示行: 第二次靈復項不等於 12× 可用?代表單個宇符用*代表任意多個字元確定L 取消圖4-12 利用篩選功能刪除重複項 Mr.林:最後,刪除篩選出來的行,這個方法稍顯複雜些。 4.2.2 缺失資料處理 MT.林:除了重複資料外,我們還會經常碰到缺失值的問題。如果缺失值過多,說明資料收集過程中存在著嚴重的問題。可以接受的標準是,缺失值在10%以下。
第4章三心二意—資料處理小白:什麼是缺失值呢?什麼情況下會造成缺失值? Mr.林:缺失值是指資料集中某個或某些屬性的值是不完全的,這在資料分析中非常常見。 缺失值產生的原因多種多樣,主要分機械原因和人原因。機械原因是由於資料收集或儲存失敗造成的資料缺失,比如資料儲存的失敗、儲存器損壞、機械故障導致某段時間資料未能收集等。人為原因是由於人的主觀失誤、歷史侷限或有意隱瞞造成的資料缺失,比如,在市場調查中被訪人拒絕透露相關問題的答案,或者對問題的回答是無效的,抑或資料錄入人員失誤漏錄了資料。 在資料表裡,缺失值最常見的表現形式就是空值或者錯誤識別符號,現在就教你怎樣在龐大的資料表裡,馬上查詢出所有缺失值。 ◎ 定位輸入看小白在認真聽,Mr.林繼續說:如果缺失值是以空白單元格形式出現在我們的資料表中, 怎樣才能一步將所有的空白單元格查詢出來呢? 小白搖搖頭:不知道,我只會用眼睛看的。 MI林:最快捷的方式是採用定位功能。在Exce1”開始”主選項卡的“編輯”功能區,單擊下拉選單裡的“定位條件”選項,或者直接使用快捷鍵“Ctr1+G”,則彈出“定位”對話方塊,如圖4-13所示。再選擇“定位條件”一“空值”一”確定”,則所有的空值都被一次性選中了。 定位 2× 定位: 引用位置 (8) 定位條件(3). 一一伊定位條件選擇 ◎批註(C) 〇葉量 (0) 〇公式①) 數子0 (選輯值(0) 囚甜湯餅) 當許風迷分3 〇當前數姐() •物件 1) 2區 〇行內容差異單元格 () 〇列內容差異單元格 () 〇引用單元格(E) 〇 從風單元格 ①) 所有級別C 〇最後一個單元格 (S) 〇可見單元格() ◎ 件格式() 〇 數有效性 () ◎全部C) 相同(E) 鷄定(取劑圖4-13 定位查詢小白:果然是一步到位!可是查詢到所有缺失值後,需要怎麼處理呢? Mr.林答道:我們一般用以下4種方法處理缺失值。 1. 處理缺失值的四種方法方法一:用一個樣本統計量的值代替缺失值。最典型的做法就是使用該變數的樣本平均值代替缺失值。 77
>> 誰說菜鳥不會資料分析(入門篇) 方法二:用一個統計模型計算出來的值去代替缺失值。常使用的模型有迴歸模型、判別模型等,不過這得用專業資料分析軟體才行。 方法三:將有缺失值的記錄刪除,不過可能會導致樣本量的減少。 方法四:將有缺失值的記錄保留,僅在相應的分析中做必要的排除。當調查的樣本量比較大,缺失值的數量又不是很多,而且變數之間也不存在高度相關的情況下,採用這種方式處理缺失值比較可行。 在實際操作中,採用樣本平均值替代缺失值是比較常見的實用的方法。當樣本量較大時,我們可以採用定位查詢一次,選出樣本里的所有空值,再利用“Ctrl+Enter” 快捷鍵在所有選中單元格中一次性輸入樣本平均值。 2. "Ctrl+Enter”快捷鍵小白問道:“Ctrl+Enter”鍵? MT.林:對的,“Ctrl+Enter”快捷鍵,在不連續的區域中同時輸入同一個資料或公式時很好用,我用一個例子說明它的具體用法。 STEP 01 選擇一個單元格或區域,然後按住Ctr1鍵不放,再選擇第二個、第三個•⋯單元格或區域,直到選中所有要輸入資料的區域才鬆開Ctrl鍵,如圖4-14所示。 B STEP 02 1 2 3 4 圖4-14 “Ctrl+Enter”快捷鍵——步驟1 鬆開Ctr1鍵後,輸入要錄入的資料,在這裡我們以輸入“小白”為例,因為最後一個選中的單元格是C4,則C4中出現了我們錄入的“小白”,如圖4-15所示。 C STEP 03 78 2 3 4 小白圖4-15 "Ctrl+Enter”快捷鍵—步驟2 別急著按Enter鍵,這裡改成按“Ctrl+Enter”快捷鍵,則所有選中的單元格都變成 “小白”了,如圖4-16所示。 A B C 1 2 小白 3 4 小白小白小白小白圖4-16 “Ctrl+Enter”快捷鍵—步驟3
第4章三心二意—資料處理 Mr.林: "Ctrl+Enter”快捷鍵可以與定位查詢搭配使用。當你用F5鍵或“Ctrl+G”快捷鍵定位方式定位到空白單元格之後,可以輸入任何你想要輸入的資料,再按“Ctrl+Enter” 快捷鍵,讓所有選中的單元格全部乖乖變成你要的樣子。 小白:哈哈,“Ctrl+Enter”快捷鍵,我記住了! ◎ 查詢替換 Mr.林:當缺失值是以錯誤識別符號形式出現的時候,可以採用第二種方法——查詢替換,查找出所有出現同一錯誤識別符號的單元格,在“開始”選項卡的“編輯”功能區中,單擊“查詢和選擇”按鈕,如圖4-17所示。 查詢和選撣 CtrHF 招童找(E).一 3 替換(B).. 轉測(⑨)⋯ 三位條件(S. 公式() 批王(M) 條件格式(C) 第量(N) StK於H 'Ctrl+6 心選禪物件(2 S 選禪密樀()… 圖4-17 查詢替換同樣可以利用快捷鍵,查詢功能的快捷鍵為“Ctr1+F”,替換功能的快捷鍵為“Ctrl+H”, 在“查詢內容”文字框中輸入要查詢的文字或數字,在“替換為”中,輸入要替換的文字或數字,單擊“替換” 按鈕即可。 例如,我要查詢錯誤識別符號“#DIV/O!”並將其全部替換成“O”,操作如下。 STEP 01 選中所有資料區域。 STEP 02 按 “Ctrl+H”快捷鍵,彈出如圖4-18所示的“查詢和替換”對話方塊。 查詢和替換查詢10) 替換 () 奇找內容 0): #DIV/01 替換為(): 全部替換(6) 替換Q) 圖4-18 [選項①)》 查詢全部Q) 直找下一個吧) 關閉 “查詢和替換”對話方塊 79
>> 誰說菜鳥不會資料分析(入門篇) STEP 03 在“查詢內容”中輸入要搜尋的文字或數字,這裡我們輸入“#DIV/O!”,在“替換為” 右欄內輸入“0”,再單擊“全部替換” 按鈕,則所有“#DIV/O!”都替換為“O”了。 4.2.3 檢查資料邏輯錯誤 Mr.林:處理完了重複多餘的資料和缺失不完整的資料,我們現在來看怎麼對付錯誤資料。 錯誤資料一般是怎麼樣出現的呢?以這次的員工滿意度調查為例,一般會有兩種錯誤形式。 * 被調查者輸入的選項不符合要求。例如“最多選擇3個選項”的多選題,答題者選擇了4 個選項。 * 錄入錯誤。例如二分法的多選題錄入時,出現了“0”和“1”之外的資料。 如果我們不對這種資料做些處理,勢必會影響分析結果。小白,在這裡我要告訴你一個秘密,一般情況下正F函式能解決大部分問題,如果再巧妙地搭配條件格式,絕對“見效快、療效好、安全可靠、無副作用”。 小白也配合道:嘿嘿,有了IF+條件,錯誤資料哪裡逃! Mr.林笑道:迴歸正題,我們來看T1題就有要求“最多選擇3個選項”,而T1的資料就出現了剛剛我們講的兩種錯誤情況:答題者選擇的選項超過了3個;錄入者錄入的資料出現了“0”和 “1”之外的資料。 其實這兩種錯誤是資料邏輯錯誤的典型,我現在就告訴你如何把它們給檢驗出來,如圖 4-19所示。首先用IF函式來檢查第一類錯誤,錯誤的資料返回“錯誤”,正確的資料返回“正確”;再利用條件格式檢查第二類錯誤,將非“0”和 “1” 的資料用紅色加粗斜體字型突出顯示。 2 2 80 8 檢驗一(IF函式):I3=IF(COUNTIF(B3 H3*<>0")>3"借誤”正確) 檢驗二(利用條件格式):=0R(E3=1.B3=0)-FAL SE 圖4-19 檢查邏輯錯誤——IF函式 ◎ 利用IF函式檢查錯誤 Mr.林接著說:先檢查第一類錯誤,在重複資料處理中,我們講到過COUNTIF函式,你還記得嗎? 小白自信地說道:記得!這很容易記住啊,COUNT在英文中就是“計數”的意思,IF就是 “在××的條件下”的意思,COUNTIF就是“對滿足指定條件的單元格進行計數的意思”。在這第4章三心二意—資料處理裡 “COUNTIF(B3:H3,"<>0")”代表“對B3:H3區域中不等於0的單元格進行計數”。 Mr.林笑道:看來你私底下功課做得很足,呵呵。你剛剛對“COUNTIF(B3:H3,"<>0”)” 的理解很正確。這裡又要解釋一下IF函式了:IF即判斷語句,判斷邏輯值是真還是假。那麼根據什麼來判斷真假呢?表示式。 所以IF函式有三個組成部分:需要判斷的表示式,表示式為真時的顯示值,表示式為假時的顯示值,如圖4-20所示。 公式金鑰公 IF(logical_test,value_if_true,value_if_ false):執行真假值判斷, 根據邏輯計算的真表示計算結果為為 TRUE 時為FALSE 品假值返回結果。 TRUE或FALSE 返回的值。 返回的值。 的表示式。 注意: a. 條件表示式是用比較運算子(<、=、/建立的式子,無比較就無判斷。 b. 兩個值若是數值資料可直接書寫,若是文字資料則要用雙引號標記。 c.引數裡面所有用到的標點符號都是英文狀態下的標點符號。 d. IF函式可進行巢狀,最多可以有七層。 圖4-20公式金鑰—IF函式注意,0代表被調查者未選該選項,所以對非0的資料進行計數,就用你剛剛解釋的公式 COUNTIF(B3:H3,"<>0”)。那麼 “IF(COUNTIF(B3:H3,"<>0)>3,"錯誤”“正確””的意思是:如果錄入的選項(非0的資料)超過3個,則單元格顯示“錯誤”;否則,顯示“正確”。 Mr.林:小白,現在你明白了嗎? 小白誇張地點點頭:徹底領悟了。 ◎ 利用條件格式標記錯誤 MT.林:好的,現在來檢查第二類錯誤。在對重複資料的處理過程中,標識第二次重複值時,我們同樣講過條件格式的用法。在這裡我操作給你看看,就不再多加解釋了,如果不記得的話可以看看筆記。 選中資料區域B3:H6,再選擇“開始”主選項卡一“條件格式”一“突出顯示單元格規格”一“其它規則”一“使用公式確定要設定格式的單元格”,在“為符合此公式的值設定格式”文字框中輸入“=0R(B3=1,B3=0)=FALSE”,最後單擊“格式”按鈕將格式調整為紅色加粗傾斜字型,完成設定。OR與AND函式的使用方法如圖4-21所示。 在這裡解釋一下“=OR(B3=1,B3=0)=FALSE”的含義,OR代表“或”的意思,所以OR函式代表的意思是:函式的任意一個引數為真時,返回TRUE,否則返回FALSE。 81
>> 誰說菜鳥不會資料分析(入門篇) 公式金鑰: OR(logical1,[logical2]..): 至少一個引數為真,就返回TRUE。 AND(logical1, [logical2]...):所有引數全部為真,才返回TRUE。 要檢驗的第一個系件,結果可以為TRUE或 FALSE。 要檢驗的其他條件,計算結果可以為 TRUE 或 FALSE,最多可包含255個系件。 圖4-21 公式金鑰—OR與AND函式那麼,B3的條件格式規則“=OR(B3=1,B3=0)=FALSE” 代表的意思是:如果“B3為1或者為0” 的命題是錯誤的(=FALSE),即B3既不為1也不為0,則會被條件格式突出標記出來。小白,你明白了嗎? 小白眨眨眼:真繞呀!有點暈,不過“實踐是檢驗真理的唯一標準”,我回去自己多操練操練就明白了。 4.3 資料加工 Mr.林:資料清洗完了之後,就是資料處理的重頭戲—資料加工了,這是含金量最高的一個活兒,咱們的土豆絲做成什麼樣也就看這一環節的功夫了。小白,打好精神,堅持就是勝利! 小白興奮地點點頭;好啊!我迫不及待要學呢。 Mr.林:我也只教你最實用的功能與技巧,花費20%的精力解決80%的問題。 為什麼要對資料進行加工?因為資料表中現有的資料欄位不滿足我們的資料分析需求,所以需要對現有欄位進行抽取、計算或者轉換,形成我們分析所需要的一列新資料欄位。 4.3.1 資料抽取 MT.林:資料抽取,是指保留原資料表中某些欄位的部分資訊,組合成一個新欄位。可以是擷取某一欄位的部分資訊—欄位分列;也可以是將某幾個欄位合併為一個新欄位—欄位合並;還可以是將原資料表沒有但其他資料表中有的欄位,有效地匹配過來—欄位匹配。 ◎ 欄位分列我們先介紹欄位分列技巧,以圖4-22所示的姓名錶為例,我們可以採用兩種欄位分列的方法將姓和名的資訊單獨抽取出來。 82
第4章三心二意—資料處理 1.選單法姓名,數攩審閱視園加數項 Syed Abbas Molly Dempsey Lola Jacobsen 承清除璽新應用夕毫級和窩選分列 Diane Margheim 重質吸閃。 文未列向學第1 .井3光文李分到灣寫利定您的那鬆具蔔分隔等。 若一行又置無誤,請單土“下一步”,習為看選揮最合話的史醫供題。 D區通含拜裝臺透館吹件典型,翔分輻事芽,知您號緊對表邦分福等個平段姓名請設定分判肉選所包合的分福碼號。 在投萬留口內時看創分刀的淡果。 分疆芳號口K心讓(口分號臼瀛樓分陽神口道80| 口X ©: Syed Abbas 數高柳第①) Molly Dempsey Lola Jacobsen liy Deysy we medoie Diane Margheim 圖4-22 文字分列嚮導 STEP 01 STEP 02 STEP 03 選擇要轉換的資料區域,在“資料”選項卡的“資料工具” 組中,單擊“分列”按鈕。 在“文字分列嚮導-第1步”對話方塊中,單擊“分隔符號”,然後單擊“下一步”按鈕。 在“文字分列嚮導-第2步”對話方塊中,根據需要選擇分隔符號。在此例中,姓和名是以空格的形式分開的,所以選中“空格”核取方塊,單擊“完成”按鈕,欄位分列就完成了,效果如圖4-22左下角圖所示。怎樣,簡單吧? 小白:嗯,是挺簡單的。 2.函式法 MT.林:當有特定的分隔符時,採用分列法非常方便快捷。但是有時候,我們需要提取特定的幾個字元,或者提取其中的第幾個字元,並且沒有特定的分隔符。 小白:哇,這麼麻煩呀! Mr.林:呵呵,一點兒也不麻煩,這個時候我們使用LEFT和RIGHT函式就能輕輕鬆鬆解決問題。先看看LEFT和RIGHT函式的用法,如圖4-23所示。 -公式金鑰 LEFT(text, [num_chars]):得到字串左部指定個數的字元。 RIGHT(text, [num_chars]):得到字串右部指定個數的字元。 包含費提取的字指定要由 LEFT或RIGHT 符的文字字串。 提取的字元的數量。 圖4-23 公式金鑰—LEFT與RIGHT函式 83
>> 誰說菜鳥不會資料分析(入門篇) 再舉個例子,例如我們要把姓名中的姓氏擷取出來,如圖4-24所示。 1 2 3 4 5 6 7 8 9 10 11 A 黃雅玲王偉謝麗秋王俊元孫林王炫瞄張三丰享四光王麻子趙六兒 B C 姓名姓公式 -LEFT(A21) 王 =LEFT(A3,1) 謝王孫王張專王 =LEFT(A4.1)| -LEFT(A5.1) =LEFT(A6,1) =LEFT(A7,1) =LEFT(A8, 1) =LEFT(A9,1) =LEFT(A10,1) =LEFT(A11,1) 圖4-24 函式拆分示例小白:直接用LEFT提取A列“姓名”中的左數第一個字元就達到我們要的效果了,Excel函式真是太好用啦! ◎ 欄位合併 Mr.林:是啊,而且還很容易理解。有欄位分列也就有欄位合併。欄位合併是將文字或數字合併成一個單元格,例如A列是“× ×年”,B列是“××月”,我們可以將這兩列的資料合併成C列“××年××月”。假設你要根據幾個資料列建立一個句子以便傳送大量信函,或者要用文字格式化數字而不影響使用這些數字的公式,就需要用到這個方法。合併文字和數字有兩種方式,利用CONCATENATE函式和“&” (邏輯與)運算子。下面我舉個例子,如圖4-25所示。 B 遲到員工小白 Mr.林 10% 5 公式 6 -A2&”退到 &B2&次 =A3&"遲到比例為'&TEXT(B3,"0%") -CONCATENATE(A2. 到,B2.、次”) 說明(結果) 將以上內容合併為一個短語。 (小白退到5次) 將以上內容合併為一個短語。 (Mr.林遲到比例為10%) 將以上內容合井為一個短語。 (小白遲到5次) 如果沒有我,10% 就會變成0.1哦~ 84 圖4-25 欄位合併 Mr.林:小白,你也許注意到公式中用了函式TEXT。它的作用是,在使用連線運算子連線數字與文字字串時,控制數字的顯示方式。如果不用TEXT,則預設顯示引用單元格中的基本數據,即此例中會顯示0.1,而不是在單元格中所看到的具有格式的值(10%),使用函式TEXT可恢復原數字格式。另外,CONCATENATE函式的用法也很簡單,如圖4-26所示。
第4章三心二意—資料處理公式金鑰公 CONCATENATE (text1,text2...)將幾個文字字串合併為一個文字字串。 需嬰合井的第1、2、•••N個文字項(N≤30),這些文字項可以為文字字串、數字或對單個單元格的引用。 注意:在將數字和文字合併到一個單元格中時,數字將成為文字,而不再用做數字,也就是說,無法再對其執行任何數學運算。 圖4-26 公式金鑰—CONCATENATE函式 ◎ 欄位匹配 Mr.林:前面講的欄位分列和欄位合併都是從原資料表中的某些欄位提取資訊,但有時候原資料表沒有我們需要的欄位,而需要從其他資料表中獲取欄位,這時就需要用到欄位匹配。舉個例子,我們公司銷售部門的員工職位經常發生變動,圖4~27所示是最新的員工職位表,現在我想擷取其職務資訊對應到圖4-28所示的“員工個人資訊(銷售部)”表中。 A B D 姓名工號部門職務 2 3 4 黃雅玲 A776477 銷售部銷售代表王偉 A667708 銷售部銷售代表謝卵秋 A520304 銷售部銷售代表王俊元 A310882 銷售部銷售總監孫林 A466074 銷售部銷售代表王炫肪 A356517 銷轡部銷售代表 8 張三丰 A277381 市場部市場總監李四光 A254382 市場部市場助理 10 11 王麻子 A213541 市場部市場助建趙六兒 A309752 市場部市場助理圖4-27 員工職位表 2 5 6 7 A B C D E F 姓名工號出生年月性別工齡職務黃雅玲 A776477 12/8/1968 37 王俊元 A310882 2/19/1952 謝麗秋 A520304 8/30/1963 王炫肪 A356517 9/19/1958 孫林 A466074 3/4/1955 王偉 A667708 7/2/1963 男女男男男 45 28 33 29 8 圖4-28 員工個人資訊(銷售部) 小白:對哦,兩個不同的表格,怎麼將表中的資訊擷取過來呢? Mr.林:按下面的操作進行。 STEP 01 開啟“員工職位表”和“員工個人資訊(銷售部)”兩張表格。 STEP 02 在“員工個人資訊(銷售部)”表格的F2單元格中輸入公式“=VL0OKUP(B2.[員工職位 85
>> 誰說菜鳥不會資料分析(入門篇) STEP 03 表.xIsx]Sheet1!$B$1:$D$11,3,0)",按Enter鍵。注意,輸入VL0OKUP函式的第二個引數時,不需要手動錄入,直接選中“員工職位表”中B1:D11的區域,引數將自動錄入成 “[員工職位表.xIsx]Sheet1!$B$1:$D$11”。 複製F2單元格,並貼上至F3:F7,即完成資料提取。為了更方便檢視公式,我們隱藏 C、D、E列,得到的效果如圖4-29所示。 B 1 2 姓名工號黃推玲 A776477 王俊元 A310882 4 5 6 7 謝卵秋 A520304 王炫晧 A356517 孫林 A466074 王偉 A667708 職務銷售代表銷售總監銷售代表銷售代表銷售代表銷售代表公式 =VLOOKUP(B2[員職位表.x/sxJSheet1/SES1.SDS11.3.0) =VLOOKUP(B3,[員工職位表 xisxJSheet1/SBS1.SDS11.3.0) -VLOOKUP(84./員工職位表 xisxJSheet1/ISBS1 SDS11,3.0) =VLOOKUP(85/員工職位表 xisxJSheet1ISES1.SDS11,3.0) =VLOOKUP(B6!員工職位表,xisxjSheet1/SBS1 SDS11,3.0) =VLOOKUP(B7.!是工職位表 XISxJSheet1ISBS1 SDS11,3.0) 圖4-29 完成匹配的“員工個人資訊(銷售部)”表 Mr.林:小白,你也許要問VLOOKUP的含義和用法。VLOOKUP函式在查詢與匹配中的應用非常廣泛,它的作用是在表格的首列查詢指定的資料,並返回指定的資料所在行中的指定列處的單元格內容,如圖4-30所示。 公式金鑰! VLOOKUP匹配函式;在表格的首列查詢指定的資料,並返回指定的資料所在行中的指定列處的單元格內容。 VLOOKUP(lookup value, table_array, col_index_num, range_Jookup) 要在表格或區域的第一列中查詢的值,其引數可以是信或引用。 包含資料的單元格區域,可以使用絕對區域(如 A2:D8)或區域名稱的引用。table_array 第一列中的值是由lookup_value 搜尋的值。這些值可以是文字,數字或溼輯值。 希望返回的匹配值的列序號,其引數為1時,返回 table_array 第二列中的信: 引數為2時,返回 table_array 第二列中的值, 依此類推。 近似匹配(1)還是精確匹配(O),一股情況選0。 圖4-30 公式金鑰 -VLOOKUP函式注意,table_array第一列的值必須是要查詢的值(lookup_value),否則就會出現錯誤標識 86 符“#N/A”。 另外,還有兩種情況會出現錯誤識別符號“#N/A”: * 資料存在空格,此時可以巢狀使用TRIM函式將空格批次刪除。 * 資料型別或格式不一致,此時將型別或格式轉為一致即可。
第4章三心二意—資料處理 4.3.2 資料計算 ◎ 簡單計算 Mr.林:有時候資料表中的欄位不能從資料來源表欄位中直接提取出來,但是可以透過計算來實現我們的需求。小白,看一看圖4-31,我們獲得的資料來源只有產品銷售數量和單價,老闆需要的是銷售額,以便了解公司業績。這時候,透過簡單計算才能達到目的。 沒等Mr.林往下講,小白打斷了他:等等,什麼是簡單計算呀? Mr.林:簡單計算就是欄位透過加、減、乘、除等簡單算術運算就能計算出來。先告訴你, 在Exce1中加、減、乘、除對應的運算子就是鍵盤中的“+、一、*、 符號。我們知道銷售額、 銷售數量和單價的關係如下: 銷售額一銷售教量義單價,總銷售額一乏每產品銷售額現在以圖4-31中所示的資料來源為例,教你計算銷售額。 產品名稱銷售數量單價銷售額公式業 2 產品A 產品B 200 ¥7800 ¥15,600.00 =82*C2 ¥88:00| ¥26 400:00| =B3"C3 ¥8500| ¥8,500 00 =84°C4 產品D 產品E 合計 ¥100:00 ¥5,000.00 =85*C5 87 • 737 ¥68:00| ¥5,916.00 =B6 C6 ¥61.416.00 =SUM(D2 D6) 圖4-31 計算產品銷售額 STEP 01 STEP 02 在D2中輸入“=B2*C2”,然後按Enter鍵完成輸入。 將滑鼠移動到D2單元格的右下角,直到出現填充柄,再雙擊填充柄,則D3:D6自動填充了D2的公式,D6的公式是“=B6*C6”。 Mr.林:D7是計算總銷售額的單元格,即我們希望D7是D2:D6之和,如何實現呢? 小白:你都說了“之和”,不就可以用“=D2+D3+D4+D5+D6”實現嗎? Mr.林:是的,但是當要求和的資料不是D2:D6,而是D2:060呢?這種公式輸入的過程是不是很複雜?所以我教你另一個簡單的方法,看第3步。 STEP 03 選中D7單元格,再選擇“開始”主選項卡一“編輯”功能組一“自動求和” 一“求和”,如圖4-32所示,按Enter鍵,完成輸入。 可以看到D7中有公式“=SUM(D2:D6)",SUM即對多個數值求和。同時我們看到“自動求和” 的下拉選單中還有平均值、計數、最大值、最小值等功能項,當我們想求得這些值時也可利用它們來實現。 87
>> 誰說菜鳥不會資料分析(入門篇) [二自動求和, 求和(S) 平均值(A) 計數(C 最大 (M) 最小值① 其他函式(E⋯• 寶選意戎和選擇圖4-32 自動求和 88 ◎ 函式計算 Mr.林:有簡單計算,也就有複雜計算,所謂的複雜計算就是指運用到函式的計算。其實平常工作中我們用到的函式並不複雜,接下來我就告訴你幾個既簡單又實用的函式。 1. 平均值與總和計算平均值與總和應該是我們最常見的問題了,例如之前介紹的用樣本平均值代替缺失值。 下面就以計算產品的季度平均銷售量和銷售總量為例,教你計算平均值與總和,如圖4-33所示。 3 6 B 51 20 154 60 96 95 C 產品名稱一季度二季度三季度四李度李度平均 41 56 92 16 22 36 123 169 277 48 66 108 77 106 173 76 105 171 G H 總銷售量產品A 產品B 產品C 產品D 產品E 產品F 60240 2494 181 724 71 282 =AVERAGE(B2 E2) =AVERAGE(B3.E3) =AVERAGE(B4 E4) 113451 112 448 8 9 10 =SUM(B5 E5) =SUM(B6.E6) =SUM(B7 E7) 圖4-33 平均值和求和函式舉例求平均值函式為AVERAGE()函式,求和函式 SUM()函式,括號內是需要計算的引數,引數可以為數字、單元格引用、區域或者定義的名稱,引數與引數之間用逗號隔開。這兩個函式的具體形式如圖4-34所示。 公式金鑰 AVERAGE(number1,number2,.):求平均值。 sUM(number1,number2..):求和。 引數,可為數字、單元格引用、區域或定義的名稱圖4-34 公式金鑰一AVERAGE與SUM函式例如,圖4-33中F2單元格內的公式“=AVERAGE(B2:E2)",括號內的引數是B2:E2區域,計算第4章三心二意—資料處理的是B2、C2、D2和E2的平均值;G5的公式“=SUM(B5:E5)”,計算的是B5、C5、D5和E5的總和。 小白:很簡單嘛,我懂啦! 2. 日期的加減法 Mr.林:在工作中,除了數字和文字格式的資料外,日期和時間格式也是我們經常要面對和處理的,所以,我再告訴你一些計算日期的方法。首先,介紹一個快速輸入當前日期的方法。 小白有點不屑:輸入當前日期?自己寫進去不就好了。 MT.林:嘿嘿,你還在手動輸入當前日期“年月日時分秒”嗎?太落伍了!使用NOW或者 TODAY函式就能輕輕鬆鬆搞定,如圖4-35所示。 顯示 2010-11-5 11:31 公式 =TODAY(7010 -1-5 11:31 =NOWO 快捷鎪 Ctrli Ctrl+Smftt2 “Ctrl:(分號)" •再按空格鍍,接看按 "Ctri+Shift+;" 公式插入的是動態的日期或時間快捷皺插入的是靜態的日期或時間圖4-35 輸入當前系統時間/日期我們經常會遇到需要對日期增減的問題,例如我們希望透過新增兩週的時間來調整一個專案的計劃日期。這時,只需要使用一個簡單的加減符就可在原日期的基礎上增減天數了。例如,在單元格A1中輸入 “2011-1-1”,在單元格B1中輸入“=A1+5",B1中就會顯示“2011-1-6” 的結果。考慮更復雜的情況,如果要為日期新增“年月日”組合的時候,我們可以用DATE()函式,如圖4-36所示。 日期 2011-1—1 結果 2014 2-0 公式 =DA TE(YEAR(A2)+3,MONTH(A2) +1,DAY(A2)+5) 說明給2011年1月1日加3年.! 個月和5天圖4-36 增減日期 DATEO)函式有三個引數,依次代表年、月、日,而且這三個引數是不可省略的。B2單元格中的公式“ DATE(YEAR(A2)+3,MONTH(A2)+1,DAY(A2)+5)”中“YEAR(A2)+3”代表年,含義為取A2的年份再加3年;月份為“MONTH(A2)+1”,即取A2的月份再加1個月;天數 “DAY(A2)+5”,即取 A2的天數再加5天。這四個函式的具體含義如下圖4-37所示。 89
>> 誰說菓鳥不會資料分析(入門篇) 公式金鑰 DATE(ycat,month,day):返回某指定日期。 YEAR(serial_number):返回某日期對應的年份。 返回以序列號表示的日期中 MONTH(serial_number)的月份,用整數1~12表示。 DAY(serial_number):盜回以序列景表示的日期的天數,用整數1 ~31表示。 圖4-37 公式金鑰—DATE, YEAR, MONTH和DAY函式 3. 用函式DATEDIF計算工齡 Mr.林:我們接著講最後一個函式—DATEDIF,下面用這個函式來計算工齡。在這次員工滿意度調查中,我們可以從不同工齡維度去分析,老闆可能想知道是不是工齡越高,員工的歸屬感越強。在這裡我們可以根據人事部檔案裡面的入職日期來提取工齡資訊,需要用到DATEDIF函數。DATEDIF函式就是計算兩個日期之間年/月/日的間隔數,詳細情況可見圖4-38。 公式金鑰 DATEDIF(start_ date,end date,unit):返回兩個日期之間的年/ ^ 月/日間隔數。 時間段內的、時間段內的起始口期,結束日糊。 Unit有Y/M/D/MD/Y M/YD六種形式: “Y指時何段中的整年數,“M”為整月數,D”為天數。 "MD” 為start_date 與end_date日明中天數的差,忽略日期中的月和年。 YM”為start date 與end date 日明中月數的差,忽略日朋中的日和年。 “YD”為start_date 與end_date日期中天數的差,忽略日期中的年。 圖4-38 公式金鑰——DATEDIF函式 Mr.林:小白,你這麼冰雪聰明,一定馬上領悟了DATEDIF的含義。我要考考你,下面來看看具體應用的例項,如圖4-39所示。 A 入取日期現在日期 B 2000 10-二 2010-11-7 1 2 3 4 5 90 工齡(年) 4年 =DATEDIF(B1,B2,"Y")&"年" 工齡(年月) 4年1月 =DATEDIF(B1,B2,"Y")&"年 “&DATEDIF(B1,B2."ym")&"月" 圖4-39 利用DATEDIF計算工齡小白:C4單元格的意思就是計算“2006-10-1”與“2010-11-7”年份之差,C5除了計算年第4章三心二意—資料處理份之差外還計算了月份之差,“ym”代表只考慮 “10”月與“11” 月的差距,不考慮年份。 4.3.3 資料分組小白不禁疲憊地打了個哈欠,Mr.林在腦子裡蒐羅了一圈,想找點有意思的事情給她提提神,於是問道:看過《命運來電轉駁》嗎? 小白:看過呀,我還記得電影裡面葛大爺的經典臺詞,比如:“給老婆打電話是大事。”“大哥,調查一下,你們家GDP是多少?”…• Mr.林:這個我也記得,後來他還給大頭彙報對村裡果樹的統計情況:“根據你的要求,我是這樣統計的,一共有48戶。40棵樹以上的,有5戶;30棵樹以上的,有10戶;20棵樹以上的, 有20戶”。葛大爺的彙報裡使用了資料分組,結論清晰明瞭,如圖4-40所示。 70 13 10 5 40棵樹以上 30~39棵樹 20~29棵樹 20棵樹以下圖4-40 某村種植紅果樹的農戶數分佈情況小白:哈哈!沒電的山村裡的村民都知道怎麼去統計,我也不能落後,快教我怎樣對資料分組吧! Mr.林:下面我們瞭解下Excel中是如何實現資料分組的,主要用VLOOKUP函式來實現。以圖 4-41所示的價格資料為例,現在需要對價格進行區間劃分,你可能想到用IF函式判斷某個價格是否納入某個區間,但是Excel對函式的巢狀有層數限制,Excel 97-2003版本最多可進行7層的巢狀,而Excel 2007-2010版本對函式巢狀可達64層。當你的價格分組的組數超過Excel函式巢狀層數限制時,用IF函式就不能一步到位了,而VLOOKUP函式卻能派上用場。 現在先看一下如何用VLOOKUP函式進行資料分組。 TSTEP 01 準備一個分組對應表,用來確定分組的範圍和標準,如圖4-41的右表所示。其中, “閾值”是指每組覆蓋的數值範圍中的最低值,例如圖4-41中第二組5-10元(5≤X <10),則閾值設定為5,其他閾值設定以此類推;“分組”記錄的是每一組的組名, 91
>> 誰說蘋鳥不會資料分析(入門篇) STEP 02 例如單元格A3的數值“0.4”對應E列中“0-5元”這組;“備註”記錄如何分組,目的是為了方便做資料處理的人員理解和識別。 在B2單元格中輸入“=VLOOKUP(A2.$D$2:$E$12.2)”,並將公式複製到B2:B21的資料區域即可。 B2 =VLOOKUP(A2,SDS2:SES12,2) 1 A 價格 B 價格分類 0-5元 C 闞值 0 0-5元 E F 分組備註 OsX<5 5≤X<10 12 13 14 15 16 17 18 19 20 21 36 26 12 4.9 5.01 15 18 2.56 27 19 50元及其以上 50元及其以上 45-50元 40-45元 40-45元 35-40元 25-30元 10-15元 0-5元 5-10元 15-20元 15-20元 0-5元 25-30元 15-20元 50 10-15元 15-20元 15≤X<20 20-25元 20≤X<25 25-30元 25≤X<30 130-35元 30≤X<35 [35-40元 K235≤X<40 40-45元 40≤X<45 45-50元 45≤X<50 50元及其以上 50≤X 圖4-41 利用VLOOKUP函式進行分組這裡VL0OKUP函式的應用與“資料提取”中有所不同,這裡VLOOKUP函式的最後一個引數 range_lookup(邏輯值)省略了,即在此處預設的是近似匹配。所以,單元格B2的公式不是在D 列中尋找0,而是尋找最接近A2,又不能大於A2的值,找到了單元格D2的值正好等於0,所以返回 D2的分組“0-5元”。現在明白了嗎? 小白若有所思地回答道:“最接近它又不能大於它”,再讓我琢磨琢磨這句話。例如單元格 A5(=5.5),閾值中最接近A5又小於或等於A5的值是單元格D2(=5),則對應的E2就是A5的分組 “5-10元”。現在明白了,用模糊匹配就能把小於或等於的值給識別出來,VLOOKUP函式可真神奇!呵呵。 92 4.3.4 資料轉換 Mr.林緩口氣,接著說:講完資料抽取、資料計算和資料分組這三大重頭戲,資料加工的內容就只剩下資料轉換了。這裡我主要想介紹兩個內容:資料表的行列互換;多選題幾種錄入方式之間的轉換。
第4章三心二意—資料處理 ◎ 資料表的行列互換小白:說到行列互換,我想起每次交給牛董的報表,都需要按照他的意思返工一次。例如上次,就像圖4-42上方的表格這樣,行列排版形式不合他口味,得重新顛倒來放,有沒有快捷一點的方式?我可不想再一個個單元格地貼上… Mr.林:呵呵,這種做法真的很—笨,我來教你一個一步到位的技巧:利用選擇性貼上。 選擇性貼上不僅可以解決轉置的問題,還可以選擇性地貼上格式、公式等,甚至還能選擇數值將它們批次變成負數,或者加/減/乘/除一個固定值。 小白迫不及待:這麼神奇?那趕緊看看吧! 姓氏蔩王謝王入孫名宇雅玲俊元麗秋炫皓>林職務銷售代表銷售副總裁銷售代表銷售代表銷售經理入職年份 2008 1996 2007 2010 2001 姓氏名字職務入職年份黃雅玲銷售代表 2008 王俊元銷售副總裁 1996 謝麗秋銷售代表 2007 炫皓銷售代表 2010 孫林銷售經理 2001 圖4-42 行列互換 Mr.林:複製好資料區域後,有三種方式可用來進行選擇性貼上。 第一種,在“開始”選項卡上的“剪貼簿”組中,單擊“貼上”按鈕吧,然後單擊“選擇性貼上”選項。 第二種,你也可以使用鍵盤快捷方式,按“Ctrl+Alt+V”快捷鍵會彈出如圖4-43所示的對話框,再勾上“轉置”核取方塊,即可實現轉置貼上。 選擇性貼上 2× 粘阽 ◎全部() 我的快捷鍍: Ctrl+AIt+V 〇公式® 〇數值C) ◎ 格式() ◎批註(C) • 有效性驗證OD 〇所有使用源主題的單元 C1) 〇邊框除外) 〇列 (H) 〇公式和數格式(B) 〇 值和數字格式 CD) 所有合併森件格式(G) 運算 ◎無©) ◎加① 〇乘() 〇除g) 〇減() 口跳過空單元 () 枯貼鏈探口回封置Q 確定取消圖4-43 選擇性貼上 93
94 >> 誰說菜鳥不會資料分析(入門篇) 還有第三種方式,可以直接將資料貼上在其他區域,這時在貼上區域的右下角會顯示“粘貼”的下拉選單唿(Ctr),單擊下拉選單,選擇2可實現轉置貼上,如圖4-44所示。 在這裡,我再簡單介紹一下其他常用的選擇性貼上功能,如圖4-45所示。 吧 (Ctrl) 貼上貼上數值其他貼上選項 % 專案數值公式功能可以去除公式、格式等只貼上公式,使用時需注莓絕對地址的應用不用重新設定格式、對複雜格式發格式為適用,相當子格式刷將複製區域的內容與貼上區域的內益算區域容進行算木結合、 圖4-44 貼上下拉選單圖4-45選擇性貼上功能列表在“運算區域”裡還有“加”“減”“乘”“除”四個選項,選擇“加” 即將複製區域中的值與貼上區域中的值相加;“減”即從貼上區域中的值減去複製區域中的值;“乘”“除”照此類推。例如,我們想在部分單元格數值前加上負號,可以另取任意單元格,輸入“-1”,再選擇性貼上 “乘”到想變號的數值區域,則該區域數值全部變成了相反數。 ◎ 多選題錄入資料方式之間的轉換 MT.林:小白,接著來介紹資料轉換的另一個方面的內容。還記得多項選擇題的兩種錄入方式嗎?我們先來回顧一下。沒第一種,各種選項用0和1表示該選項是否被選擇錄入,就是前面說的二分法。這種方法錄入資料的時候比較煩瑣,效率低下,而且容易出現錯誤,但是在資料分析的時候相對簡單,所以一般進行資料分析時採用二分法錄入的資料表。 第二種,直接錄入選項的程式碼,也不用找對應選項直接錄入,就是前面說的多重分類法。這種方式的錄入速度會高很多,畢竟現在的人工成本也是蠻高的,而且對出報告的時間與執行時間的要求也蠻緊,但與第一種方法比較,第二種方法最大的缺點就是只能在SPSS裡分析資料,若在 Excel裡分析則相對麻煩很多。 所以在這裡介紹一種方法,將多重分類法錄入的資料轉為二分法錄入的資料,這樣既能節省資料錄入時間,又方便在Excel中分析。 小白故意拉長了聲調:兩全其美,呵呵,所以,這個必須有! MI.林:以圖4-46為例,圖左邊多重分類法下面的“選項一”“選項二”“選項三”代表多選題中選擇的三個選項,例如某被調查者選的是A、B、C,則B2:D2的單元格中分別輸入1-2-3, 也可以輸入1-3-2,2-3-1,2-1-3,3-1-2,3-2-1,發現沒有?只要保證把1、2、3這三個選第4章三心二意—資料處理項都塞在“選項一”“選項二”“選項三”這三個空格中就行了,至於你順著放、倒著放、顛三倒四地放,怎麼放都沒有關係。 ABC DEFGHI 多重分類法二分法 2 3 4 5 6 7 8 9 10 11 12 選項一選項二選項三 2 3 2 3 3 5 4 ABCDE 1 1 0 0 0 0 FO=IF(ISNUMBER(HL OOKUP(1,85:D5,1,0)),1.0) H5=IF(ISNUMBER(HLOOKUP(3,B5 D5.1,0)), 1.0) J5=IF(ISNUMBER(HL OOKUP(5.B5 D5,1.0)),1,0) 圖4-46 將多重分類法錄入的資料轉換二分法錄入的資料公式“F5=IF(ISNUMBER(HLOOKUP(1,B5:D5.1.0)).1,0)” 裡面包含兩個沒有介紹過的函式,一個是 HLOOKUP函式,另一個是ISNUMBER函式,我們先看看它們的含義及用法。 小白好奇地問道:HLOOKUP函式怎麼跟VLOOKUP長得這麼像? Mr.林:看來你還沒忘,HLOOKUP函式和VLOOKUP函式都是查詢函式,只不過VLOOKUP是按列查找,而HLOOKUP是按行查詢。HLOOKUP中的H代表“行”,它的用法也與VL0OKUP函式非常相近,如圖4-47所示。 公式金鑰 HLOOKUP匹配函式:在表格的首行查詢指定的資料,並返回指定的資料所在列中的指定行處的單元格內容。 HLOOKUP(lookup_value, table_array, col_index._num, range lookup) 個要在表格或區域的第一行中查詢的值,其整數可以是信或引用。 包含資料的單元格區域,可以使用絕對必基要域名稱的引用。table array 第一行中的偵是由 lookup_value搜尋的值。這些值可以是文字。 數字或沒輯但。 希望返回的匹配值的行序號,其引數為1時,返回 table_array 第二紅中的位: 引數為2時,返回 table_array 第二行中的值, 依此類推。 近似匹配(2)還是精確匹配(0) 圖4-47 公式金鑰 -HLOOKUP函式 95
>> 誰說菜鳥不會資料分析(入門篇) 96 我來解釋一下“HLOOKUP(1.B5:D5.1.0)”的含義:在B5:D5區域的第一行中查詢數值1,找到該數值所在列,再返回該列所對應的單元格區域的第一行資料,並要求精確匹配,也就是必須找到 1,如果找不到1,則返回“#NA”。ISNUMBER函式就更簡單了,小白,你用英語翻譯一下,看看是啥意思? 小白:Is Number,是數值嗎? Mr.林:是的,如果是數值則代表HLOOKUP找到了指定數值, ISNUMBER(HLOOKUP(1,B5:D5,1,0)) 就返回TRUE,否則返回FALSE。還記得IF函式吧,這可是最重要、最常用的函式呢。 小白:記得!“F5=IF(ISNUMBER(HL0OKUP(1.B5:D5.1.0)).1.0)”的意思是,如果ISNUMBER返回的是TRUE,則單元格F5返回1,否則返回0。 小白再想了想:哦,我明白了,整體來看公式的意思是這樣的,因為選項A的錄入編碼是1,所以我們在B5:05區域中查詢有沒有1,有的話則在A下面標記1,代表選擇了A;沒有的話標記0,代表A選項沒有被選。所以,我們在查詢有沒有選C的時候需要查詢3,即將 “HLOOKUP(1,B5:D5.1,0)” 改成 “HLOOKUP(3,B5:D5.1,0)",就像圖4-46中H5單元格中的公式那樣。 Mr.林:Bingo!看來我都不用解釋了。小白,還有一種很普遍的錄入方式,就是將多重錄入法的“選項一”“選項二”“選項三”全部錄入到一個單元格中。 例如某一被調查者選的是ABC,則在一個單元格內輸入123,如圖4-48中的B2單元格所示。 這樣做的好處是,省掉了輸入Tab鍵的麻煩,並且也不用預留足夠多的選項列。同樣,缺點就是不好進行輸入錯誤的檢驗和資料分析。所以,下面我就介紹將其轉化為二分法錄入資料的方法。 如圖4-48所示,E4單元格的公式“=IF(ISNUMBER(SEARCH(“1",B4)).1.0)”與我們之前講的多重分類法轉換為二分法的公式只有一個地方不同,就是HLOOKUP函式被SEARCH函式代替。其實,這裡很好理解,SEARCH就是查詢的意思,SEARCH("1”,B4)是指在B4單元格的字串中查詢1,如果找到了,則ISNUMBER返回TRUE,E4單元格顯示“1”代表A選項被選;否則,顯示“0”,代表未選擇A。SEARCH的用法如圖4-49所示。 A B C D E F G H 題6 A BCDE 2 123 1 1 0 0 3 135 1 4 234 1 1 5 6 E4=IF(ISNUMBER(SEARCH(1",B4),1.0) 7 8 9 G4=IF(ISNUMBER(SEARCH(3 B4)), 1,0) 10 M=IF(ISNUMBER(SEARCH("5",B4)),1,0) 11 圖4-48 另一種多重分類錄入法轉換為二分錄入法第4章三心二意—資料處理公式金鑰! SEARCH(find text, within text, start_ num):返回指定的字串在原始字串中首次出現的位置。 要查詢的文本字串。 要在哪一個字串查詢。 從within_tex第幾個字元開始查詢。 注意: 在find_text中,可以使用萬用字元,例如:問號“?”和星號“*”。其中問號“?”代表任何一個字元,而星號:“*”可代表任何字串。如果要查詢的字串就是問號或星號,則必須在這兩個符號前加上“~”符號。 圖4-49 公式金鑰——SEARCH函式 4.4 資料抽樣 Mr.林:關於資料處理的課程接近尾聲了,小白,興奮吧?最後我要講的內容是資料抽樣。 小白:是不是就是跟問卷調查相關的?做問卷調查可是每個公司都要遇見的麻煩事兒。 Mr.林:呵呵,是的。我們最常見的調查方式主要有兩種,普查和抽樣調查。 普查是指對總體中的物件—一進行觀察、訪問與記錄,確定資料。例如,人口普查就是一個典型例子。用腦子想想就知道普查又耗時又耗力還耗錢,所以在企業中一般都用抽樣調查。 抽樣調查是指從調查物件總體中按照隨機原則選取一部分物件作為樣本進行調查分析,以此推論總體狀況的一種調查方式。在資料抽樣中,就只給你介紹一個RAND函式,如圖4-50所示。 公式金鑰: RAND()函式: 返回[0,1]的均勻分佈隨機數,而且每次計算工作表時都將返回一個新的數值。 如果在編輯欄中輸入“=Rand(”後,保持編輯狀態,按“F9”鍵, 則生成的隨機數將永遠儲存,不再返回新的數值。 圖4-50 公式金鑰——RAND 小白馬上接道:哈哈!Only One呀!難道這個RAND()函式只能返回0~1之間的數,要是我需要返回大於1的數,例如隨機抽取60~70之間的數怎麼辦呢? Mr.林:這個簡單!若要產生60~70的隨機數可以寫成公式“=RAND()*10+60”,要取整的話可以用公式“=INT(RAND()*10+60)”。我解釋一下,“RAND()*10” 就是將RAND()區間擴大了10 倍,即從[0.1]擴大到[0.10],再加上60,則變成[60.70]了。你不明白也沒關係。我用資料學語言表述一下,你記住就行了: 97
>> 誰說菓鳥不會資料分析(入門篇) a、b分別代表兩個數字,其中a<b,若要生成a與b之間的隨機實數,可以用公式 "=RAND() ×(b-a)+a"。 再以我們這次的員工滿意度調查為例,公司總共有5500名員工,如果這次員工滿意度調查, 牛董想節省成本,只抽取1000名員工進行調查來推測總體員工的滿意度,則可進行如下操作。 STEP 01 將員工管理檔案中的員工編號提取出來,在這裡我們貼上到B列,滑鼠選中B3單元格, 單擊“檢視”一“凍結窗格”。 STEP 02 在A列生成序號,在單元格AI中輸入1,A2中輸入“=A1+1”,再將A2的公式複製貼上到A3:A5501區域,則生成了不重複的序列號,如圖4-51所示。 STEP 03 在D列中隨機生成1000個1~5500的序號,在單元格D2中輸入公式 “=INT(RAND()*5500)”,將D2的公式複製貼上到D2:D1001的單元格中,即生成1000個隨機數,再將生成的隨機數複製並選擇性貼上成數值,如圖4-52的D列所示。 STEP 04 把D列的隨機數看作隨機生成的序號,參照A、B列,將隨機數所對應的員工編號匹配到E列中。操作方法是在E2中輸入公式 “=VLOOKUP(D2.$A:$B.2.0)”並將公式複製到 E3:E1001單元格區域中,即生成隨機抽取的員工編號,如圖4-52所示。 E2 =VLOOKUP(D2,SA:5B,2,0) C C 1 2 5493 5494 5495 5496 5497 5498 5499 5500 5501 5502 序號 1 5492 5493 5494 5495 5496 5497 5498 5499 5500 B 員工編號 A776477 A651404 A286867 A257527 A596125 A941753 A468011 A955927 A789052 A414967 2 993 994 995 996 997 998 999 1000 1001 1002 序號 1 992 993 994 995 996 997 998 999 1000 1001 Sheet! 員工編號 A776477 A423984 A682241 A573755 A735102 A991852 A244296 A680686 A579535 A306132 A598547 隨機數 3962 4152 2389 447 1985 2571 1201 3443 4191 3569 E 抽樣 A909476 A980860 A877997 A629874 A972333 A722151 A145386 A186512 A265405 A958322 Sheetl 圖4-51 生成不重複的序號圖4-52 隨機抽取的員工編號 STEP 05 最後只需要對隨機抽取出來的員工編號進行去重,再用同樣的隨機抽樣方法,湊足 1000名不重複的員工編號,對每一個抽取的編號所對應的員工進行調查即可。 聽Mr.林講完最後一步,小白如釋重負:哇,資料處理還真不簡單!都快把我最後一點精力榨乾了。 4.5 本章小結 Mr.林附和道:也快把我最後一點口水榨乾了!小白,還沒完呢,我們要修煉一顆平常心, 98 不能有浮躁敷衍的心理喔。最後,我們再來回想一下今天的內容。