AI 新聞與投資
誰說菜鳥不會數據分析 入門篇

第2章 結構為王—確定分析思路

3 / 9

公司業務分析產品 [ 價格渠道國公司提供什麼產品或服務?哪個產品銷蟹最好? •與使用者賞求是否一數? 購買產品的使用者都是些什麼人? 公司銷售收入怎樣?盤長?減少? •使用者接受的合理價格是多少? •使用者購買支付方式是怎樣的? 公司在各地區有多少銷售桑道? 是否未覆蓋到或嚴蓋率較低? •使用者透過何種渠道購買? •使用者在各個地區的構成怎樣? 公司的桑道政策是舌有吸引力? 投入多少促銷資源?效果如何? 促銷投放多少宣傳廣告?效果如何? 圖2-9 4P營銷理論在公司業務分析中的應用 2.2.5 使用者行為理論 Mr.林:網站分析的發展已經較為成熟,有一套成熟的分析指標。比如IP、PV、頁面停留時間、跳出率、回訪者、新訪問者、回訪次數、回訪相隔天數、流失率、關鍵字搜尋、轉化率、登錄率,等等。遇到這麼多指標,所有的指標都要採用嗎?什麼指標該採用?什麼指標又不該採用?各指標之間有何聯絡?哪個指標先分析?哪個指標後分析? 小白做暈菜狀:這麼多問題!不行了,徹底暈了! Mr.林:所以我們需要梳理它們之間的邏輯關係,比如利用使用者使用行為理論進行梳理。小白,這就是我們要學習的另外一個理論,即使用者使用行為理論,也是非常實用的資料分析指導理論之一。 使用者使用行為是指使用者為獲取、使用物品或服務所採取的各種行動,使用者對產品首先需要有一個認知、熟悉的過程,然後試用,再決定是否繼續消費使用,最後成為忠誠使用者。使用者使用行為的完整過程,如圖2-10所示。 認知使用忠誠熟悉試用圖2-10 使用者使用行為的軌跡示例圖現在我們可利用使用者使用行為理論,梳理網站分析的各關鍵指標之間的邏輯關係,構建符合 47

48 >> 誰說菜鳥不會資料分析(入門篇) 公司實際業務的網站分析指標體系,如圖2-11所示。 使用者行為軌跡使用者的網站行為認知網站訪間阿站瀏覽熟悉站肉搜尋網站分析指標 IP.PV.人均貞面訪問量、訪間來源平均停留時長、跳出蜜、貞面偏好披索訪向次數佔比試用使用忠誠使用者註冊使用者登入使用者訂購使用者黏性使用者流失註明使用者數、註明發化蜜登入使用者數、人均登入、訪問登入比訂購量、訂購頻次、內容、賀化室回訪春比蜜、訪問深度使用者流失數、流失率圖2-11 使用者使用行為理論在網站分析中的應用 Mr.林:小白,這個方法同樣需針對具體問題再具體分析,靈活運用,此處就不再贅述了。 小白:好的。 2.3 本章小結 MI.林緩了緩,接著說:我們前面講解了的幾種資料分析方法論,你可以根據實際情況選擇所需的方法論。下面和昨天一樣,我們一起作個簡要的回顧。 * PEST分析理論主要用於行業分析。 * 4P分析理論主要用於公司整體經營情況分析。 * 邏輯樹分析理論可用於業務問題專題分析。 * 使用者行為理論的用途較單一,就是用於使用者行為研究分析。 * 5W2H分析理論的用途相對廣泛,可用於使用者行為分析、業務問題專題分析等。 當然,這些方法論也可以相互巢狀使用。例如,用邏輯樹分析法搭建分析框架,而下一層級的問題可以從4P的角度分析,也可以用5M2H法分解問題。記住根據實際情況靈活選擇使用,切勿生搬硬套。 方法論不限於剛才介紹的幾種,除此之外,還有金字塔法、生命週期理論等,對於這些方法的應用,需要你根據自己所在的行業特徵在實踐中摸索,前提是需要了解行業知識、公司業務, 以及相關的營銷管理模型,只有把它們有機地結合使用,才能指導資料分析工作有序開展,才能確保資料分析結果具有指導意義。 小白:太棒了,經您這麼一介紹,理論指導實踐不再那麼飄渺虛幻,再多多複習,我就可以自己“設計服裝圖紙”了。

第 3章無米難為巧婦——資料準備部倪東海提理解資料資料來源資料! PPT! 報: 表. R. 杯!幫幫找呀

50 >> 誰說菜鳥不會資料分析(入門篇) 這一天小白被牛董責備做事效率低,整理一份報表都要折騰個半天,十分鬱悶。她還記得牛董丟下的最後一句話:“現如今是資料、報表、PPT滿天飛的商業時代,不懂資料怎麼混?有空你去跟Mr.林學學怎麼整資料!” 調整好情緒,小白就奔著Mr.林的辦公桌來了:今天牛董特意讓我來向您請教如何玩轉數據。不知道您是否有時間指點指點我? Mr.林爽快地答應了:沒問題呀!不用說“請教”,太客氣了。我們就繼續一起來聊聊資料吧!俗話說“巧婦難為無米之炊”,小白,你應該聽過這句諺語吧? 小白不解:聽過啊!怎麼啦?這跟我們的資料分析有啥關係? Mr.林:不僅有關係,而且它們的關係密切著呢! 首先,資料就好比諺語中的“米”。做資料分析必須要有資料吧,從一開始的資料收集、數據處理、資料分析都離不開資料;而做飯呢,同樣先要買米,洗米,然後煮米飯,你看看資料和米在資料分析和做飯的流程中作用類似吧! 其次,資料分析師就好比要做飯的小媳婦。資料分析師要對資料進行分析,小媳婦在家就要做飯咯! 最後,資料的處理與分析就好比煮米飯。做飯需要炊具,做資料分析也要有分析工具。我們這裡選擇最大眾的工具—Excel,它是學習和工作中最常見的辦公軟體之一,而且非常容易掌握,所以後續我介紹的資料處理、分析相關的操作都用它來完成。 小白興奮地說道:經你這麼一說,它們的關係還真是非常密切,現在我對資料分析的瞭解又進了一步。資料分析就好比婚姻一樣,外面的人看著甜蜜、浪漫、風光,可裡面的人才知道都是些柴米油鹽醬醋茶的瑣碎事兒。 Mr. 林:對!小白你還沒結婚咋就有這麼大的感觸?呵呵。 小白頓時羞得臉上紅雲陣陣。 Mr.林接著說道:今天,我們學習以下知識。 * “米”的構造、種類和要求—理解資料。 * “米”從哪裡來—資料來源。 小白精神抖擻地說:好! 3.1 理解資料 Mr.林:紮實的資料分析基本功不單是指會使用資料分析工具,更重要的是對資料有深入認識和解讀。很多人一開始並不能夠清晰地認識到資料分析對資料有什麼要求。正是因為如此,從事資料分析相關工作時,才會有比較迷茫、無從下手的感覺。因此,對資料的理解是資料分析的第3章無米難為巧婦—資料準備一個重要前提。 小白:被你說中了,我現在還真不知道資料到底長什麼模樣? Mr.林:那好,千里之行始於足下,我們現在就來看看資料都長什麼模樣。 3.1.1 欄位與記錄 Mr.林:小白,你剛從學校走進社會,就用一個你最熟悉的例子吧。先回想一下學生時代老師手裡那份成績表,裡面不僅能看到自己的成績,還能看到其他同學的成績,以及整個學期的總分。回想一下這份成績表是不是如圖3-1所示的這樣。 小白:成績表都差不多這樣啦。 醫號姓名性別海文數學英語|總分總評 1 趙幣男 89 85 2 郭南文 90 88 楊洋男 75 75 95 78 273 228 優秀及格圖3-1 某學期學生考試成績表 Mr.林:在這份成績表裡,從橫向看,每一行都是同學的基本情況和成績;從縱向看,每一列都描述了一類資料,例如第3列是每位同學的性別資料,第4列是每位同學的語文成績,等等。 這樣的成績表從資料分析的角度來看,就是一個典型的資料庫。成績表最上面的“學號”“姓名”“性別”“總分”等被稱為欄位,欄位是資料庫中的說法,而每位同學的基本情況和成績就構成了一條一條的資料記錄,如圖3-2所示。 字級記錄 1趙粉 2 郭南 3 楊洋男 4 中天| 5 鄧柏涵女 258 良好 75 82 95 78 228及格 70 230| 及格 253 良好圖3-2 某學期學生考試成績表(欄位與記錄) 從資料分析的角度來理解欄位和記錄的概念: * 欄位是事物或現象的某種特徵。比如成績表中的“學號”“姓名”“總分”等都是字段,在統計學中稱為變數。 * 記錄是事物或現象某種特徵的具體表現。比如成績表中的“性別”可以是男或女,“總分”可以是273或者230等,記錄也稱為資料或變數值。 51

>> 誰說菜鳥不會資料分析(入門篇) 小白:明白了,原來資料需要由欄位與記錄共同組合而成。 3.1.2 資料型別 Mr.林:小白,看完成績表,我們再來看下一個例子,職工資訊表,如圖3-3所示。你來看看,表中的資料大概可以分為幾種型別? 員工號姓名性別部門入職日期工齡 A00006張川 A00431趙四 A07520 王二 A01402 週五男男女女 IT部 1970-06-20 市場部 1962-07-14 設計部 1979-12-31 開發部 1974-12-01 17 25 18 13 A02700田七銷售部 1978-12-29 A09943李九後動部 1999-03-20 圖3-3 職工資訊表小白:我瞧瞧,有數字、文字、日期,差不多就這三類吧。 Mr.林:對!我們最常用的資料型別就是你說的這三類,當然還有貨幣、時間等其他資料類型。有一個方法可以知道資料到底有多少型別,就是在Exce1中用單元格格式檢視所有的資料類型,操作步驟如下; STEP 01 選擇Excel中的任意一個單元格,單擊滑鼠右鍵,在彈出的選單中選擇“設定單元格格式”,會出現“設定單元格格式”的對話方塊,如圖3-4所示。 STEP 02 在這個對話方塊中,可以看到各種不同的資料型別,比如:數值、文字、日期、貨幣、 會計專用、時間、百分比、分數、科學計數、特殊等。 設霍單元格格式數子對齊| 宇體邊椎填充保護示例常規單元格格式不包含任何特定的數字格式。 科學記數自定義確定取消 52 圖3-4 “設定單元格格式”對話方塊第3章無米難為巧婦——資料準備 Excel中雖然有這麼多資料型別,但最終都可以歸結為兩大類。 ◎ 字元型資料字元型資料是不具有計算能力的文字資料型別。它包括中文字元、英文字元、數字字元(非數值型)等字元。例如前面成績表中的“姓名”“性別”“總評”三個變數均為字元型資料,職工資訊表中的“員工號”“姓名”“性別”“部門”四個變數均為字元型資料。 ◎ 數值型資料數值型資料是直接使用自然數或度量單位進行計量的數值資料。例如成績表中的“語文”“數學”“英語” 三科成績彙總即得到“總分”這個欄位,而職工資訊表中,可按“入職日期”計算工齡,這些資料就是數值型數值。對於數值型資料,我們可直接用算術方法進行彙總和分析,這一點是區分資料是否屬於數值型資料的重要依據。 3.1.3 資料表 MI.林:小白,剛才介紹了欄位與記錄,還有資料的型別,我們現在就來看看由欄位、記錄和資料型別構成的資料表。資料分析所需要的資料表,也是有一定要求的。 一張資料表的製作,可以側面反映出製作者的資料沉澱及應用水平。如果資料表裡的合併單元格較多,設計不合理,這基本屬於為了滿足一時之需的資料表,並不符合資料分析的要求,沒有為後續資料分析做長遠考慮與規劃。 所以千萬別忽視基礎資料表格的設計,資料表的設計是否合理,關係著後期資料分析的效率及深度。資料表設計具體要求如圖3-5所示。 序號要求! 資料表由標題行和數招部分組成 2 第一行是表的列標題(欄位名),列標題不能重複 3 第二行超是數招部分,數招部分的每一行敬招稱為一個記錄,並且資料部分不么許出現空白行和空白列 4 資料表中不能有合併單広格存在資料表與其他資料之間應該留出至少一個空白行和一 5 個空白列資料表需要以一維的形式儲存,但是在實際操作中按 6 觸的資料往往是以二維表格的形式存在的,此時應將,二維表豬化為一維表的形式儲存數報圖3-5 資料表的設計要求小白仔細閱讀完,問道:什麼是一維表,什麼是二維表? 53

>> 誰說菓鳥不會資料分析(入門篇) Mr.林想了想,快速地在Excel中做了兩個表:你看我剛剛繪製的圖3-6,是我國五省 2006~2008年的國內生產總值(GDP)的一維表與二維表。這兩個表有什麼區別? 小白分析道:左邊的二維表中,北京在2006年的GDP是7861;右邊的一維表中“地區”為北京,“年份”為2006,對應的GDP是7861。哦,我知道了!一維表的列標籤是欄位,而且表中每個指標就對應一個取值。例如圖3-6中的一維表的第一行,“地區”對應的是北京,“年份”對應的是2006,GDP對應的是7861。而二維表的列標籤是資料:2006年、2007年、2008年,將一維表中的所有年份真實值都放置在列標籤裡了。 二維表一維表地區2006年2007年2008年北京 7861 9353 10488 上海 10366 12189 13698 山東 22077 25966 31072 廣東 26160 31084 35696 浙江 15743 18780 21487 地區年份 GDP 54 浙江浙江浙江 2007 2008 18780 21487 圖3-6 一維表與二維表 MT.林:嗯,你說的差不多,基本上是這樣。我來完善一下,這裡的“維”指的是分析資料的角度,2006年、2007年、2008年,從資料的角度來說,應該都是“年份”的範疇,是描述各省 GDP的一個因素,若要換成一維表,則應該使用同一個欄位,將年份單獨作為列標籤。這是區分左邊的“二維表”和右邊的“一維表”的關鍵所在。 小白繼續問道:怎樣操作才可以將二維錶轉化為一維表呢? Mr.林笑道:嘿嘿!我料定你會問這個問題。我們現在就以圖3-7中的二維表資料為例,看看如何利用資料透視表進行二維表到一維表的轉換。 A B C D 1地區|2006年2007年2008年北京 7861 9353 10488 3 上海 10366 12189 13698 4 山東 22077 25966 31072 廣東 26160 31084 35696 浙江 15743 18780 21487 圖3-7 二維表資料示例在轉換過程中我們要用到資料透視表中的“資料透視表和資料透檢視嚮導”功能,Excel 2007與2010版本並沒有在選項卡中直接給出該功能,需要我們自己把它給請出來。採用“新增功第3章無米難為巧婦——資料準備能選項”方式,就能把“資料透視表和資料透檢視嚮導”功能新增至選項卡中。 二維錶轉換為一維表的具體操作如下。 STEP 01 先新增“資料透視表和資料透檢視嚮導”功能。單擊“檔案”選項卡一“選項”一“自定義功能區”。在“從下列位置選擇命令”中選擇“不在功能區中的命令”,找到“資料透視表和資料透檢視嚮導”並選中,在“自定義功能區”選擇“主選項卡”,在“資料” 主選項卡下面新增“新建組”並選中它,再單擊“新增”按鈕,即可把“資料透視表和資料透檢視嚮導”新增到“資料”主選項卡的“新建組” 中,如圖3-8所示。 STEP 02 單擊剛新增好的“資料透視表和資料透檢視嚮導”圖示,會彈出如圖3-9所示的對話框,在資料來源型別中選中“多重合並計算資料區域”,並單擊“下一步”按鈕。 效據透祝表和效據透祝圖向號沙界1(共3步)? 請指定待分析資料的數幫源奕型 O Microsoft Office Excel 資料列表或效指庫 () ◎外部數死源Q) ◎ 重合並計算數期區域◎] 麼檢視C 所建立的報表型別: ◎數招透視表 〇數菇透檢視(及透視表)G) 資料遠視表和資料憑視園嚮導新違組取捔下步Q)〉 亮成 () 圖3-8 “資料透視表和資料透檢視嚮導”圖示圖3-9 資料透視表和資料透檢視嚮導——步驟1 其實要開啟資料透視表和資料透檢視嚮導,還有更簡單快捷的方式——使用快捷鍵 “Alt+D+P”。先按 “Alt+D”組合鍵,然後鬆開,再按字母鍵“p”,即可開啟“資料透視表和資料透檢視嚮導”對話方塊。 STEP 03選中“建立單頁欄位”,並單擊“下一步”按鈕,如圖3-10所示。 致據透祝表和資料透祝圖嚮導—步取2a(共3步)2兇包建的資料 1工作表的表型臺俾思零島至企或。 域,也可! 包含多達四個頁宇段。 請指定所需的頁欄位數目: ◎固建單頁學段C】 〇 自定義頁宇段() 圖3-10 取消下 CD>(完成) 資料透視表和資料透檢視嚮導——步驟2a 55

>> 誰說菓鳥不會資料分析(入門篇) STEP 04 在“選定區域”項中選擇整個二維表的資料區域“二維表!$A$1:$D$6”,單擊“新增” 按鈕,並單擊“下一步”按鈕,如圖3-11所示。 效據透視表和資料適祝圖嚮導— 步2b• 國區請鍵入或選定包含彙總資料的工作表資料區域。 選定區域 (B): 新增()[冊除①2)[瀏覽().. 所有區域(L): STEP 05 STEP 06 56 取消 〈上一步③) 下一 Q)〉 完成) 圖3-11 資料透視表和資料透檢視嚮導——步驟2b 在“資料透視表顯示位置” 選擇“新建工作表”項,然後單擊“完成”按鈕,如圖 3-12所示,即可完成資料透視表的建立。建立的資料透視表如圖3-13的左邊所示。 效據透祝表和資料透祝圖嚮導 3(共3步) 12區資料透視表顯示位置 ◎謝建工作表CD 現有工作表(3) 單擊“完成”按鈕建立資料透視表。 選項(0) 取消下一步> 完成() 圖3-12 資料透視表和資料透檢視嚮導—一步驟3 頁1 B (全部) q D 數務選復表宇受発表選擇要新增到授賽的欄位: 3 和頂:(量列標籤 • 4 行標籤•2006年 2007年 5 北票 7861.04 9353.32 6廣東 26159.52 31084.4 7山東 22077.36 25965.91 8 上海 10366.37 12188.85 浙江 15742.51 18780.44 10總計 82206.8 97372.92 11 12 13 14 2008年 10488.03 35696.46 求和瞋:值查:35696.46| 行廣東孫:2008年總汁 27702.39 92940.38 79115.33 36253.37 56009.87 292021.34 回位回頁: 在以下區坡回拖動欄位 Y 報表高近列標籤頁! 行粽錠 • 數值求和項:宜擼沢粉屬鄆虧圖3-13 初步完成的資料透視表在“資料透視表欄位列表”窗格中,取消對“選擇要新增到報表的欄位”列表中的 “列”和“行”欄位的勾選,即將“列”和“行”前面的鉤號“V”去掉。或用鼠第3章無米難為巧婦—資料準備 STEP 07 標拖動法,將列標籤裡的“列”及行標籤裡的“行” 拖回至“選擇要新增到報表的欄位”列表中,如圖3-13右邊“資料透視表欄位列表”窗格中的箭頭所示。經過 “行”“列”欄位移除整理後的資料透視表如圖3-14所示。 雙擊圖3-14中所示的B4單元格(唯一的彙總資料),Excel會自動建立一個新工作表, 並基於原二維表資料來源生成新的一維表,如圖3-15所示。 A B C 行列 2 北京 2006年 7861.04 3 北京2007年 9353.32 北京 2008年 10488 上海 2006年10366.4 2007年 12188.9 山東2006年 22077.4 D 頁1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 項1 A 頁1 B (全部) 2 3 求和項:值彙總彙總 292021.3 14 15 16 浙江浙江浙江 2006年 2007年 2008年 15742.5 18780.4 21486.9 圖3-14 移除行和列標籤的資料透視表圖3-15 由資料透視表生成的一維表此外,直接雙擊圖3-13所示表中的最後一個單元格E10也能達到同樣的效果。最後,把資料表的列標題(欄位名)改為相應的欄位名稱即可。 小白驚訝地說:好神奇呀! Mr.林笑道:這裡先簡單介紹資料透視表的二維表到一維錶轉換功能,關於資料透視表的具體功能等講到資料分析工具時再為你介紹。 小白:好的,資料透視表真是強大。 3.2 資料來源 MT.林:小白,剛才我們已經介紹了資料特點及要求,下面就來介紹如何獲取資料。獲取數據的方式可以分為兩種:匯入外部資料和自己錄入資料,我們先說說匯入外部資料吧。 小白:好的。 3.2.1 匯入資料 Mr.林:匯入的外部資料最常見的來源有兩種:文字和網站資料來源。文字資料是比較常見的資料來源,所以,我先教你如何將文字檔案匯入Excel。 57

>> 誰說菜鳥不會資料分析(入門篇) ◎ 匯入文字資料在員工滿意度調查中我們有一份文字型的“問卷錄入結果”檔案,現在以匯入這份檔案為例,實踐一下匯入文字資料的具體操作。 STEP 01 滑鼠單擊“資料”選項卡,選擇“自文字”選項,Excel會自動彈出相對應的對話方塊。 STEP 02 找到儲存的“問卷錄入結果.txt”檔案。 還有一種方式是,在“檔案”選項卡中,選擇“開啟”選項,Excel會自動彈出對話方塊, 在“檔案型別”中選擇“文字檔案”,然後,從要開啟的文字檔案所在位置開啟“問卷錄入結果.txt”檔案。此時,將會彈出“文字匯入嚮導”對話方塊,如圖3-16所示。 文字匯入嚮導一第1步,共3炒文字分列內導判定您的數亮具有分隔符。 若一切設定無誤,請單擊“下一步”,否則請青選擇最合適的數死型別。 原難數賣盤請選撣量合酒的攻件炎盤 ◎份和符號四)-用分糯字元,如逗號或符分𧂈𧏿個芋段 ◎固定寬度 ()- 毎列芋段加空格對齊子入超難行 (B): 檔案原始格式(2): Tindes (AIST) 預覽檔案 C:WDocuents und Settines! 幾序號司齡年齡性別最高學歷崗位類別崗位層級 2 IAAACEE 32ACABEP IBACACFE ator\桌面\問卷錄, 下 002」[売成) STEP 03 圖3-16 文字匯入嚮導-第1步在圖3-16所示的對話方塊中有兩個選項“分隔符號”和“固定寬度”。如果文字檔案中的列標籤以製表符、冒號、分號、空格或其他字元分隔,則選擇“分隔符號”;如果你想自己設定每列分隔的具體位置,則選擇“固定寬度”。由於我們的文字資料是以 Tab鍵分隔的,所以這裡選擇“分隔符號”,單擊“下一步”按鈕,得到如圖3-17所示的對話方塊。 文字匯入向一第2多,共3少讀設定分充激鬆所包含的分隔符號,在預現視窗內可看到分乳的效果。 分稨符號 [aTeb 糖① 口分號①) 口迎號©) 口連續分福符號視為單個處理 (8) 文字識別符號 @): 口空格 ⑤) 口其他©): 資料預覽 () 序號司的年齡性別最高學歷崗位類別崗倥層級 E 58 取癆圖3-17 文字匯入嚮導-第2步売成()

第3章無米難為巧婦—資料準備 STEP 04 如圖3-17所示,有Tab鍵、分號、逗號、空格的分隔符可供選擇,如果分隔符是其他字符,則選中“其他”核取方塊,然後在後面的文字框中輸入字元。在這裡我們選擇“Tab 鍵”,單擊“下一步”按鈕,彈出文字匯入嚮導第3步的對話方塊,如圖3-18所示。 文木匯入嚮導一第3步,共3步使用此屏內容可選擇各列,並設定其資料格式。 列資料格式 ◎ 常規(G) 〇文字(〇日期①): YMD 〇不匯入此列(跳過)) 團區 “室規”資料格式將數值轉換成數字,日期值會轉換成日期,其餘資料則轉換成文字。 高階 (A). 資料預覽(E) 囂規常規常規常規規序號同齡年齡性別最高學歷崗位類別崗位層級 E8E STEP 05 STEP 06 STEP 07 取消売成Q) 圖3-18 文字資料匯入嚮導-第3步如果不需要將某列匯入Excel中,可以在“資料預覽”中選擇此列,然後勾選“不匯入此列(跳過)”,則該列就不會輸出在Excel檔案裡。在這裡,我們不需要刪除某列, 故選擇“常規” 即可,單擊“完成”按鈕。 彈出“匯入資料”對話方塊,在其中選擇存放資料的位置,單擊[按鈕,拖動或者縮放單元格區域,再次單擊[國技鈕恢復對話方塊,最後單擊“確定”按鈕,如圖3-19所示。 B D 1 2 3 4 5 6 7 8 匯入敷據資料的放置位置 ◎ 現有工作表(8): MX 〇新工作表 OE) 屬性 G).. 確定二〔取消圖3-19 匯入文字資料返回工作表,文字檔案中的資料就會按所設定的格式自動匯入到其中,效果如圖3-20 所示。 小白唸叨道:嗯,文字資料匯入步驟我已經記下了,回去我就要動手試一試。 59

>> 誰說菜鳥不會資料分析(入門篇) 3 6 7 8 9 10 11 12 13 14 AB 序號司齡 1 A 2 A 3 A 4 D 5 A 6B 7A 8 B 9A 10 B 11 A 12 A 13C 年齡 A D C B 性別 A A B B A 崗位類別 E E G 崗位層級 E B C C B C AA B A A AA 最高掌歷 C B C D A F F EFCDD B C C C D B B B FF EBCFA D D G D C C 圖3-20 文字資料匯入結果 ◎ 自動匯入網站資料 Mr.林:除了本地文字資料外,網路資料來源是如今資訊時代不可或缺的資料來源,如股票行情、產品報價、銷售排行、統計局網站公佈的經濟資料等。而且,Excel中還設定了“重新整理控件”的功能,即匯入的網路資料可以進行即時更新,當網頁的資料發生變化時,不需要重新匯入資料就能獲取最新資料。匯入網站資料的具體操作步驟如下。 STEP 01 單擊“資料”選項卡,選擇“自網站”選項,Excel會彈出“新建Web查詢” 對話方塊。 STEP 02 在對話方塊的位址列裡輸入要匯入資料的網址,這裡我們輸入國家統計局“消費者信心指數(2010年9月)”資料的網址:http://www.stats.gov.cn/tjsj/jdsj/ t20101105_402681367.htm。單擊“轉到”按鈕,對話方塊中將顯示相應的頁面,單擊國按鈕,使其圖示變為回,在這裡單擊表格前面的回圖示,如圖3-21所示。 新建 Teb 查詢 [2區地址 02):http://ww stats. cow.co/ujsj/ydsj/420M 單擊要逸擇的表矛邊的回 •然後單擊“匯入”(C)- 消費者信心指數(2010年9月) 回日期 2009.08 2009.09 2009.10 2009.11 2009.12 2010.01 2010.02 2010.03 2010.04 2010.05 2010.06 2010.07 2010.08 2in na 消費者預期指數 102.0 102.2 102.6 103.0 104.0 104.6 104.5 108.2 106.8 108.2 108.9 108.6 107.9 1nds 消黃者滴意指數 103.8 103.7 104.0 103.8 103.8 104.8 103.7 107.5 106.2 107.7 107.8 106.4 106.2 103 £ 消貴者儥心指數 102.7 102.8 103.2 103.3 103.9 104.7 104.2 107.9 106.6 108.0 108.5 107.8 107. 3 10 a 取逈 60 圖3-21 匯入網站資料第3章無米難為巧婦—資料準備 STEP 03 單擊“匯入”按鈕,彈出“匯入資料” 的對話方塊,在工作表中選擇需要放置資料的區域,這裡我們選擇預設位置A1,單擊 “確定”按鈕,網站中的資料將自動匯入到Excel 中,匯入後的效果如圖3-22所示。 A 1 日期 2 3 4 5 6 7 8 2009.08 2009.09 B C D 消嬰者消費晝消費者預期指數滿意指數售心指數 102 103.8 102.7 102.2 103.7 102.8 10 11 12 13 14 15 16 圖3-22 網站資料匯入結果小白問道:您剛剛說不用開啟網頁也能自動更新資料,是怎麼做到的? Mr.林:記性真好!其實更新資料的方式有三種,即時重新整理、定時重新整理或者開啟檔案時自動重新整理。 首先教你怎麼實現即時重新整理吧!只要單擊“資料”主選項卡一“重新整理資料”,或者選擇導入的外部資料所在區域中的任意一個單元格,然後單擊滑鼠右鍵,在彈出的快捷選單中選擇“刷新”命令,如圖3-23所示。 方法一金舵閉新自金開新(色) 開新(B) 1.23| 10 11 12 13 14 15 16 方法二山複製() 貼上透項: A 日期 2009.08 2009.09 2009.1 2009.11 2009.12 2010.01 2010.02 2010.03 2010.04 2010.05 2010.06 2010.07 2010.08 2010.09 B 消費耆預期指數 102 102.2 102.6 103 104 104.6 104.5 108.2 106.8 108.2 108.9 108.6 107.9 104.8 消費耆滿意指數選擬性粘店(S). 103.1 酒入0⋯ 103 出除(2.. 10渭路內蟒(區 103: 103.: 滿選(E) 104: 排亭(Q 103 道入 M) 107. 舒冷置單元格修式(. 106., 107.3 典環童演(). 107.1 數湯團團住(). 106•3 106.團開新(B) 103.01 104.4 圖3-23 即時重新整理網站資料 61

>> 誰說菜鳥不會資料分析(入門篇) 怎麼實現定時重新整理或者開啟檔案時自動重新整理呢?注意,圖3-23所示“方法二”的快捷選單中還有個“資料範圍屬性”,選擇這個選項,即彈出“外部資料區域屬性”對話方塊,如圖3-24 所示。在此對話方塊中勾選“重新整理頻率” 核取方塊, 外部敦據區其屁性名稱 CE): t20101105_402681387 查詢定義口儲存查詢定義 (9) 儲存密碼 (P) 重新整理控制元件允許後臺別新 1B) 口重新整理頻率(B) 圖開啟檔案時重新整理資料(I)? 二分鐘選擇重新整理的間隔時間,就能實現定時重新整理了。 另外,在“外部資料區域屬性”對話方塊中還有“開啟檔案時重新整理資料”核取方塊,選擇這個選 ]保留列描序/篩選/佈局(L) 口保留單元格格式(S) 項將實現開啟檔案時資料自動重新整理。 小白突然想到了什麼,問道:我能不能用先 “Ctrl+C”,接著再 “Ctrl+V”的方式直接將資料格式及佈局 •包含宇段名出) 包含行號 00 口調整列寬(A) 當資料區域中的行數隨重新整理而更改時: ◎ 為新數插入單元格,並冊除沒有使用的單元格(C) 〇 為新數発入整行,清除未使用的單元格() 〇用新資料覆蓋現有單元格,並清除沒有使用的單元格內容(Q) 口在號數相鄰的列向下填充公式CE) 網頁的資料複製貼上過來呢?這樣能實現網頁數確定取消據自動更新嗎? Mr.林笑了笑:真聰明!這就是我正準備跟圖3-24 外部資料區域屬性你講的另一種匯入網站資料的方法,這種方法比較方便,也能夠實現網頁資料自動更新,如圖 3-25所示。 62 在工作表中貼上資料後,資料區域的右下角會出現一個“貼上”按鈕嚕(Ct)•,如圖3-25所示。單擊它,選擇“可重新整理的Web查詢”命令,在彈出的對話方塊中進行相應設定即可。

第3章無米難為巧婦—資料準備 3.2.2 問卷錄入要求 Mr.林:介紹完匯入外部資料,我們再來看手工錄入,就以問卷錄入為例吧。 做資料分析時,除了我剛剛講的對一般的資料表有特定要求外,我們經常接觸到的調查問卷資料,其錄入格式也是有講究的。例如,我們公司最近搞的員工滿意度調查,經過問卷的發放、 填寫、回收、核實和清理之後,就需要把收集回來的選項進行編碼、錄入。而對於不同型別的問題,也有不同的錄入格式要求。小白,我問你問卷題目大致可以分為哪幾類呢? 小白機靈地翻出員工滿意度調查表,念道:常用的型別主要有單選、多選、排序和開放性文字題這四種型別。 MT.林:嗯!沒錯。那麼,你知道怎樣分辨這幾種型別嗎?每種型別採取怎樣的錄入格式呢? 小白:⋯• Mr.林停頓了一會兒,繼續說道:先別急著回答,下面我就以員工滿意度調查為例慢慢講解。 現在我在公司員工滿意度問卷中抽取出一份問卷,問卷題目很多,每種題型的題目就分別挑選一道作為示例講解吧,如圖3-26所示。 問卷編號: 405 員工滿意度調查問卷第一型別:數值 3.您在本公司的入職年月是2700) 年9_月第二型別:單選 7.您認為公司的組織管理框架清晰、分工明確: A.完全不符合 (8. 太符合 C.一般 D.基本符合 E完全符合第三型別:多選 25.您認為用什麼樣的方式能夠有效激勵您?(最多選3項) (A提供個人職業發展空間 B.提供個人能力提升機會 ⑨提萬薪酬待遇 D.及時表彰等精神激勵 E. 加強上下級溝通與工作指導 (F 公平透明的管理環境 G.加強企業文化建設第四型別:排序 31.您希望所在的企業有什麼樣的價值取向,請按重要性排序: 第一重要(C)第二重要(D) 第三重要() A.優勝劣汰 B.客戶至上 C.團隊精神 D.開拓創新E.能者上,庸者下F.其他第五型別:開放性文字題 40.對公司的其它意見和建議: 建議增加對員工的業經培訓圖3-26 公司員工滿意度問卷示例 63

64 >> 誰說菜鳥不會資料分析(入門篇) ◎ 數值題在示例問卷中,第3題就是數值題,數值題一般要求被調查者填入相應的數值,或者打分。 錄入人員只需輸入被調查者實際填入的數值即可。 ◎ 單選題單選題的特徵就是答案只能有一個選項,所以編碼時只需定義一個變數,即給該題留一列進行資料的錄入。錄入時可採用1、2、3、4分別代表A、B、C、D四個選項,例如選C則錄入3。對於示例問卷中的第7題,只需在對該份問卷的記錄中對應第7題所在的列位置錄入2即可。 ◎ 多選題多選題的特徵是答案可以有多個選項,其中又分為項數不定多選和項數限定多選。項數不定多選就是對所選擇選項的數目不作限定,項數限定多選有“最多選**項” 的要求,如示例問卷中的第25題就對項數有限制。 多選題的錄入有兩種方式:二分法和多重分類法。 * 二分法:把每一個相應選項定義為一個變數,每一個變數值均作如下定義:“0”代表未選,“1”代表已選,即對於被調查者選中的選項錄入1,對未選的選項錄入0。比如,示例問卷中被調查者選ACF,則A、B、C、D、E、F、G的選項下分別錄入1、0、1、 0、0、1、0。 * 多重分類法:事先定義錄入的數值,比如1、2、3、4、5、6、7分別代表選項A、B、C、 D、E、F、G,並且根據限選的項數確定應錄入的變數個數。例如示例問卷第25題限選3 項,那麼需要設立3個變數,被調查者在該題選ACF,則在3個變數的值分別為1、3、6。 ◎ 排序題對於排序題需要對選項重要性進行排序,比如示例問卷第31題,總共有6個選項,需要按重要程度排出前3名來。排序題的錄入與多重分類法類似,先定義錄入的數值,1、2、3、4、5、6 分別代表選項A、B、C、D、E、F,然後按照被調查者填寫的順序錄入選項,因此對於第31題,我們按順序錄入3、4、1。 ◎ 開放性文字題開放性文字題一般都放在問卷的末尾,需要被調查者自己填寫一些文字表述觀點或建議, 例如示例問卷的第40題。對於開放性文字題,如果可能的話可以按照含義相似的答案進行歸類編碼,轉換成為多選題進行分析。如果答案內容較為豐富,不容易歸類,就應對這類問題直接做定性分析。 小白忙打斷:等等!您就這麼走馬看花似地說了一遍,我記不住!