AI 新聞與投資
誰說菜鳥不會數據分析 入門篇

前言

1 / 9

Broacview® www.broadview.com.cn “皆訴你職場圖表背後的故事, 行業暢銷書升級版淮說菜鳥不會. 資料分析張文霖劉夏璐狄松編著 (門篇) 握公析 NLIC2970848131 電子工業出版社. PUBLISHING HOUSE OF ELECTRONICS INDUSTRY

Broadview® www.broadview.com.cn 博文視點•IT出版旗艦品牌技術凝聚實力•專業創新出版專家評論當談到用資料解決問題時,我經常用這樣的語言去詮釋:“如果你不能量化它,你就不能理解它,如果不理解就不能控制它,不能控制也就不能改變它”。資料無處不在,資訊時代的最主要特徵就是“資料處理”,資料分析正以我們從未想象過的方式影響著日常生活。 在知識經濟與資訊科技時代,每個人都面臨著如何有效地吸收、理解和利用資訊的挑戰。那些能夠有效利用工具從資料中提煉資訊、發現知識的人,最終往往成為各行各業的強者! 這本書向我們清晰又友好地介紹了資料分析方法、技巧與工具,強烈推薦讀一讀這本書,它或許會給你帶來意想不到的收穫! 沈浩中國傳媒大學電視與新聞學院,教授:調查統計研究所,副所長資料探勘研發中心,主任:9PSOS公司,首席技術顧問統計學是一門很難,但是很有趣,更是很有用的工具學科。懂得如何使用它的人總是樂在其中,而尚未入門的人則畏之如虎。國內講述統計學理論,以及講述統計軟體操作的書籍可謂汗牛充棟,但是多數流於理論,疏於應用和實踐指導。很大一部分讀者需求未被滿足。 近年來隨著資訊科技的普及,各行各業的業務資料自動化趨勢愈來愈明顯,使得資料分析的需求開始從統計專業人士向各行業人員全面擴充套件。在此背景之下,出版一本能夠深入淺出,從實際應用的角度介紹統計分析基礎知識的書就變得很有必要。 這本書在理論和實踐的平衡方面做了很有價值的嘗試,基於最為普及的Excel、5W2H、PEST等資料分析方法論, 深入淺出地介紹瞭如何滿足具體工作中的常見統計分析需求,對於需要應用統計分析,但是又未接受過這方面系統培訓的讀者來說,本書應當是一本非常合適的資料分析入門教材。 張文彤博士英德知聯恆市場諮詢(上海)有限公司新事業開發部,全國技術總監新浪微博 @博文視點Broadview 上架建議:計算機>辦公軟體 ISBN 978-7-121-18780-3 策劃編輯:張月萍責任編輯:許豔封面設計:李玲 9 787121" 187803 定價:49.00元記鳥不會資料分析張文霖劉夏璐狄松編著 (入門篇) 上海豪藏書 ALIC 歡據分析 NLIC2970848131 電子工業出版社 Publishing House of Electronics Industry 北京•BEIJING

內容簡介這是一本有趣的資料分析書! 本書基於通用的Excel工具,加上必知必會的資料分析概念,以小說般通俗易懂的方式講解。 本書基於職場三人行來構建內容,完全按照資料分析工作的完整流程來講解。全書共8章,依次講解資料分析必知必會知識、確定資料分析的結構化思維、資料處理技巧、資料展現的技術、透過專業化的視角來提升圖表之美以及專業分析報告的撰寫等內容。 本書有足夠的魅力讓你一口氣讀下去,在無形之中掌握資料分析的技能,提升職場競爭能力。 本書能有效幫助職場新人提升職場競爭力,也能幫助市場營銷、金融、財務、人力資源管理人員及產品經理解決實際問題,還能幫助從事諮詢、研究、分析行業的人士,各級管理人士提高專業水平。 未經許可,不得以任何方式複製或抄襲本書之部分或全部內容。 版權所有,侵權必究。 圖書在版編目(CIP)資料誰說菜鳥不會資料分析.入門篇/ 張文霖,劉夏璐,狄松編著.一北京:電子工業出版社,2013.1 ISBN 978-7 121 18780-3 1. ①誰•II. ①張•②劉•③狄•皿.①表處理軟體 IV. ①TP391.13 中國版本圖書館CIP資料核字(2012)第250460號策劃編輯:張月萍責任編輯:許豔印刷:中國電影出版社印刷廠裝訂:三河市皇莊路通裝訂廠出版發行:電子工業出版社北京市海淀區萬壽路173信箱開本:787×980 1/16 印次:2013年1月第2次印刷印數:15001~25000冊定價:49.00元郵編:100036 印張:15.5 字數:366千字凡所購買電子工業出版社圖書有缺損問題,請向購買書店調換。若書店售缺,請與本社發行部聯系,聯絡及郵購電話:(010)88254888。 質量投訴請發郵件至[email protected],盜版侵權舉報請發郵件至[email protected]。 服務熱線:(010)88258888。

前言經常有朋友詢問:資料分析該怎麼做?有什麼分析技巧?這些資料怎麼處理分析? 因為大量問題具有通用性,而且“懶”得挨個答覆類似的問題,於是就結合大家關心的問題,編寫這本通俗易懂的資料分析書。市面上資料分析的書大部分還停留在大雅的範疇,要麼就是高深的統計學理論,要麼就是專業的統計分析軟體,給人感覺門檻非常高。而且,所講解的案例大部分來自科研一線,讓人看了摸不著北。這無形間在學習者與資料分析之間建起了鴻溝。 其實,透過多年的資料分析實踐來看,資料分析還是件很有樂趣的事情。我們需要做的是:基於通用的工具Excel,加上必知必會的資料分析概念,採用通俗易懂的講解方式。這樣資料分析就不那麼晦澀了,而且故事化的情境設計,讓我們有一口氣讀下去的勇氣,天塹也變通途了。 雖然積累了多年的資料分析實戰經驗,但是要上升到一本書還是花費了近1年的時間。她的第1章、第8章由狄松完成,第2章、第5章、第6章由張文霖完成,第3章、第4章、第7章由劉夏璐完成。這個創作過程是艱辛的,但也是很有成就感的。我們努力講好資料分析的故事,同時把這個故事儘量展現得美麗動人。請允許我們以“她”來稱呼這本與眾不同的資料分析書籍,很多人翻開這本書的時候,可能會有大量疑惑,但,請耐著性子慢慢讀下去,您將會有莫大的收穫。 如果你覺得她看起來很輕鬆,千萬別誤以為她是一本小說,她其實是一本講述資料分析的書籍她拋開復雜的數學或者統計學原理,只和你講必知必會的要點,關注解決實際問題; 她不去探究科班的學術問題,只和你耐心地分享職場中的實戰案例; 她不板起臉和你講大道理,只和你娓娓道來切身的趣味故事; 她天生麗質,圖表漂亮絕倫; 她多姿多彩,還有卡通漫畫風。 可能你會覺得她膚淺⋯• 但是,當你揭開她華麗的外衣時,你會驚豔; 也會被她通俗而不庸俗,美麗而又深刻的本質所吸引。 把她珍藏起來吧,因為: 她會循循善誘地把你領進資料分析的大門; 她會讓你的簡歷更加具有吸引力; 她會讓老闆對你刮目相看; 她值得在你的書架上長期逗留,會讓你的書架也增加色彩。 她講述了職場三人行的故事,她的故事還會讓你偷著笑牛董,關鍵詞:私企董事、要求嚴格、為人苛刻。 小白,關鍵詞:應屆畢業生,剛入職場的偽白骨精(白領+骨幹+精英)、牛董助手、單身

>> 誰說菜鳥不會資料分析(入門篇) 女白領、愛臆想。 MI.林,關鍵詞:小白的同事、資料分析達人、成熟男士、樂於助人、做事嚴謹。 哪些人會對她的故事有閱讀興趣呢 * 需要提升自身競爭力的職場新人。 * 在市場營銷、金融、財務、人力資源、產品設計等工作中需要做資料分析的人士。 * 經常閱讀經營分析、市場研究報告的各級管理人員。 * 從事諮詢、研究、分析等工作的專業人士。 其實她還有效率助手她的效率助手是一些常用的外掛工具,此外她的配書資料檔案可以到www.dozan.cn或http:/Dlog. sina.com.cr/xiaowenzi22下載。擁有了這些實用的外掛,可以讓我們的資料分析如魚得水。 致謝感謝筆者的好朋友李治的鼓勵和支援,讓筆者下定決心寫這本書。在此要衷心感謝成都道然科技有限責任公司的姚新軍先生,感謝他的提議和在寫作過程中的支援。感謝參與本書最佳化的朋友:王斌、李偉、張強林、萬雷、李平、王曉、景小燕、餘松。非常感謝本書的插畫師王馨的辛苦勞動,您的作品也讓本書增色了不少。 感謝鄧凱、黃成明、李雙、劉曉霞、劉雲鋒、歐維平、石軍、沈浩、張文彤、張立良、張志成、鄭來軼、祝迎春、王雍、伍昊等書評作者,感謝他們在百忙之中抽空閱讀書稿,撰寫書評, 並提出寶貴意見。 最後,要感謝三位作者的家人,感謝他們默默無聞的付出,沒有他們的理解與支援,同樣也沒有本書。 儘管我們對書稿進行了多次修改,仍然不可避免地會有疏漏和不足之處,敬請廣大讀者批評指正,我們會在適當的時間進行修訂,以滿足更多人的需要。 升級版說明 《誰說菜烏不會資料分析》自2011年7月出版以來得到廣大讀者朋友的大力支援,而且很榮幸獲得中國書刊發行業協會頒發的“2011年度全行業優秀暢銷書品種”稱號。這個榮譽的取得與廣大讀者的大力支援是分不開的。為了讓這本書精益求精,在徵集了大量的讀者反饋意見後,我們進行了本次的升級。 與故事的作者聯絡: 部落格:http://blog.sina.com.cn/xiaowenzi22 郵箱:[email protected] 新浪微博:@小蚊子樂園與故事的策劃者聯絡: 郵箱:[email protected] 新浪微博:@長頸鹿27 4

業內人士的推薦(排名不分先後,以姓氏拼音排序) 本書將看似“浮雲”的資料分析知識,蘊於商業化的場景之中,生動形象地讓讀者瞭解到 “給力”的資料分析師是如何煉成的!本書引導非專業人士從資料的角度,認識、剖析、解決商業問題;對專業人士而言,亦能提供一次梳理知識和提高技能的機會。 鄧凱資料探勘與資料分析博主,資深資料分析師這是一本適合普通大眾的“專業”資料分析圖書,由淺入深,富有體系。讓人有一口氣讀完的衝動,想馬上找一臺電腦試一試這些 “新奇”的分析方法,更想拿一些資料來分析其中的規律。 讀完本書,你會發現資料分析的樂趣,它並不是那麼枯燥,資料背後的故事簡直太有意思了。從此你將發現:無論新聞媒體,還是企業報表中的數字都有生命,因為它們在那裡用自己的語言和你交流! 祝願大家早日練就一顆資料分析的“心” 黃成明資料化管理顧問及培訓師,零售及服裝企業資料化管理諮詢顧問本書內容實用,語言簡潔生動,通俗易懂。透過富有邏輯的路徑式圖示引導,對複雜步驟的圖文分解,讓讀者快速掌握用Exce1進行資料分析的各項實用技巧,令人耳目一新。不僅便於學習,也便於上機操作。 李雙資料分析與挖掘交流站,站長資料分析的門檻有多高?可以很高,也可以不高。小蚊子的這本書可以給初學者一些實戰性的指引。書中介紹的多個常用資料分析方法,對於初學者甚至是具有一定經驗的資料分析師都有很好的啟發。 劍曉霞慧聰鄧白氏研究e-Eyes書業部,副總經理 5

>> 誰說菜鳥不會資料分析(入門篇) 本書是市面上少見的一本系統講解資料分析的書籍。它沒有針對高階分析方法和統計函式的介紹,而是針對職場人士日常工作中遇到的問題提出解決方案。書中透過小白跟師父學藝的整個過程,生動形象地描述和解釋了什麼是資料分析以及如何有效地進行資料分析,通俗易懂,趣味性非常強,是一本非常適合初學者的書籍。 劍雲鋒北京簡博市場諮詢有限公司,高階經理本書有四大亮點。其一,拋開了煩瑣的統計公式與數理推論,完全以實踐應用為導向,十分適合於沒有統計背景的普通白領;其二,本書基本是小蚊子實際工作經驗的總結,與大部分作者言之不盡的陋習不同的是,小蚊子在著作中對自己掌握的知識傾囊相授,這也是小蚊子一貫的品性;其三,作品除了教會你使用Excel簡單處理日常工作涉及的資料分析,還在統計分析圖表的展示方面為讀者提供了重要的指導;其四,本書寫作方式有新意,如小說一般的寫作,使枯燥的資料分析過程興趣盎然。 如果你正在為複雜的統計公式而頭痛,如果你正在為學習統計軟體而煩惱,如果你正在如何將資料分析的結果進行專業的呈現而傷神,那麼,選擇這本書,也許你就找到了終南捷徑。 歐維平廣州市準誠市場諮詢有限公司,研究總監資料分析理論、公式和方法對部分初學者來說是枯燥、乏味的,或墜入雲山霧海中不得其道。本書最大的特點是使用幽默風趣的語言,結合工作中典型案例加以分析、解讀,是一本值得資料分析工作者一讀的好書。 石軍安徽同徽資訊科技有限公司,總經理當談到用資料解決問題時,我經常用這樣的語言去詮釋:“如果你不能量化它,你就不能理解它,如果不理解就不能控制它,不能控制也就不能改變它”。資料無處不在,資訊時代的最主要特徵就是“資料處理”,資料分析正以我們從未想象過的方式影響著日常生活。 在知識經濟與資訊科技時代,每個人都面臨著如何有效地吸收、理解和利用資訊的挑戰。那些能夠有效利用工具從資料中提煉資訊、發現知識的人,最終往往成為各行各業的強者! 6

這本書向我們清晰又友好地介紹了資料分析方法、技巧與工具,強烈推薦讀一讀這本書,它或許會給你帶來意想不到的收穫! 沈潔中國傳媒大學電視與新聞學院,教授調查統計研究所,副所長資料探勘研發中心,主佳 IPSOS公司,首席技術顧問對我們財務人員來說,每個月都要寫經濟活動分析,但總是列出一堆乾巴巴的數字,領導不愛看,自己也臉上無光,而這本書卻能改變這一切。不懂資料庫?不會Excel?不知如何做圖表?沒關係,這本書充分考慮了初學者的知識背景,讓你從入門到精通。更難能可貴的是,本書設計的場景風趣幽默,讓人彷彿是在看小說,把枯燥無味的學習變得生動有趣。 張立良 Excel必備工具箱,開發者統計學是一門很難,但是很有趣,更是很有用的工具學科。懂得如何使用它的人總是樂在其中,而尚未入門的人則畏之如虎。國內講述統計學理論,以及講述統計軟體操作的書籍可謂汗牛充棟,但是多數流於理論,疏於應用和實踐指導。很大一部分讀者需求未被滿足。 近年來隨著資訊科技的普及,各行各業的業務資料自動化趨勢愈來愈明顯,使得資料分析的需求開始從統計專業人士向各行業人員全面擴充套件。在此背景之下,出版一本能夠深入淺出,從實際應用的角度介紹統計分析基礎知識的書就變得很有必要。 本書在理論和實踐的平衡方面做了很有價值的嘗試,基於最為普及的Excel、5W2H、PEST等資料分析方法論,深入淺出地介紹瞭如何滿足具體工作中的常見統計分析需求,對於需要應用統計分析,但是又未接受過這方面系統培訓的讀者來說,本書應當是一本非常合適的資料分析入門教材。 張文彤博士英德知聯恆市場諮詢(上海)有限公司新事業開發部,金國技術總監這是一本真正介紹資料分析而不是介紹資料分析工具的書,全書內容就是按照資料分析流程而組織的,每一章節均透過案例來講解,語言生動有趣。更加可貴的是,案例的“劇情” 大多都 7

8 >> 誰說菜鳥不會資料分析(入門篇) 是作者多年來在現實中遇到的,因此實用性較高!在宏觀結構上採用的經典結構能夠帶領讀者按照正確的順序穩步前進,在微觀上採用的敘述方式極大增強了“渴”讀性,使得應用技術更加直觀。本書還是一本經典案例大全,內容涵蓋人力資源等各方面的應用。因此,本書適合所有工作中需要做資料分析的朋友閱讀! 張志成 http://blog.soufun.com/site,這址分析師資料分析是一種能力,更是一種思想。本書結構有層次、內容全面、通俗易懂,一步步帶你走進資料分析的世界,讓資料分析變得既簡單又有趣。 鄭來軼中國統計網站長,資深資料分析師這是一本簡單易懂,但又不缺乏深度的資料分析圖書。該書作者常年從事資料分析工作, 熟悉日常資料分析工作常見的問題和解決方案,所以該書積累了大量資料分析的實用性方法與技巧,需要細緻的深入其境的學習,最好直接跟著書中內容實際操作,邊做邊學邊領悟,這樣可以達到事半功倍的效果。資料分析需要不斷在工作中實踐,這是一本入門性的書籍,最終還是需要讀者靠自己的意志力克服畏難情緒去學習。付出才會有收穫,學習任何東西都是如此。 祝迎春高等學校教材《SPSS統計分析高階教程》,合作者資料分析圈的朋友應該都知道小蚊子或小蚊子樂園這個部落格,本書是小蚊子同學多年資料分析工作的積累總結,是一本簡單實用的書,是資料分析技巧與工作例項充分結合的一本書。全書透過幽默的對話勾勒出資料分析的全景,徹底開啟了以往資料分析相關專業書籍單一枯燥的局面。 王雍資料元素博主,資深資料兮析師你們想想,帶著這本書出了城,吃著火鍋還唱著歌,突然就學會資料分析了•• 伍昊五號諮詢,Excel首席培訓師目錄第1章資料分析那些事兒 1.1 資料分析是“神馬”/14 1.1.1 何謂資料分析 /15 1.1.2 資料分析的作用 /16 1.2 資料分析六步曲/17 1.2.1 明確分析目的和思路 /18 1.2.2 資料收集/20 1.2.3 資料處理 E/21 1.2.4 資料分析 /21 1.2.5 資料展現 /22 1.2.6 報告撰寫/23 1.3 1.4 資料分析的三大誤區/24 資料分析師的職業發展/25 1.4.1 資料分析的廣闊前景/25 部倪東海提供 1.4.2 資料分析師的職業要求 /27 1.4.3 資料分析師的基本素質 /28 1.5 幾個常用指標和術語132 1.6 本章小結 /36 第2章結構為王——確定分析思路 2.1 資料分析方法論 /38 2.1.1 資料分析方法論與資料分析法的區別/38 2.1.2 資料分析方法論的重要性 /39 2.2 常用的資料分析方法論 /40 2.2.1 PEST分析法 /40 2.2.2 5W2H分析法 /43 2.2.3 邏輯樹分析法 /44 2.2.4 4P營銷理論/45 2.2.5 使用者行為理論 /47 2.3 本章小結/48 第3章無米難為巧婦——資料準備 3.1 理解資料 /50 9

>> 誰說菜鳥不會資料分析(入門篇) 3.1.1 欄位與記錄/51 3.1.2 資料型別 /52 3.1.3 資料表 /53 3.2 資料來源/57 3.2.1 匯入資料 /57 3.2.2 問卷錄入要求 /63 3.3 本章小結 /65 第4章三心二意——資料處理 4.1 何為資料處理/67 4.1.1 “三心二意”處理資料 167 4.1.2 資料處理的內容 /69 4.2 資料清洗 /70 4.2.1 重複資料的處理 /71 4.2.2 缺失資料處理 /76 4.2.3 檢查資料邏輯錯誤 /80 4.3 資料加工/82 4.3.1 資料抽取 /82 4.3.2 資料計算 /87 4.3.3 資料分組 1/91 4.3.4 資料轉換 192 4.4 資料抽樣 /97 4.5 本章小結 198 第5章工慾善其事必先利其器——資料分析 5.1 資料分析方法 /101 5.1.1 對比分析法 /102 5.1.2 分組分析法/105 5.1.3 結構分析法/106 5.1.4 平均分析法/107 5.1.5 交叉分析法/108 5.1.6 綜合評價分析法 /109 5.1.7 杜邦分析法/113 5.1.8 漏斗圖分析法 /114 5.1.9 矩陣關聯分析法 /115 5.1.10 高階資料分析方法 /120 5.2 資料分析工具 /121 5.2.1 初識資料透視表 /121 東海提供 10

目錄 5.2.2 建立資料透視表的三步法 /122 5.2.3 資料透視表分析實踐 /124 5.2.4 資料透視表小技巧/130 5.2.5 • 多選題分析 /132 5.3 本章小結 /135 第6章給資料量體裁衣——資料展現 6.1 揭開圖表的真面目 /138 6.1.1 圖表的作用 /138 6.1.2 經濟適用圖表有哪些 /139 6.1.3 透過關係選擇圖表 /140 6.1.4 圖表製作五步法 /145 6.2 表格也瘋狂 /146 6.2.1 突出顯示單元格 /146 6.2.2 專案選取 /147 6.2.3 資料條 /148 6.2.4 圖示集 /149 6.2.5 迷你圖 /150 6.3 給圖表換裝/151 6.3.1 平均線圖 6.3.2 雙座標圖 /153 效術部倪東海提供 6.3.3 豎形折線圖 /156 6.3.4 瀑布圖 /159 6.3.5 帕累託圖/160 6.3.6 旋風圖 /165 6.3.7 人口金字塔圖 /169 6.3.8 漏斗圖 /171 6.3.9 矩陣圖(散點圖)/173 6.3.10 發展矩陣圖 /176 6.3.11 改進難易矩陣(氣泡圖)/178 6.4 本章小結 /180 第7章專業化生存——圖表可以更美的 7.1 別讓圖表犯錯 /183 7.1.1 讓圖表“五臟俱全”/183 7.1.2 要注意的條條框框 /185 7.1.3 圖表會說謊/196 7.2 濃妝淡抹總相宜——圖表美化 /200 11

>> 誰說菜鳥不會資料分析(入門篇) 7.2.1 圖表美化的三原則/200 7.2.2 略施粉黛- —美化圖表的技巧 /203 7.2.3 圖表也好“色”/209 7.3 如虎添翼的招兒 /213 7.3.1 我的圖表模板 /214 7.3.2 快速製圖/215 7.3.3 新增標籤小工具 /216 7.3.4 修剪超大值 /218 7.4 本章小結 /220 第8章專業的報告——體現你的職場價值 8.1 初識資料分析報告/222 8.1.1 資料分析報告是什麼/222 8.1.2 資料分析報告的寫作原則 /222 8.1.3 資料分析報告的作用/224 8.1.4 資料分析報告的種類 1225 8.2 資料分析報告的結構/228 8.2.1 標題頁 /228 8.2.2 目錄/230 8.2.3 前言 /231 8.2.4 正文/233 8.2.5 結論與建議/234 8.2.6 附錄 /234 8.3 撰寫報告時的注意事項 /235 8.4 報告範例 /236 8.5 本章小結/244 寫在後面的Q/A 附錄A 網路學習資源 12

第 1 章資料分析那些事兒資料分析是“神馬” 東海公資料分析六步曲資料分析的三大誤區資料分析師的職業發展幾個常用指標和術語不冷初學者、? 2 眼8%⋯..% ¥#*(%¥ ¥@! …•**%林井

>> 誰說菜鳥不會資料分析(入門篇) 小白過五關斬六將,透過嚴格的面試,最終從眾多優秀畢業生中脫穎而出,成為公司的一員。在報到的第一天,公司HR向小白介紹了她的職位—公司牛董的助理,負責文秘工作,可能需要做一些資料分析之類的活兒。小白一聽到資料分析這個詞,就感覺頭皮發麻,這時,她的腦子裡幻想出一些穿白大褂的科研人員在實驗室的計算機前不斷忙碌的場景。雖然在上大學時也使用過Excel,但是如果要做資料分析工作,她還真的有些不知如何下手。無數個問號湧到她的腦海中:資料分析到底要做什麼呢?我要怎麼做資料分析?老闆想要看什麼樣的結果呢?⋯⋯唉, 只好邊走邊幹了。 HR看出小白的心事,說道:關於資料分析你不用太擔心,如果遇到難題,你可以請教我們公司的Mr.林,他在這方面可是專家喔! 小白一聽有救星,立馬興奮起來,好像抓到救命稻草一樣,想趕緊找到這位大師級人物,然後一股腦把疑問全倒出來。 HR:小白,你跟我來吧,我給你引薦下Mr.林。 小白:好的。 說著小白跟HR來到了MI.林的辦公桌旁,HR說道:Mr.林,這是我們公司新來的同事,叫小白,現擔任牛董的助理,其中部分工作涉及資料分析,到時候有問題還要麻煩您多多指點。 小白緊跟著說道:Mr.林,您好,請多多指教。 Mr.林:別客氣,有問題直接來找我就可以了。 小白趁機說道:我現在就有問題,您現在是否有時間幫我解答下?資料分析是幹什麼的,具體要怎麼做? Mr.林聽完笑了起來;你還真是不客氣呀。好吧,你剛進公司,我就先給你做個簡單的培訓,帶你入個門吧,以後的修行可就靠你自己努力了。 小白用力點著頭,HR見這“師徒”二人頗有一見如故之感,大致交待一番後就離開了。 1.1 資料分析是“神馬” Mr.林接著說道:小白,既然要學習資料分析,借用現在網路流行語,你能說說資料分析是 “神馬”麼? 小白:呵呵,資料分析肯定不是“浮雲”。從字面上理解,資料分析就是對資料進行分析。 Mr.林,我只能理解到這一層面,專業的解釋就需要您來指教了。 14

第1章資料分析那些事兒 1.1.1 何謂資料分析 Mr.林:簡單來說,資料分析就是你剛才講的——對資料進行分析。較為專業的說法,資料分析是指用適當的統計分析方法對收集來的大量資料進行分析,將它們加以彙總和理解並消化, 以求最大化地開發資料的功能,發揮資料的作用。資料分析是為了提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。這裡的資料也稱觀測值,是透過實驗、測量、觀察、調查等方式獲取的結果,常常以數量的形式展現出來。 13204576028930278 10703. 資料分析資料分析的目的是把隱藏在一大批看似雜亂無章的資料背後的資訊集中和提煉出來,總結出所研究物件的內在規律。在實際工作中,資料分析能夠幫助管理者進行判斷和決策,以便採取適當策略與行動。例如,企業的高層希望透過市場分析和研究,把握當前產品的市場動向,從而制訂合理的產品研發和銷售計劃。這就必須依賴資料分析才能完成。 在統計學領域,有些學者將資料分析劃分為描述性資料分析、探索性資料分析以及驗證性數據分析(參見圖1-1人。其中,探索性資料分析側重於在資料之中發現新的特徵,而驗證性資料分析則側重於驗證已有假設的真偽證明。 資料分析描述性資料分析探索性資料分析驗證性資料分析圖1-1 資料分析類別從另一個角度看,描述性資料分析屬於初級資料分析,常見的分析方法有對比分析法、平均分析法、交叉分析法等。而探索性資料分析以及驗證性資料分析屬於高階資料分析,常見的分析 15

>> 誰說菜鳥不會資料分析(入門篇) 方法有相關分析、因子分析、迴歸分析等。我們日常學習和工作中涉及的資料分析主要是描述性資料分析,也就是大家常用的初級資料分析。 1.1.2 資料分析的作用 Mr.林:瞭解了資料分析是“神馬” 後,那麼小白,你能想到資料分析在對企業日常經營狀況的分析工作中具體有哪些作用,體現在哪幾方面嗎? 小白:您剛才說過,資料分析就是把隱藏在一大批看似雜亂無章的資料背後的資訊集中和提煉出來,總結出所研究物件的內在規律,幫助管理者進行有效的判斷和決策。我覺得它就好比是從礦山中挖掘出金子。 Mr.林:沒錯,但剛才說的是資料分析的最終目的,要達到這些目的,我們在日常工作中該做些什麼呢?比如日常通報、專題分析等,這些都是資料分析具體工作的體現。而什麼時候做通報,什麼時候該開展專題分析,則需要我們根據實際情況做出選擇。很多人經常做這些工作,但不知為何而做,只是為做而做,沒有想清楚做的目的,所以常常不得要領被資料所湮沒。只有當你對資料分析目的及工作有了足夠清晰的認識,開展資料分析時才會如魚得水,遊刃有餘。 資料分析在企業的日常經營分析中主要有三大作用,如圖1-2所示。 預測分析圖1-2 資料分析三大作用 16 ◎ 現狀分析簡單來說就是告訴你過去發生了什麼。具體體現在: 第一,告訴你企業現階段的整體運營情況,透過各個經營指標的完成情況來衡量企業的運營狀態,以說明企業整體運營是好了還是壞了,好的程度如何,壞的程度又到哪裡。 第二,告訴你企業各項業務的構成,讓你瞭解企業各項業務的發展及變動情況,對企業運營狀況有更深入的瞭解。 現狀分析一般透過日常通報來完成,如日報、週報、月報等形式。 ◎ 原因分析簡單來說就是告訴你某一現狀為什麼發生。

第1章資料分析那些事兒經過第一階段的現狀分析,我們對企業的運營情況有了基本瞭解,但不知道運營情況具體好在哪裡,差在哪裡,是什麼原因引起的。這時就需要開展原因分析,以進一步確定業務變動的具體原因。例如2012年2月運營收入環比下降5%,是什麼原因導致的呢?是各項業務收入都出現下降, 還是個別業務收入下降引起的?是各個地區業務收入都出現下降,還是個別地區業務收入下降引起的?這就需要我們開展原因分析,進一步確定收入下降的具體原因,對運營策略做出調整與最佳化。 原因分析一般透過專題分析來完成,根據企業運營情況選擇針對某一現狀進行原因分析。 ◎ 預測分析簡單來說就是告訴你將來會發生什麼。 在瞭解企業運營現狀後,有時還需要對企業未來發展趨勢作出預測,為制訂企業運營目標及策略提供有效的參考與決策依據,以保證企業的可持續健康發展。 預測分析一般透過專題分析來完成,通常在制訂企業季度、年度等計劃時進行,其開展的頻率沒有現狀分析及原因分析高。 MI.林:小白,現在對資料分析有了進一步認識了吧。什麼時候開展什麼樣的資料分析,需要根據你的需求及目的來確定。 小白:是的,Mr.林,那麼請問資料分析具體如何開展呢?有哪些準備工作要做呢? 1.2 資料分析六步曲 Mr.林:小白,你的問題問得好,現在我們就來看看如何開展資料分析工作。 資料分析過程主要包括6個既相對獨立又互有聯絡的階段。它們是:明確分析目的和思路、 資料收集、資料處理、資料分析、資料展現、報告撰寫等6步(參見圖1-3)。 明確分析目的和思路資料分析數招展現數招收集圖1-3 數招處理資料分析六步曲報告撰寫 17

>> 誰說菜鳥不會資料分析(入門篇) 1.2.1 明確分析目的和思路 ◎ 明確分析目的 Mr.林:做任何事都要有個目標,資料分析也不例外。小白,我們先來看看菜鳥與資料分析師之間的差別。剛好我這裡有一張菜鳥與資料分析師想法對比圖(見圖1-4),你可以對比一下,看看自己在哪些方面想法還屬於菜鳥級別,在哪些方面想法已經達到了資料分析師的水平。 從他們思考問題的方式,你就能發現為什麼一個是菜鳥,而另外一個是資料分析師了。 小白:好的,我來看一看菜鳥與資料分析師各是什麼樣的。 菜鳥與資料分析師的區別菜烏會想這張曲線圖真好看,怎麼作的? 這些資料可以做什麼樣的分析? 葛級的分析方法在這理能用嗎? 零作多少張圖表? 除了為數拇新增文字說明還需提什公? 資料分析報告要寫多少員? 口分析師會想數招變化的背後真相是什麼? 從哪此留安分析數期才有統? 用付麼分析方法最有效? 圖表是否表達出有效的觀點? 資料分析的目的達到了嗎? 數招分析報告有說服力嗎? 18 圖1-4 菜鳥與資料分析師的區別 Mr.林:小白,從菜鳥與資料分析師想法對比圖中,你發現菜鳥與資料分析師的區別了嗎? 小白:我發現,菜鳥很迷茫,目的不明確,而且一味追求高階的分析方法。而資料分析師的目的就很明確,一切都是以解決問題為中心。 Mr.林:說得好!其實他們最主要的區別就在於目的是否明確,如果目的明確,所有問題就自然迎刃而解了。例如,分析師是不會考慮“需要多少張圖表”這樣的問題的,而是思考這張圖表是否有效表達了觀點?如果沒有,需要怎樣調整?如果目的不明確,菜鳥自然會在用什麼樣的分析方法、作多少張圖表、需要多少文字說明、報告要寫多少頁等這些問題上糾結。 小白:我明白了,我不要做菜鳥,我要朝著資料分析師的方向努力。 Mr.林:菜烏與資料分析師的區別就在於菜烏做分析時目的不明確,從而導致分析過程非常盲目。所以在開展資料分析之前,要想想:為什麼要開展資料分析?透過這次資料分析我要解決什麼問題?只有明確資料分析的目標,資料分析才不會偏離方向,否則得出的資料分析結果不僅沒有指導意義,甚至可能將決策者引入歧途,後果嚴重。 ◎ 確定分析思路 MT.林:當分析目的明確後,我們就要梳理分析思路,並搭建分析框架,把分析目的分解成第1章資料分析那些事兒若干個不同的分析要點,即如何具體開展資料分析,需要從哪幾個角度進行分析,採用哪些分析指標。 只有明確了分析目的,分析框架才能跟著確定下來,最後還要確保分析框架的體系化,使分析結果具有說服力。 小白:Mr.林,前面說的角度與指標我都理解,但分析體系化應該如何理解呢? Mr.林:體系化也就是邏輯化,簡單來說就是先分析什麼,後分析什麼,使得各個分析點之間具有邏輯聯絡。這也是很多人常常感到困擾的問題,比如經常不知從哪方面入手,分析的內容和指標常常被質疑是否合理、完整,而自己也說不出個所以然來,所以體系化就是為了讓你的分析框架具有說服力。 小白:如何使分析框架體系化呢? Mr.林:問得好!根據我的經驗,就是以營銷、管理等理論為指導,結合實際業務情況,搭建分析框架,這樣才能確保資料分析維度的完整性,分析結果的有效性及正確性。 營銷方面的理論模型有4P、使用者使用行為、STP理論、SWOT等,而管理方面的理論模型有 PEST、5W2H、時間管理、生命週期、邏輯樹、金字塔、SMART原則等。這些都是經典的營銷、管理方面的理論,需要在工作中不斷實踐應用,你才能體會其強大的作用。如圖1-5所示,就是以 PEST分析理論為指導,搭建的網際網路行業PEST分析框架,故而使資料分析變得有血有肉有脈絡, 真正做到理論指導實踐。其他具體應用我在後面會為你介紹。 政治經濟聯網行業分析社會技術 • 國家出臺了哪些相關政策?有何影響?制約還是促進? 團相關法律有哪些?有何影啊? • GDP及增長麥、進出口總額及增長蜜消費價格指數、失業蜜、包R可支配收入 • 在人口規模、性別比例、年齡結構、人口分佈、生活方式、購買習慣、教育狀況、城市、宗教信印狀況等方面,網民與全團人R 是否有區別? 圖技術的發明、傳播、更新、商品化速度,技術發展趨粉 • 國家重點支援專案、國寮投入的研發費用、專利個數圖1-5 網際網路行業PEST分析框架明確資料分析目的以及確定分析思路,是確保資料分析過程有效進行的先決條件,它可以為資料的收集、處理及分析提供清晰的指引方向。 小白:嗯,在做資料分析前,先想想到底為什麼要做資料分析,明確資料分析方向,才能保證不迷失在資料的叢林中。 19

>> 誰說菜鳥不會資料分析(入門篇) 1.2.2 資料收集 Mr.林:資料收集是按照確定的資料分析框架,收集相關資料的過程,它為資料分析提供了素材和依據。這裡所說的資料包括第一手資料與第二手資料,第一手資料主要指可直接獲取的數據,第二手資料主要指經過加工整理後得到的資料。一般資料來源主要有以下幾種方式,如圖 1-6所示。 ①資料庫 ②公開出版物 ③ 網際網路 ④ 市場調查圖1-6 資料的來源 20 ◎ 資料庫每個公司都有自己的業務資料庫,存放從公司成立以來產生的相關業務資料。這個業務資料庫就是一個龐大的資料資源,需要有效地利用起來。 ◎公開出版物可以用於收集資料的公開出版物包括《中國統計年鑑》《中國社會統計年鑑》《中國人口統計年鑑》《世界經濟年鑑》《世界發展報告》等統計年鑑或報告。 ◎ 網際網路隨著網際網路的發展,網路上釋出的資料越來越多,特別是搜尋引擎可以幫助我們快速找到所需要的資料,例如國家及地方統計局網站、行業組織網站、政府機構網站、傳播媒體網站、大型綜合入口網站等上面都可能有我們需要的資料。 ◎ 市場調查進行資料分析時,需要了解使用者的想法與需求,但是透過以上三種方式獲得此類資料會比較困難,因此可以嘗試使用市場調查的方法收集使用者的想法和需求資料。市場調查就是指運用科學的方法,有目的、有系統地收集、記錄、整理有關市場營銷的資訊和資料,分析市場情況,瞭解第1章資料分析那些事兒市場現狀及其發展趨勢,為市場預測和營銷決策提供客觀、正確的資料資料。市場調查可以彌補其他資料收集方式的不足,但進行市場調查所需的費用較高,而且會存在一定的誤差,故僅作參考之用。 小白:看來我以後做資料分析時,不用擔心沒有資料來源啦。 1.2.3 資料處理 Mr.林:資料處理是指對收集到的資料進行加工整理,形成適合資料分析的樣式,它是資料分析前必不可少的階段。資料處理的基本目的是從大量的、雜亂無章、難以理解的效據中,抽取並推匯出對解決問題有價值、有意義的資料。 資料處理主要包括資料清洗、資料轉化、資料提取、資料計算等處理方法(參見圖1-7)。 一般拿到手的資料都需要進行一定的處理才能用於後續的資料分析工作,即使再“乾淨”的原始資料也需要先進行一定的處理才能使用。 資料清洗資料轉化數招提取數擱計算圖1-7 資料處理小白:哦,資料處理是資料分析的前提,對有效資料的分析才是有意義的,明白啦! 1.2.4 資料分析 Mr.林:資料分析是指用適當的分析方法及工具,對處理過的資料進行分析,提取有價值的資訊,形成有效結論的過程。 資料分析 21

22 >> 誰說菜鳥不會資料分析(入門篇) 在確定資料分析思路的階段,資料分析師應當為需要分析的內容確定適合的資料分析方法, 等到真正進入進行資料分析階段時,就能夠駕馭資料,從容地進行分析和研究了。 由於資料分析多是透過軟體來完成的,這就要求資料分析師不僅要掌握各種資料分析方法, 還要熟悉主流資料分析軟體的操作。一般的資料分析我們可以透過Excel完成,後面也將重點為你介紹,而高階的資料分析就要採用專業的分析軟體進行了,如資料分析工具SPSS Statistics等。 小白:好的,期待您後續精彩的資料分析講解。 ◎ 資料分析與資料處理的區別小白:Mr.林,我有個問題。我經常聽到資料處理和資料分析這兩個詞,它們之間有何關係呢? Mr.林:從前面介紹資料處理和分析的過程不難看出,資料處理是資料分析的基礎。透過數據處理,將收集到的原始資料轉換為可以分析的形式,並且保證資料的一致性和有效性。如果數據本身存在錯誤,那麼即使採用最先進的資料分析方法,得到的結果也是錯誤的,不具備任何參考價值,甚至還會誤導決策。 ◎ 資料分析與資料探勘的關係小白:還有個問題,我常聽到資料探勘,那麼資料探勘是什麼呢?它與資料分析有什麼關系呢? Mr.林:這個問題問得好!資料探勘其實是一種高階的資料分析方法。 資料探勘就是從大量的資料中挖掘出有用的資訊,它是根據使用者的特定要求,從浩如煙海的資料中找出所需的資訊,以滿足使用者的特定需求。資料探勘技術是人們長期對資料庫技術進行研究和開發的結果。一般來說,資料探勘側重解決四類資料分析問題:分類、聚類、關聯和預測, 重點在尋找模式與規律。 資料分析與資料探勘的本質是一樣的,都是從資料裡面發現關於業務的知識。 資料探勘現在還不是你學習的重點,如果你有興趣,可在掌握一定的資料分析知識後,再進一步查閱相關資料學習。 1.2.5 資料展現小白:您剛才講透過分析,隱藏在資料內部的關係和規律就會逐漸浮現出來,那麼透過什麼方式展現出這些關係和規律,才能讓人一目瞭然呢? Mr.林:不錯,孺子可教也!這就是我接下來要說的資料展現了。眾所周知,每個人看待事物都有自己的理解方式,所以資料分析師在展現結果的時候一定要保證絕大部分人的理解是一致的。

第1章資料分析那些事兒資料展現一般情況下,資料是透過表格和圖形的方式來呈現的,我們常說用圖表說話就是這個意思。 常用的資料圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等,當然可以對這些圖表進一步整理加工,使之變為我們所需要的圖形,例如金字塔圖、矩陣圖、漏斗圖、帕雷託圖等。 大多數情況下,人們更願意接受圖形這種資料展現方式,因為它能更加有效、直觀地傳遞出分析師所要表達的觀點。記住,在一般情況下,能用圖說明問題的就不用表格,能用表格說明問題的就不用文字。 小白:原來圖表的運用還這麼有講究呀,我一定好好學習如何用圖表說話! 1.2.6 報告撰寫 Mr.林:資料分析報告其實是對整個資料分析過程的一個總結與呈現。透過報告,把資料分析的起因、過程、結果及建議完整地呈現出來,供決策者參考。所以,資料分析報告是透過對數據全方位的科學分析來評估企業運營質量,為決策者提供科學、嚴謹的決策依據,以降低企業運營風險,提高企業核心競爭力。 一份好的資料分析報告,首先需要有一個好的分析框架,並且圖文並茂,層次明晰,能夠讓閱讀者一目瞭然。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文並茂,可以令資料更加生動活潑,提高視覺衝擊力,有助於閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。 另外,資料分析報告需要有明確的結論,沒有明確結論的分析稱不上分析,同時也失去了報告的意義,因我們最初就是為尋找或者求證一個結論才進行分析的,所以千萬不要捨本求末。 最後,好的分析報告一定要有建議或解決方案。作為決策者,需要的不僅僅是找出問題,更重要的是建議或解決方案,以便他們在決策時作參考。所以,資料分析師不僅需要掌握資料分析方法,而且還要了解和熟悉業務,這樣才能根據發現的業務問題,提出具有可行性的建議或解決方案。下面的圖1-8給出了一個分析報告的基本框架示例。 23

>> 誰說菜鳥不會資料分析(入門篇) 目錄 2010年XX分析報告數瑁分析部 2011年1月10日一,分折得受與目的,分聽思器三,分忻正文 1.XX分析 2、XX分析 3、XX分析 4.XX分析四。總精與建議 XX分析 •XO0X0OK: X0CXKXXXXOKX 總結與建議公司產品XXXXL9 I0口 PRI 產品3 XXXX XXXX XXXX XXXX 建議 XXXX XXXX • XXXX •XXXX 口 PR 圖1-8 資料分析報告示例 Mr.林:以上是資料分析的6個關鍵步驟,今天只是簡要介紹,以後將逐一為你講解。說了這麼多,給你講個段子輕鬆一下,順便回顧下剛講的內容。 小白一聽有段子聽,立馬精神起來:好啊!好啊! Mr.林:如何判斷資料分析師正處於分析流程的哪個階段? * 手托腮幫,沉思痛苦狀—一在思考分析思路。 * 手放鍵盤上不動,表情呆滯—一在資料處理。 * 滑鼠在飛快移動——在用資料透視表做分析。 * 不斷交替點選滑鼠左右鍵— -在畫圖表。 * 斷斷續續敲擊鍵盤,時而移動滑鼠——在寫PPT分析報告。 小白:還真形象啊!Mr.林,您該不會說的就是您自己吧?呵呵! Mr.林:哈哈,資料分析師差不多都是這樣的狀態。 1.3 資料分析的三大誤區 Mr.林:小白,剛才對資料分析進行了簡要介紹,而在實際的學習、工作中,常常有資料分析人員陷入一些誤區,現在我來講一講這些誤區,你日後一定要注意。 小白:好的,請Mr.林指教。 ◎ 分析目的不明確,為分析而分析 Mr.林:經常有人問:要用多少圖?除了擺資料,還需要說些什麼?在此我想說的是,資料分析不應為了分析而分析,而是應該圍繞你的分析目的(瞭解現狀、找出業務變動原因、預測發第1章資料分析那些事兒展等)而進行分析。 只有對自己的目的有清晰的認識,你才知道要怎樣去實現這個目的,需要透過哪些圖表展現,才會知道這些圖表是否能反映問題,自然而然地進行相應的問題分析,而不是連該說些什麼都不知道。 ◎ 缺乏業務知識,分析結果偏離實際 Mr.林:目前現有的資料分析師大多是統計學、計算機、數學等專業出身,他們大多缺乏從事營銷、管理方面的工作經驗,對業務的理解相對較淺,對資料的分析偏重於資料分析方法的使用,如迴歸分析、相關分析等。 有的公司老闆抱怨手下的資料分析師每天給他看幾十個零散資料,雖然做出的報告很專業, 圖表也很漂亮,但所作的分析忽視了業務邏輯上的關聯性,得不到全面、綜合性的結論。 在企業中所作的資料分析不是純資料分析,而是需要多從業務方面進行分析,不應停留在數據表面,要思考資料背後的事實與真相,使得分析結果更加切合實際,為老闆的決策提供有力的支撐,否則就是紙上談兵。 所以說,資料分析師的任務不是單純做數學題,資料分析師還必須懂營銷,懂管理,更要懂策略。 ◎ —味追求使用高階分析方法,熱衷研究模型 MT.林:在進行資料分析時,相當一部分人都喜歡用迴歸分析、因子分析等高階分析方法, 總認為有分析模型就是專業的,只有這樣才能體現專業性,結果才是可信的。其實不然,高階的資料分析方法不一定是最好的,能夠簡單有效解決問題的方法才是最好的。 我們堅信,僅有分析模型遠遠不夠,圍繞業務發現問題並解決問題才是資料分析的最終目的!不論高階的分析方法還是簡單的分析方法,只要能夠解決業務問題,就是好方法,正如我們常說的“不論黑貓還是白貓,只要能抓老鼠就是好貓”。 小白:好的,我在以後的工作中會注意這些的,做好一個資料分析師並不是一件容易的事, 我要努力向Mr.林靠齊。 1.4 資料分析師的職業發展 1.4.1 資料分析的廣闊前景 Mr.林:資料分析作為一個新的行業領域正在全球迅速發展,它開闢了人類獲取知識的新途徑。 25

>> 誰說菜鳥不會資料分析(入門篇) 目前,資料庫技術、軟體工具、各種硬體裝置飛速發展,在這些軟硬體技術與裝置的支援下,資訊科技的應用已在各行各業全面展開,尤其是對通訊、網際網路、金融等行業的發展做出了巨大貢獻,並且經過長期的應用積累了大量豐富的資料。但大部分企業對其儲存資訊的利用率極低。龐大的歷史資料是否有價值?有何價值?是否可以綜合利用分析?是否能夠為領導決策提供參考依據? 回答是肯定的,資料分析這一項工作越來越受到決策層的重視,藉助資料分析的各種工具, 從海量的歷史資料中提取、挖掘對業務發展有價值的、潛在的知識,找出趨勢,為決策層的決策提供有力的依據,對產品或服務的發展方向起到積極作用,有力推動企業的科學化、資訊化管理。 從20世紀90年代起,歐美國家開始大量培養資料分析師,直到現在,對資料分析師的需求仍然長盛不衰,而且還有擴張之勢。根據美國勞工部預測,到2018年,資料分析師的需求量將增長 20%。就算你不是資料分析師,但資料分析技能也是未來必不可少的工作技能之一。 小白:資料分析師如此搶手的原因何在呢? Mr.林:一個簡單的原因就是社會越發達,人們對資料的依賴就越多。無論政府決策還是公司運營,科學研究還是媒體宣傳,都需要資料支援。那麼,對資料有如此大的依賴,就必然導致對資料分析的大量需求。因此,將資料轉化為知識、結論和規律,就是資料分析的作用和價值。 小白:那資料究竟會龐大到什麼地步呢? Mr.林:據國際知名諮詢公司估計,到2020年,全球每年產生的資料量將達到3500萬億GB, 打個比方,就是用普通的DVD一張一張地摞起來,可以從地球摞到月球兩次。 「、 35,000,000,000,000,000GB 26 全球每年產生的資料量面對這樣龐大的資料,對資料分析師的要求就不僅僅是單純做分析了,更重要的是與相關業務部門進行合作,將資料真正應用到業務中,根據實際的業務發展情況識別哪些資料可用,哪些不適用,而不是孤立地在“真空環境”下進行分析。這就要求資料分析師不僅具備洞察資料的能力,還要對相關業務的背景有深入的瞭解,明白客戶或業務部門的需求,從而將資料資訊化、可第1章資料分析那些事兒視化,最後轉化為生產力,幫助企業獲得利潤,這就是整個資料“供應鏈”。當然,資料分析師也需要理解這個“供應鏈”。 1.4.2 資料分析師的職業要求小白:那麼怎樣才能成為一名優秀的資料分析師呢?資料分析師的職業要求又有哪些? Mr.林:你的問題可以用“五懂” 來回答,即懂業務、懂管理、懂分析、懂工具,還要懂設計o ◎ 懂業務從事資料分析工作的前提就是需要懂業務,即熟悉行業知識、公司業務及流程,最好有自己獨到見解,若脫離行業認知和公司業務背景,分析的結果只會是脫了線的風箏,沒有太大的實用價值。 例如公司2011年的運營收入是1000萬元,那麼不熟悉業務的資料分析師看到的只是1000萬這個數字,而熟悉業務的資料分析師,還能看到這個數字背後隱藏的資訊,如1000萬元是由哪幾個業務收入構成,哪個業務收入佔主要部分,哪個業務收入是最小佔比,最高業務收入的地區又是哪個地區等。 這就是懂業務與不懂業務的資料分析師之間的區別。 從另外一個角度來說,懂業務也是資料敏感的體現。不懂業務的資料分析師,看到的只是一個個數字;懂業務的資料分析師,則看到的不僅僅是數字,他明白數字代表什麼意義,知道數字是大了還是小了,心中有數,這才是真正意義的資料敏感性。 ◎ 懂管理懂管理,一方面是搭建資料分析框架的要求,比如剛才介紹的資料分析六步曲的第一步確定分析思路就需要用到營銷、管理等理論知識來指導,如果不熟悉管理理論,那你如何指導資料分析框架的搭建,以及開展後續的資料分析呢? 懂管理另一方面的作用是針對資料分析結論提出有指導意義的分析建議,如果沒有管理理論的支撐,就難以確保分析建議的有效性。 所以資料分析師需要掌握一定的管理理論知識。 ◎ 懂分析懂分析是指掌握資料分析的基本原理與一些有效的資料分析方法,並能靈活運用到實踐工作中,以便有效地開展資料分析。 基本的分析方法有:對比分析法、分組分析法、交叉分析法、結構分析法、漏斗圖分析法、 綜合評價分析法、因素分析法、矩陣關聯分析法等。 27

28 >> 誰說菜鳥不會資料分析(入門篇) 高階的分析方法有:相關分析法、迴歸分析法、聚類分析法、判別分析法、主成分分析法、 因子分析法、對應分析法、時間序列等。 不論簡單還是複雜的分析方法,只要能解決問題的方法就是好方法。 ◎ 懂工具懂工具是指掌握資料分析相關的常用工具。資料分析工具就是實現資料分析方法理論的工具,面對越來越龐大的資料,依靠計算器進行分析是不現實的,必須利用強大的資料分析工具完成資料分析工作。 常用的資料分析工具有Excel、Access、SPSS、SAS,建議先用好Excel分析工具。Excel就是一款非常實用的資料處理、分析工具,它能解決、滿足你工作中80%,甚至100%的要求。有興趣、時間、需要的話,再學習SPSS、SAS等統計分析工具。 同樣,應該根據研究的問題選擇合適的工具,只要能解決問題的工具就是好工具。 ◎ 懂設計懂設計是指運用圖表有效表達資料分析師的分析觀點,使分析結果一目瞭然。 圖表的設計是門大學問,如圖形的選擇、版式的設計、顏色的搭配等,都需要掌握一定的設計原則。 小白:顏色搭配都有要求?不能根據我自己的喜好選擇麼? Mr.林:當然有要求,根據喜好選擇也要在符合設計原則的基礎上選擇,例如公司的VI設計是以藍色為主色調,屬冷色系,那麼你選的圖表顏色就要與公司的VI設計相吻合,儘量避免使用紅色、黃色等暖色系的顏色,這方面知識我會在講到資料展現部分再為你詳細介紹。 小白:好的,看來要成為一名合格的資料分析師還有很長的路要走啊。 1.4.3 資料分析師的基本素質 Mr.林接著說道:要成為一名優秀的資料分析師並非一件容易的事。雖然大學的專業與資料分析不相關,但你可以透過工作中的實踐來學習資料分析,這需要付出大量的時間和精力,不經一番寒徹骨,怎得梅花撲鼻香? 小白點點頭:嗯,我會努力的。 Mr.林:剛才介紹的是資料分析師的職業要求,現在再介紹資料分析師的五大基本能力和素質。 ◎ 態度嚴謹負責嚴謹負責是資料分析師的必備素質之一,只有本著嚴謹負責的態度,才能保證資料的客觀、 準確。 資料分析師可以說是企業的醫生,他們透過對企業運營資料的分析,為企業尋找癥結及潛在第1章資料分析那些事兒問題。一名合格的資料分析師,應具有嚴謹負責的態度,保持中立立場,客觀評價企業在發展過程中存在的問題,決策層提供有效的參考依據。資料分析師不應受其他因素影響而更改資料, 隱瞞企業存在的問題,這樣做對企業發展是非常不利的,甚至會造成嚴重的後果。而且,對資料分析師自身來說,其職業生涯也會受影響,從此以後所做的資料分析結果都將受到質疑,因為你不再是可信賴的人,在同事、領導、客戶面前已經失去了信任。 所以,作為一名資料分析師就必須持有嚴謹負責的態度,這也是最基本的職業道德。 倪東海提嚴謹負責 ◎ 好奇心強烈又好奇心人皆有之,但是作為資料分析師,這份好奇心就應該更強烈,應該把自己當成資料福爾摩斯,要積極主動地發現和挖掘隱藏在資料內部的真相。?° 好奇心強烈 29

>> 誰說菜鳥不會資料分析(入門篇) 在資料分析師的腦子裡,應該充滿著無數個“為什麼”: 什麼是這樣的結果,為什麼不是那樣的結果,導致這個結果的原因是什麼,為什麼結果不是預期的那樣等等,只有這樣才有突破點。 這一系列問題都要在進行資料分析時提出來,並且透過資料分析,給自己一個滿意的答案。 越是優秀的資料分析師,好奇心越不容易滿足,回答了一個問題,又會丟擲一個新的問題,繼續冊究下去。 只有擁有了這樣一種刨根問底的精神,才會對資料和結論保持敏感,繼而順藤摸瓜,找出數據背後的真相。當然,你也會從中獲取成就感。 ◎ 邏輯思維清晰除了一顆探索真相的好奇心,資料分析師還需要具備縝密的思維和清晰的邏輯推理能力。我記得有位大師說過:結構為王。何謂結構,結構就是我們常說的邏輯,不論說話還是寫文章的時候都要有條理、有目的地做,不可眉毛鬍子一把抓,不分主次。 通常,從事資料分析時所面對的商業問題都是較為複雜的,我們要思考錯綜複雜的成因,分析所面對的各種複雜的環境因素,並在問題的若干發展可能性中選擇一個最優的方向。這就需要我們對事實有足夠的瞭解,同時也需要我們能真正理清問題的整體以及區域性的結構,在深度思考後,理清結構中相互的邏輯關係,只有這樣才能真正客觀地、科學地找到商業問題的答案。 邏輯思維清晰 ◎ 擅長模仿學習在做資料分析時,有自己的想法固然重要,但是“前車之鑑”也是非常有必要學習的,它能幫助資料分析師迅速地成長。因此,模仿學習是快速提高學習成果的有效方法。這裡說的模仿主要是指參考、借鑑他人優秀的分析思路和方法,而非直接“照搬”。 成功的模仿需要領會他人方法的精髓,理解其分析原理,透過表面達到實質。萬變不離其宗,要善於將這些精華轉化為自己的知識,否則,只能是“一直在模仿,從未超越過”。 30

第1章資料分析那些事兒誰說菜烏不會資料分析擅長模仿學習冬 ◎ 勇於創新透過模仿可以借鑑他人的成功經驗,但模仿的時間不宜太長,並且建議每次模仿後都要進行總結,提出可以改進的地方,甚至要有所創新,不斷總結分析方法、分析思路、分析流程,在總結中前行。 創新是一個優秀資料分析師應具備的精神,只有不斷的創新,才能提高自己的分析水平,使自己站在更高的角度來分析問題,為整個研究領域乃至社會帶來更多的價值。現在的分析方法和研究課題千變萬化,墨守成規是無法很好地解決所面臨的新問題的。 創新聽到這裡,小白就掰著手指頭算自己有幾條符合優秀資料分析師的素質和能力。 Mr.林繼續說道:學習資料分析需要時間和經驗的積累,這些素質與能力不是說有就有的, 需要慢慢培養形成,不能一蹴而就。在工作中運用不同的分析方法對資料進行分析,並與業務部門的同事積極溝通,加深自己對整個行業或研究內容的理解,相信在兩到三年內,你就能成為一名合格的資料分析師。 31

>> 誰說菜鳥不會資料分析(入門篇) 小白:好的,我會努力學習的。 1.5 幾個常用指標和術語 MI.林:一個優秀的資料分析師要有紮實的資料解讀功底,因為在進行資料分析時,經常會遇到一些分析指標或術語,對這些指標或術語的理解不夠充分就沒法開展工作。還有點時間,我先給你簡單介紹一些基礎的分析指標和術語。 小白:太好了!拿支筆先~~ ◎ 平均數 MT.林:我們在日常生活中提到的平均數,一般是指算術平均數,就是一組資料的算術平均值,即全部資料累加後除以資料個數。算術平均數是非常重要的基礎性指標,它的特點是將總體內各單位的數量差異抽象化,代表總體的一般水平,掩蓋了總體內各單位的差異。 例如現有某學期學生的數學考試成績,透過計算成績平均數,可得如圖1-9所示的結果。將每位同學的數學成績與平均數相比較,就能發現哪些同學的數學成績高於平均數,需要保持;哪些同學的成績低於平均數,需要繼續努力。 要努力喔! 數學平均成績 84 32 楊洋 75 楚中天趙鷳:85 郭南鄧柏涵 88 90 圖1-9 數學平均成績當然,在平均數這個指標中,除算術平均數以外,還有其他平均數,如調和平均數和幾何平均數。 小白:一個小小的平均數都有這麼多學問呀。 ◎ 絕對數與相對數 Mr.林:絕對數是反映客觀現象總體在一定時間、地點條件下的總規模、總水平的綜合性指標,也是資料分析中常用的指標,如GDP、總人口等。此外,絕對數也可以表現為在一定時間、 地點條件下數量增減變化的絕對數,比如A國人口比B國人口多1000萬人。 相對數是指由兩個有聯絡的指標對比計算而得到的數值,用以反映客觀現象之間數量聯絡程第1章資料分析那些事兒度的綜合指標。計算相對數的基本公式是: 相對數=比較數值(比數) 基礎數值(基數) 分母是用做對比標準的指標數值,簡稱基數;分子是用做與基數對比的指標數值,簡稱比數。相對數一般以倍數、成數、百分數等表示,它反映了客觀現象之間數量聯絡的程度。 使用相對數時需要注意指標的可比性,同時要與總量指標(絕對數)結合使用。關於絕對數與相對數,我舉幾個例子,你一看就明白了,如圖1-10所示。 我們是絕對數我們是相對數 5000萬人 1000萬元300米 500家 20% 7成 3% 6倍 1:5 120元/人圖1-10 絕對數與相對數 ◎ 百分比與百分點 Mr.林:百分比是相對數中的一種,它表示一個數是另一個數的百分之幾,也稱百分率或百分數。百分比通常採用百分號(%)來表示,如8%, 50%,168%等。由於百分比的分母都是100, 也就是都以1%作為度量單位(如圖1-11所示),因此便於比較,在資料分析中的應用非常廣泛。 10 100 =10% 圖1-11 百分比的表示形式百分點是指不同時期以百分數的形式表示的相對指標的變動幅度,1個百分點=1%。例如, 圖1-12中某公司發言人就混淆了百分比與百分點的概念。表示構成的變動幅度不宜用百分數, 而應該用百分點。因此,這位公司發言人正確的說法應該是“公司今年的利潤是45%,比去年的 28%提高了17個百分點”。 危 Lodies ond 鄉親們. 我們公司今年的利潤是45%,比去年的 28%提高了17 圖1-12 百分比與百分點 33

>>誰說菜鳥不會資料分析(入門篇) ◎ 頻數與頻率 Mr.林:頻數是指一組資料中個別資料重複出現的次數。如圖1-13的左圖所示,某校A班共50 名學生,按性別進行分組,分為男與女兩個組別,男同學的頻數為30,女同學的頻數為20。 頻率是每組類別次數與總次數的比值,它代表某類別在總體中出現的頻繁程度,一般採用百分數表示,所有組的頻率加總等於100%。還是用某校A班的例子,30個男同學在50個同學中出現的頻率為60%,即(30+50)×100%;而20個女同學在50個同學中出現的頻率為40%,即 (20+50)×100%,如圖1-13的右圖所示。 小白:所以頻數是絕對數,頻率是相對數。 Mr.林讚許地說:對,活學活用,你領悟得很快嘛。 00% 30 名男 40% 20 女圖1-13頻數與頻率 ◎ 比例與比率 Mr.林:比例與比率都屬於相對數。 比例是指在總體中各部分的數值佔全部數值的比重,通常反映總體的構成和結構。比如A班共有學生50人,男生30人,女生20人,則男生的比例是30:50,女生的比例是20:50。由此可以看出,比例的基數(也就是分母)都是全體學生人數,即為同一個基數。 比率是指不同類別數值的對比,它反映的不是部分與整體之間的關係,而是一個整體中各部分之間的關係。比如剛才的例子,男生30人,女生20人,則男生與女生的比率是30:20,如圖 1-14所示。這一指標經常會用在社會經濟領域,比如我國的人口性別比就是用每100名女性數量相對的男性數量來表示的。 34 二男生比例 G品口男女比森圖1-14 比例與比率