大牛數據分析師(shī)養成日記
作者:admin  來源:36大數據  發表時間:2016-5-17  點擊:3635

  最近接到(dào)一(yī)個(gè)職業(yè)訪談的邀請,要給對數據分析感興趣的新人Y(目前在知名電(diàn)商從(cóng)事(shì)系統開(kāi)發和維護)一(yī)些建議,才突然發現自(zì)己在這個(gè)領域打滾了一(yī)段時間,一(yī)陣感歎後,寫下(xià)自(zì)己的一(yī)些體會(huì),盡管不全面,但或許能(néng)夠給新人一(yī)些借鑒。如有不妥地方,請各位數據大牛輕拍。

  一(yī)、數據分析師(shī)有哪些要求?

  1、理論要求及對數字的敏感性,包括統計知識、市(shì)場研究、模型原理等。

  2、工(gōng)具使用,包括挖掘工(gōng)具、數據庫、常用辦公軟件(jiàn)(excel、PPT、word、腦(nǎo)圖)等。

  3、業(yè)務理解能(néng)力和對商業(yè)的敏感性。對商業(yè)及産品要有深刻的理解,因為(wèi)數據分析的出發點就(jiù)是要解決商業(yè)的問題,隻有理解了商業(yè)問題,才能(néng)轉換成數據分析的問題,從(cóng)而滿足部門(mén)的要求。

  4、彙報(bào)和圖表展現能(néng)力。這是臨門(mén)一(yī)腳,做得再好的分析模型,如果不能(néng)很好地展示給領導和客戶,成效就(jiù)大打折扣,也會(huì)影響到(dào)數據分析師(shī)的職業(yè)晉升。

  二、請把數據分析作為(wèi)一(yī)種能(néng)力來培養

  從(cóng)廣義來說,現在大多(duō)數的工(gōng)作都需要用到(dào)分析能(néng)力,特别是數據化運營理念深入的今天,像BAT這樣的公司強調全員(yuán)參與數據化運營,所以,把它作為(wèi)一(yī)種能(néng)力培訓,将會(huì)讓你終生(shēng)受益。

  三、從(cóng)數據分析的四個(gè)步驟來看(kàn)清數據分析師(shī)需具備的能(néng)力和知識:

  數據分析的四個(gè)步驟(這有别于數據挖掘流程:商業(yè)理解、數據理解、數據準備、模型搭建、模型評估、模型部署),是從(cóng)更宏觀地展示數據分析的過程:獲取數據、處理數據、分析數據、呈現數據。

  (一(yī))獲取數據

  獲取數據的前提是對商業(yè)問題的理解,把商業(yè)問題轉化成數據問題,要通(tōng)過現象發現本質,确定從(cóng)哪些緯度來分析問題,界定問題後,進行數據的采集。此環節,需要數據分析師(shī)具備結構化的思維和對商業(yè)問題的理解能(néng)力。

  推薦書籍:《金字塔原理》、麥肯錫三部曲:《麥肯錫意識》、《麥肯錫工(gōng)具》、《麥肯錫方法》

  工(gōng)具:思維導圖、mindmanager軟件(jiàn)

  (二)處理數據

  一(yī)個(gè)數據分析項目,通(tōng)常數據處理時間占70%以上(shàng),使用先進的工(gōng)具有利于提升效率,所以盡量學習最新最有效的處理工(gōng)具,以下(xià)介紹的是最傳統的,但卻很有效率的工(gōng)具:

  Excel:日常在做通(tōng)報(bào)、報(bào)告和抽樣分析中經常用到(dào),其圖表功能(néng)很強大,處理10萬級别的數據很輕松。

  UltraEdit:文本工(gōng)具,比TXT工(gōng)具好用,打開(kāi)和運行速度都比較快。

  ACCESS:桌面數據庫,主要是用于日常的抽樣分析(做全量統計分析,消耗資源和時間較多(duō),通(tōng)常分析師(shī)會(huì)随機(jī)抽取部分數據進行分析),使用SQL語言,處理100萬級别的數據還(hái)是很快捷。

  Orcle、SQLsever:處理千萬級别的數據需要用到(dào)這兩類數據庫。

  當然,在自(zì)己能(néng)力和時間允許的情況下(xià),學習新流行的分布式數據庫及提升自(zì)身的編程能(néng)力,對未來的職業(yè)發展也有很大幫助。

  分析軟件(jiàn)主要推薦:

  SPSS系列:老牌的統計分析軟件(jiàn),SPSSStatistics(偏統計功能(néng)、市(shì)場研究)、SPSSModeler(偏數據挖掘),不用編程,易學。

  SAS:老牌經典挖掘軟件(jiàn),需要編程。

  R:開(kāi)源軟件(jiàn),新流行,對非結構化數據處理效率上(shàng)更高(gāo),需編程。

  随著(zhe)文本挖掘技(jì)術(shù)進一(yī)步發展,對非結構化數據的分析需求也越來越大,需要進一(yī)步關注文本挖掘工(gōng)具的使用。

  (三)分析數據

  分析數據,需要用到(dào)各類的模型,包括關聯規則、聚類、分類、預測模型等,其中一(yī)個(gè)最重要的思想是對比,任何的數據需要在參照(zhào)系下(xià)進行對比,結論才有意義。

  推薦的書籍:

  1、《數據挖掘與數據化運營實戰,思路(lù)、方法、技(jì)巧與應用》,盧輝著(zhe),機(jī)械出版社。這本書是近年(nián)國(guó)内寫得最好的,務必把它當作聖經一(yī)樣來讀(dú)。

  2、《誰說菜鳥不會(huì)數據分析(入門(mén)篇)》和《誰說菜鳥不會(huì)數據分析(工(gōng)具篇)》,張文霖等編著(zhe)。屬于入門(mén)級的書,适合初學者。

  3、《統計學》第五版,賈俊平等編著(zhe),中國(guó)人民(mín)大學出版社。比較好的一(yī)本統計學的書。

  4、《數據挖掘導論》完整版,[美]Pang-NingTan等著(zhe),範明等翻譯,人民(mín)郵電(diàn)出版社。

  5、《數據挖掘概念與技(jì)術(shù)》,JiaweiHan等著(zhe),範明等翻譯,機(jī)械工(gōng)業(yè)出版社。這本書相(xiàng)對難一(yī)些。

  6、《市(shì)場研究定量分析方法與應用》,簡明等編著(zhe),中國(guó)人民(mín)大學出版社。

  7、《問卷統計分析實務—SPSS操作與應用》,吳明隆著(zhe),重慶大學出版社。在市(shì)場調查領域比較出名的一(yī)本書,對問卷調查數據分析講解比較詳細。

  (四)呈現數據

  該部分需要把數據結果進行有效的呈現和演講彙報(bào),需要用到(dào)金字塔原理、圖表及PPT、word的呈現,培養良好的演講能(néng)力。

  推薦書籍:

  1、《說服力讓你的PPT會(huì)說話》,張志(zhì)等編著(zhe),人民(mín)郵電(diàn)出版社。

  2、《别告訴我你懂(dǒng)ppt》加強版,李治著(zhe),北(běi)京大學出版社。

  3、《用圖表說話》,基恩。澤拉茲尼著(zhe),馬曉路(lù)等翻譯,清華大學出版社。

  (五)其他的知識結構

  數據分析師(shī)除了具備數學知識外,還(hái)要具備市(shì)場研究、營銷管理、心理學、行為(wèi)學、産品運營、互聯網、大數據等方面的知識,需要構建完整廣泛的知識體系,才能(néng)支撐解決日常遇到(dào)的不同類型的商業(yè)問題。

  推薦書籍:

  1、《消費(fèi)者行為(wèi)學》第10版,希夫曼等人著(zhe),江林等翻譯,中國(guó)人民(mín)大學出版社,現在應該更新到(dào)更高(gāo)的版本。

  2、《怪誕行為(wèi)學》升級版,艾瑞裡(lǐ)著(zhe),趙德亮等翻譯,中信出版社

  3、《營銷管理》,科特勒等著(zhe),梅清豪翻譯,格緻出版社和上(shàng)海人民(mín)出版社聯合出版

  4、《互聯網思維—獨孤九劍》,趙大偉主編,機(jī)械出版社

5、《大數據時代—生(shēng)活、工(gōng)作與思維的大變革》,舍恩伯格等著(zhe),周濤等翻譯,浙江人民(mín)出版社

  四、關于數據分析師(shī)的職業(yè)發展:

  1、數據分析師(shī)通(tōng)常分兩類,分工(gōng)不同,但各有優勢。

  一(yī)類是在專門(mén)的挖掘團隊裡(lǐ)面從(cóng)事(shì)數據挖掘和分析工(gōng)作的。如果你能(néng)在這類專業(yè)團隊學習成長(cháng),那是幸運的,但進入這類團隊的門(mén)檻較高(gāo),需要紮實的數據挖掘知識、挖掘工(gōng)具應用經驗和編程能(néng)力。該類分析師(shī)更偏向技(jì)術(shù)線條,未來的職業(yè)通(tōng)道可能(néng)走專家的技(jì)術(shù)路(lù)線。

  另一(yī)類是下(xià)沉到(dào)各業(yè)務團隊或者運營部門(mén)的數據分析師(shī),成為(wèi)業(yè)務團隊的一(yī)員(yuán)。他們工(gōng)作是支撐業(yè)務運營,包括日常業(yè)務的異常監控、客戶和市(shì)場研究、參與産品開(kāi)發、建立數據模型提升運營效率等。該類型分析師(shī)偏向産品和運營,可以轉向做運營和産品。

  2、數據分析師(shī)的理想行業(yè)在互聯網,但條條大道通(tōng)羅馬,走合适你的路(lù)線。

  從(cóng)行業(yè)的角度來看(kàn):

  1)互聯網行業(yè)是數據分析應用最廣的行業(yè),其中的電(diàn)商企業(yè),更是目前最火的,而且企業(yè)也更重視數據分析的價值,是數據分析師(shī)理想的成長(cháng)平台。

  2)其次是咨詢公司(比如專門(mén)的數據挖掘公司Teradata、尼爾森等市(shì)場研究公司),他們需要數據分析人才,而且相(xiàng)對來說,數據分析師(shī)在咨詢公司成長(cháng)的速度更快,專業(yè)也會(huì)更全面。

  3)再次是金融行業(yè),比如銀(yín)行和證券等行業(yè),該行業(yè)對數據分析的依賴需求,越來越大。

  4)最後是電(diàn)信行業(yè)(中國(guó)移動、聯通(tōng)和電(diàn)信),它們擁有海量的數據,在嚴峻的競争下(xià),也越來越重視數據分析,但進入這些公司的門(mén)檻比較高(gāo)。

  五、什麽人适合學習數據分析?

  這個(gè)問題的答案跟“什麽人适合學功夫”一(yī)樣,毫無疑問,功夫是适合任何人學習的(排除心術(shù)不正的人),因為(wèi)能(néng)夠強身健體。而功夫的成效,要看(kàn)習武者的修煉深淺。常常有人争論,是詠春拳厲害,還(hái)是散打厲害,其實是颠倒了因果,應該看(kàn)哪個(gè)人練習得比較好,流派之間沒有高(gāo)低(dī),隻有人修煉的厚薄。

  實際上(shàng),問題的潛台詞是“什麽人學習數據分析,會(huì)更容易取得成功(比如職業(yè)成功)”,這個(gè)要視乎你的興趣、付出和機(jī)遇。但要做到(dào)出類拔萃,除了上(shàng)面三點,還(hái)需要一(yī)點天賦,這裡(lǐ)的機(jī)遇是指你遇到(dào)的職業(yè)發展平台、商業(yè)環境、導師(shī)和同事(shì)。

  借用管理大師(shī)德魯克的話“管理是可以習得的”,管理并非是天生(shēng)的,而數據分析能(néng)力,也可以後天提升。或許做到(dào)優秀,隻需要你更加的努力+興趣,而這個(gè)努力的過程,也包括你尋找機(jī)遇的部分。

  六、關于如何學習:

  學習方法千萬種,關鍵是找到(dào)适合自(zì)己的,最好能(néng)夠結合你的工(gōng)作遇到(dào)的問題來學習。

  1、搜集書籍、案例庫和視頻,先弄懂(dǒng)理論,然後學會(huì)軟件(jiàn)操作,自(zì)己制作屬于自(zì)己的教程。

  比如,你學習聚類分析模型。1)搜集相(xiàng)關的聚類分析模型的書籍、案例和教學視頻,了解聚類分析的原理,主要有哪幾種算(suàn)法(劃分、層次、密度、網格)、模型适用的範圍和前提、如何評估模型的精确度等。

  2)自(zì)己學會(huì)用軟件(jiàn)來實現。

  3)總結整理成一(yī)份PPT和制作操作視頻,成為(wèi)自(zì)己的學習教程,不斷完善。

  4)學習到(dào)一(yī)定程度後,可以在博客、微信等渠道分享,授人與漁,而自(zì)己也會(huì)有所收獲。

  2、關注名人、名博、網站,多(duō)渠道學習。

  1)關注專業(yè)的數據分析、咨詢公司網站和論壇,特别強調,統計軟件(jiàn)公司的網站如SPSS的官網有很多(duō)案例庫,值得關注。

  數據分析網:http://www.afenxi.com/中國(guó)統計網:http://www.itongji.cn/愛數據網:http://www.lovedata.cn/

  SPSS的案例庫,可在官網上(shàng)搜索各類案例:http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1108zhangzy/index.html

  另外,你最好建一(yī)個(gè)自(zì)己的網址導航目錄,提升你的學習效率

  2)關注名人名博,最好能(néng)加他們的微博、微信和微信公衆号,看(kàn)牛人的博客和微信等内容,還(hái)是能(néng)得到(dào)很多(duō)引導,這個(gè)你懂(dǒng)的。

  如沈浩老師(shī)的博客:http://shenhaolaoshi.blog.sohu.com/數據分析網公衆号:afenxi_com數據海洋公衆号:dataplayer“數聚”公衆号:shuju_vip

  3)加入一(yī)些有共同愛好的QQ群,互相(xiàng)學習交流。通(tōng)常群裡(lǐ)有人會(huì)提出一(yī)些真實的運營問題,然後大家用不同的方法去解決,對思路(lù)很有啓發。

  4)碎片化學習,最大化你的時間價值。為(wèi)了把零散的時間利用起來,通(tōng)常我會(huì)把一(yī)些資料上(shàng)載到(dào)網盤,在零碎的時間裡(lǐ)通(tōng)過手機(jī)進行視頻、文檔學習等。目前使用百度雲盤和360網盤。百度雲盤應用比較廣,通(tōng)常在網絡上(shàng)搜索“關鍵詞+百度雲”後,搜到(dào)結果可以直接保存在雲盤上(shàng),搜索保存速度極大提升。360網盤則空間比較大,可以到(dào)達40T,同時有保險箱加密功能(néng),安全性高(gāo)一(yī)些。

  手機(jī)上(shàng)安裝一(yī)些APP,随時随地學習。

  七、最後的建議

  請再次問問自(zì)己,是否真的喜歡數據分析,能(néng)否忍受處理數據時的寂寞?如果是,那就(jiù)開(kāi)始學習,給你幾條建議。

  1、把數據分析作為(wèi)一(yī)種能(néng)力培養,讓自(zì)己在現在的團隊中展現出良好的數據分析能(néng)力,為(wèi)你以後内部轉崗做好準備。如果内部轉崗不成,你可以考慮跳槽到(dào)我之前分析的行業(yè)中,但我強烈建議你還(hái)是需要把系統開(kāi)發的編程能(néng)力學習好,并且對商業(yè)智能(néng)系統(BI和CRM)有一(yī)定了解,這也許是應聘數據分析的優勢。如果沒有數據分析經驗去應聘,相(xiàng)對會(huì)難一(yī)些,用人單位會(huì)考你統計和數據挖掘模型方面的知識,以及工(gōng)具使用情況。

  2、在公司裡(lǐ)找一(yī)些有共同愛好的同事(shì)一(yī)起學習數據分析,平時多(duō)請教數據分析做得好的同事(shì),它山之石,可以攻玉。

  3、紮實學好一(yī)、兩門(mén)數據挖掘軟件(jiàn),基于你有編程的基礎,建議你可以學SAS或者R,同時輔助學習SPSSModeler。如果沒編程基礎或者希望短期能(néng)夠取得成效,那也可以先學習SPSS。SAS+SPSS,基本能(néng)夠滿足很大部分企業(yè)的需求,三者都會(huì),那更好。

  4、要了解公司是如何運營,産品是如何開(kāi)發的,如何做客戶研究鎖定客戶需求,如何做産品營銷,這些需要不斷工(gōng)作積累和廣泛的閱讀(dú)。

  5、開(kāi)始學習時,先讀(dú)幾本有趣的數據分析類的書,然後系統學習一(yī)下(xià)統計知識(建議教材用《統計學》第五版,賈俊平等編著(zhe)),接著(zhe)網上(shàng)快速搜集軟件(jiàn)操作視頻和案例,然後逐個(gè)分析模型進行學習和總結歸納,學習最好能(néng)夠結合實際工(gōng)作中的問題進行。

  6、學習到(dào)一(yī)定程度時,參加一(yī)些數據分析師(shī)的職業(yè)認證,進一(yī)步梳理知識結構,同時認識一(yī)些志(zhì)同道合的朋友(yǒu)和老師(shī),也是對你有很大幫助。

  希望你能(néng)夠成為(wèi)你想成為(wèi)的人!(責編:pingxiaoli)

微信掃一(yī)掃

關注昊雲訂閱号

服務項目

維保運維服務

信息系統集成服務

機(jī)房搬遷服務

 
 
 
QQ 在線客服
QQ 在線客服
 
電(diàn)話:
0531-88818533
客服QQ
2061058957
1905215487