由于數據科學和數據分析是個(gè)快速發展的領域,當前的合格申請者嚴重缺乏。這使得數據科學家對于那些有興趣,并尋找新的職業(yè)生(shēng)涯的人成為(wèi)有前途的和有利可圖的領域。
但如何能(néng)成為(wèi)一(yī)個(gè)數據科學家呢(ne)?
首先,各個(gè)公司對數據科學家的定義各不相(xiàng)同,當前還(hái)沒有統一(yī)的定義。但在一(yī)般情況下(xià),一(yī)個(gè)數據科學家結合了軟件(jiàn)工(gōng)程師(shī)與統計學家的技(jì)能(néng),并且在他或者她希望工(gōng)作的領域投入了大量行業(yè)知識。
大約90%的數據科學家至少有大學教育經曆,甚至到(dào)博士以及獲得博士學位,當然,他們獲得的學位的領域非常廣泛。一(yī)些招聘者甚至發現人文專業(yè)的人們有所需的創造力,他們能(néng)教别人一(yī)些關鍵技(jì)能(néng)。
因此,排除一(yī)個(gè)數據科學的學位計劃(世界各地的著名大學雨後春筍般的出現著(zhe)),你需要采取什麽措施,成為(wèi)一(yī)個(gè)數據科學家?
1、複習你的數學和統計技(jì)能(néng)。一(yī)個(gè)好的數據科學家必須能(néng)夠理解數據告訴你的内容,做到(dào)這一(yī)點,你必須有紮實的基本線性代數,對算(suàn)法和統計技(jì)能(néng)的理解。在某些特定場合可能(néng)需要高(gāo)等數學,但這是一(yī)個(gè)好的開(kāi)始場合。
2、了解機(jī)器(qì)學習的概念。機(jī)器(qì)學習是下(xià)一(yī)個(gè)新興詞,卻和大數據有著(zhe)千絲萬縷的聯系。機(jī)器(qì)學習使用人工(gōng)智能(néng)算(suàn)法将數據轉化為(wèi)價值,并且無需顯式編程。
3、學習代碼。數據科學家必須知道如何調整代碼,以便告訴計算(suàn)機(jī)如何分析數據。從(cóng)一(yī)個(gè)開(kāi)放(fàng)源碼的語言如Python那裡(lǐ)開(kāi)始吧(ba)。
4、了解數據庫、數據池及分布式存儲。數據存儲在數據庫、數據池或整個(gè)分布式網絡中。以及如何建設這些數據的存儲庫取決于你如何訪問、使用、并分析這些數據。如果當你建設你的數據存儲時沒有整體架構或者超前規劃,那後續對你的影響将十分深遠(yuǎn)。
5、學習數據修改和數據清洗技(jì)術(shù)。數據修改是将原始數據到(dào)另一(yī)種更容易訪問和分析的格式。數據清理有助于消除重複和“壞”數據。兩者都是數據科學家工(gōng)具箱中的必備工(gōng)具。
6、了解良好的數據可視化和報(bào)告的基本知識。你不必成為(wèi)一(yī)個(gè)平面設計師(shī),但你确實需要深谙如何創建數據報(bào)告,便于外行的人比如你的經理或CEO可以理解。
7、添加更多(duō)的工(gōng)具到(dào)您的工(gōng)具箱。一(yī)旦你掌握了以上(shàng)技(jì)巧,是時候擴大你的數據科學工(gōng)具箱了,包括Hadoop、R語言和Spark。這些工(gōng)具的使用經驗和知識将讓你處于大量數據科學求職者之上(shàng)。
8、練習。在你在新的領域有一(yī)個(gè)工(gōng)作之前,你如何練習成為(wèi)數據科學家?使用開(kāi)源代碼開(kāi)發一(yī)個(gè)你喜歡的項目、參加比賽、成為(wèi)網絡工(gōng)作數據科學家、參加訓練營、志(zhì)願者或實習生(shēng)。最好的數據科學家在數據領域将擁有經驗和直覺,能(néng)夠展示自(zì)己的作品,以成為(wèi)應聘者。
9、成為(wèi)社區的一(yī)員(yuán)。跟著(zhe)同行業(yè)中的思想領袖,閱讀(dú)行業(yè)博客和網站,參與,提出問題,并随時了解時事(shì)新聞和理論。目前,36大數據已開(kāi)通(tōng)數據科學家欄目,并且每日為(wèi)大家帶來大數據行業(yè)最新最幹貨的内容,歡迎大家關注微信公衆号(dashuju36)。
聽起來好像有很多(duō)?嗯,就(jiù)是這樣。數據科學并不适合每一(yī)個(gè)人,但适合于有興趣的和專注的,也有令人難以置信的回報(bào)。如果你沒有足夠的錢(qián)去參加大學課程,可以找一(yī)些免費(fèi)的網絡資源,完成這些步驟。
微信掃一(yī)掃
關注昊雲訂閱号