去年(nián),我們曾經問過大家“大數據還(hái)是個(gè)值得關注的大事(shì)嗎(ma)?”,并注意到(dào)由于大數據更像是一(yī)種“系統化工(gōng)程”,因此在企業(yè)的接受速度方面要落後于整個(gè)業(yè)界的炒作。大數據技(jì)術(shù)用了多(duō)年(nián)時間進行演化,才從(cóng)一(yī)種看(kàn)起來很酷的新技(jì)術(shù)變成企業(yè)在生(shēng)産環境中實際部署的核心企業(yè)級系統。
2017年(nián),我們已經很适應這樣的部署階段。“大數據”這個(gè)詞正在逐漸淡出我們的視野,但這種技(jì)術(shù)本身還(hái)在飛(fēi)速擴張。各行各業(yè)的各種轶事(shì)和證據證明相(xiàng)關産品越來越成熟,在越來越多(duō)的财富1000強企業(yè)内開(kāi)始投入實用,很多(duō)初創公司借助這些技(jì)術(shù)快速實現了收入增長(cháng)。
與此同時,宣傳炒作的泡沫開(kāi)始毋庸置疑地轉向了這個(gè)生(shēng)态系統中機(jī)器(qì)學習和人工(gōng)智能(néng)等領域。過去幾個(gè)月(yuè)來,人工(gōng)智能(néng)領域湧現出一(yī)種“大爆炸”式的集體意識,這一(yī)情況與幾年(nián)前大數據技(jì)術(shù)的“遭遇”相(xiàng)差無幾,不過發展速度更快。
從(cóng)另一(yī)個(gè)角度來看(kàn),2017年(nián)也是激動人心的一(yī)年(nián):望穿秋水(shuǐ)的IPO。今年(nián)頭幾個(gè)月(yuè),大數據領域的初創公司在這方面活動頻頻,并得到(dào)了公開(kāi)市(shì)場的熱切歡迎。
總的來說,數據生(shēng)态系統在2017年(nián)終于實現了火力全開(kāi)。與以往每年(nián)一(yī)樣,我們将通(tōng)過一(yī)年(nián)一(yī)次的大數據領域回顧為(wèi)大家提供一(yī)個(gè)詳細的“國(guó)情咨文”,将我們針對這一(yī)行業(yè)的見(jiàn)解總結為(wèi)關鍵趨勢奉獻給大家。
開(kāi)始吧(ba)!
上(shàng)層趨勢
大數據+人工(gōng)智能(néng)=全新技(jì)術(shù)棧
任何風險投資機(jī)構有幸看(kàn)到(dào)的各種宣傳都能(néng)證明,2016年(nián),每家初創公司都在變身成為(wèi)“機(jī)器(qì)學習公司”,“。ai”已成為(wèi)必備的域名,而“等等,我們會(huì)通(tōng)過機(jī)器(qì)學習技(jì)術(shù)解決這個(gè)問題”已經開(kāi)始普遍出現在各類集資活動的演示文稿中。
圍繞人工(gōng)智能(néng)的報(bào)道、座談會(huì)、新聞郵件(jiàn),以及微博層出不窮,很多(duō)早已在關注機(jī)器(qì)學習技(jì)術(shù)的人,他們的反應就(jiù)好像發現自(zì)己當地的某個(gè)品牌突然開(kāi)始了全球化擴張:一(yī)方面,倍感驕傲;但另一(yī)方面,就(jiù)好像面對派對上(shàng)姗姗來遲又(yòu)裝腔作勢的人那樣表現出明顯的厭(yàn)煩之情,同時做好了不可避免會(huì)感到(dào)失望的心理準備。
雖然很容易認為(wèi)這些趨勢的發展非常和緩,但該領域所經曆的演變是不可避免,并且影響深遠(yuǎn)的:機(jī)器(qì)學習正在快速成為(wèi)很多(duō)應用程序中最重要的組件(jiàn)。
我們正在見(jiàn)證一(yī)個(gè)新技(jì)術(shù)棧的湧現,在這個(gè)技(jì)術(shù)棧中,大數據技(jì)術(shù)被用于處理數據工(gōng)程方面的核心挑戰,而機(jī)器(qì)學習技(jì)術(shù)被用于從(cóng)數據中提取出價值(以分析見(jiàn)解或操作等形式)。
換句話說:大數據提供了渠道,人工(gōng)智能(néng)提供了我們需要的智能(néng)。
當然,這種共生(shēng)關系并不是什麽新事(shì)物(wù),但隻有少數人有幸能(néng)夠真正實現。
這些技(jì)術(shù)正在真正開(kāi)始變的“民(mín)主化”。“大數據+人工(gōng)智能(néng)”已經成為(wèi)很多(duō)現代化應用(無論面向普通(tōng)消費(fèi)者或企業(yè)的應用)的默認技(jì)術(shù)棧。大量初創公司和一(yī)些财富1000強企業(yè)都在使用這種新的技(jì)術(shù)棧(例如JPMorgan的“ContractIntelligence”應用)。
通(tōng)常來說,雲計算(suàn)是這個(gè)“闆凳”的第三條腿,但也并非總是如此。這一(yī)領域的發展也受到(dào)各大雲計算(suàn)巨頭的推動,這些巨頭們正在舉行一(yī)場公開(kāi)的戰争,争先恐後地開(kāi)始提供機(jī)器(qì)學習雲(下(xià)文将詳細介紹)。
短期來看(kàn),是否可以認為(wèi)民(mín)主化會(huì)促進人工(gōng)智能(néng)技(jì)術(shù)的商品化?實際上(shàng)從(cóng)技(jì)術(shù)角度來說,人工(gōng)智能(néng)依然很難。雖然很多(duō)工(gōng)程師(shī)正在争先恐後地培養有關人工(gōng)智能(néng)技(jì)術(shù)的技(jì)能(néng),但至少到(dào)目前,全球範圍内深入鑽研這一(yī)領域的專家依然很少。
不過這種民(mín)主化的趨勢至少不會(huì)“開(kāi)倒車”,機(jī)器(qì)學習技(jì)術(shù)遲早會(huì)從(cóng)競争優勢“進化”成為(wèi)一(yī)必備要素。而這種趨勢對初創公司和大企業(yè)都産生(shēng)了深遠(yuǎn)的影響。對于初創公司:除非你所開(kāi)發的人工(gōng)智能(néng)軟件(jiàn)是最終産品,那麽将你自(zì)己稱呼為(wèi)一(yī)家“機(jī)器(qì)學習公司”這樣的做法很快将變的毫無意義。對于大型企業(yè):如果目前你還(hái)沒有積極主動地制定“大數據+人工(gōng)智能(néng)”的戰略(自(zì)行實現或與其他供應商合作),那麽你們很快會(huì)面臨被淘汰的境地。關于大數據,這樣的說法已經持續多(duō)年(nián)了,但随著(zhe)以大數據技(jì)術(shù)為(wèi)基礎誕生(shēng)的人工(gōng)智能(néng)技(jì)術(shù)飛(fēi)速發展,這一(yī)天隻會(huì)更快速地到(dào)來。
企業(yè)的預算(suàn):逐利
過去多(duō)年(nián)來,在我們與大數據技(jì)術(shù)的買家和賣家的交談中,我們發現财富1000強公司中,越來越多(duō)的預算(suàn)被用于對核心基礎架構進行升級,以及與數據分析有關的技(jì)術(shù),大家都對大數據技(jì)術(shù)給予極大關注。很多(duō)分析機(jī)構也認同這一(yī)結論:IDC預計,到(dào)2020年(nián),大數據和分析市(shì)場将從(cóng)2016年(nián)的1300億美元市(shì)場規模增長(cháng)至2030億美元。
在大數據技(jì)術(shù)方面,财富1000強公司的很多(duō)買家正變的越來越成熟和理智。過去多(duō)年(nián)來,他們已經進行了充分的研究調研,現在已經準備好全面部署了。不僅技(jì)術(shù)型行業(yè),目前很多(duō)行業(yè)均是如此。這種飛(fēi)速變化的趨勢還(hái)得到(dào)了老技(jì)術(shù)自(zì)然淘汰周期的進一(yī)步助推,對于大型企業(yè),通(tōng)常每隔幾年(nián)就(jiù)會(huì)這樣做一(yī)次。曾經逆風飛(fēi)揚(難以剔除或取代原有基礎架構)的大數據技(jì)術(shù)現在正逐漸變的順勢而飛(fēi)(“我們需要替換過時的技(jì)術(shù),市(shì)面上(shàng)最好的同類技(jì)術(shù)是啥?”)。
當然,很多(duō)大企業(yè)(“晚期從(cóng)衆者”)依然是大數據領域的“新手”,但這種情況的變化速度變的越來越快了。
企業(yè)數據正在陸續上(shàng)雲
就(jiù)在幾年(nián)前,如果你建議企業(yè)将數據遷移至公有雲,大企業(yè)的CIO給你的回應大部分隻會(huì)是“除非我死了”,當時他們頂多(duō)隻願意将開(kāi)發環境,或各種稀奇古怪,非關鍵的對外應用程序遷移至雲端。但現在他們的看(kàn)法似乎開(kāi)始産生(shēng)變化了,去年(nián)以來這種變化非常明顯。我們聽到(dào)了一(yī)種更為(wèi)開(kāi)放(fàng)的心态:大家已經逐漸認識到(dào)“反正我們的客戶數據本來就(jiù)已經保存在Salesforce的雲中”,或者“在網絡安全的預算(suàn)方面,我們的投入與AWS壓根兒沒得比”,而諷刺的是,過去多(duō)年(nián)來,對安全的顧慮曾是企業(yè)接受雲計算(suàn)的主要障礙之一(yī),但雲供應商在安全與合規(HIPAA)等方面的辛苦努力終于得到(dào)了證明和回報(bào)。
毫無疑問,目前離大部分企業(yè)數據都保存在公有雲中這一(yī)目标還(hái)有一(yī)定距離,但部分原因在于遺留系統和管控制度。
然而演變的趨勢是明顯的,并且越來越快。雲供應商會(huì)盡一(yī)切努力促進這一(yī)過程,甚至提供搬運海量數據的卡車。
2017大數據全景
言歸正傳,我們想象中2017年(nián)大數據領域的全景是這樣的。
1、我們放(fàng)大看(kàn)看(kàn)開(kāi)源技(jì)術(shù)部分:
2、當然,今年(nián)我在FirstMark的同事(shì)JimHao也對此圖的制作提供了巨大的幫助。
合并工(gōng)作開(kāi)始了嗎(ma)?
大數據領域每一(yī)年(nián)都變的更加熱鬧,因此這就(jiù)造成了一(yī)個(gè)顯而易見(jiàn)的問題:這個(gè)行業(yè)是否迎來了大規模并購的風潮?
似乎還(hái)沒,至少目前還(hái)看(kàn)不出這樣的趨勢。
首先,風投們會(huì)繼續愉快地注資各家新老公司。2017年(nián)頭幾個(gè)月(yuè),為(wèi)成長(cháng)階段的大數據初創公司注入巨資的消息此起彼伏:Looker(D輪,8100萬美元)、InsideSales(F輪,5千萬美元)、DataRobot(C輪,5400萬美元)、Confluent(C輪,5千萬美元)、Collibra(C輪,5千萬美元)、Uptake(C輪,4千萬美元)、WorkFusion(D輪,3500萬美元),以及MapD(B輪,3500萬美元)。另外DataBricks非常值得注意,他們在2016年(nián)12月(yuè)剛獲得6千萬美元的C輪投資。全球範圍内,大數據初創公司在2016年(nián)得到(dào)了風投機(jī)構總計148億美元的投資,其中10%由全球性的技(jì)術(shù)VC提供。
另外需要注意,該領域的相(xiàng)關投資大多(duō)是全球性的,歐洲、以色列(如VoyagerLabs)、中國(guó)(iCarbonX)等地均有大量公司成立并獲得注資。
其次,2016年(nián)全景中曾經提到(dào),并購活動已在有序進行,但沒有特别讓人印象深刻的,也許部分原因在于私營公司的估值始終居高(gāo)不下(xià)。我們在2016年(nián)大數據全景中曾經提到(dào),共有41家公司被并購(完整清單請參閱文末備注),2017年(nián),并購的節奏大體上(shàng)會(huì)與去年(nián)持平。
另一(yī)方面,2017年(nián)至今已經出現了一(yī)些非常大的并購活動,例如Mobileye(被Intel以153億美元收購)、AppDynamics(思科,37億美元),以及NimbleStorage(HPE,12億美元)。
去年(nián)還(hái)曾出現過一(yī)種較為(wèi)普遍但并不持久的現象:大型技(jì)術(shù)公司瘋狂并吞人工(gōng)智能(néng)領域的初創公司,尤其是專為(wèi)各種水(shuǐ)平問題(Horizontalproblem)組建了團隊的公司。例如:Turi(Apple)、MagicPony(Twitter)、VivLabs(三星)、MetaMind(Salesforce)、GeometricIntelligence(Uber)、API.ai(Google),以及Wise.io(GE)。雖然這些舉措使得主要針對水(shuǐ)平領域的人工(gōng)智能(néng)初創公司快速成為(wèi)VC眼中的香饽饽,但這種不假思索的快速收購可能(néng)也對應著(zhe)各種炒作,以及人工(gōng)智能(néng)領域工(gōng)程師(shī)的缺乏所造成的特殊時間段。
第三,一(yī)些大型大數據初創公司正在變成獨立的上(shàng)市(shì)公司。SNAP可以說是帶動了技(jì)術(shù)公司IPO市(shì)場的複蘇,但截至目前,能(néng)夠借助該機(jī)會(huì)成功變現的依然隻有大數據領域的公司。
雖然2016年(nián)全年(nián),隻有Talend這一(yī)家大數據公司成功上(shàng)市(shì),但2017年(nián)截至目前這一(yī)領域内滿是IPO良機(jī)。Mulesoft和Alteryx成功上(shàng)市(shì)并且表現還(hái)不錯(cuò),這兩家的發行價都超過了IPO價格。在撰寫本文時,Cloudera也即将上(shàng)市(shì),該公司最新預估價(41億美元)與營收(2016年(nián)2.61億美元)之間的空缺對于“獨角獸”的估價現象将造成不小(xiǎo)的考驗。此外MapR以及位置智能(néng)公司Yext也正在準備上(shàng)市(shì)。
接下(xià)來會(huì)是誰?多(duō)年(nián)來,Palantir作為(wèi)業(yè)内最低(dī)調的公司之一(yī),已經表達出想要公開(kāi)上(shàng)市(shì)的意圖。考慮到(dào)Palantir的最新預估價為(wèi)200億美元,如果其公開(kāi)估價能(néng)夠接近這一(yī)數字,将會(huì)成為(wèi)IPO領域的一(yī)枚重磅炸彈。
打響雲端戰役
失敗和收購活動也許不會(huì)讓這個(gè)行業(yè)立刻得到(dào)鞏固,但“功能(néng)合并”的情況日漸普遍,尤其是在雲計算(suàn)領域。該領域内一(yī)些重量級選手正在逐漸構建整合式的“大數據+人工(gōng)智能(néng)”服務,并且吸引了不少用戶,這些服務或者使用了自(zì)行開(kāi)發的産品,或通(tōng)過流行的開(kāi)源計算(suàn)引擎自(zì)行實現,這種服務距離很多(duō)買家所期待的“一(yī)站式購買”越來越近了。
尤其是AmazonWebServices還(hái)在繼續快速發布不同類型的産品,讓人獲得了深刻的印象。目前該公司已經圍繞大數據和人工(gōng)智能(néng)技(jì)術(shù)提供了幾乎所有産品,包括分析框架、實時分析、數據庫(NoSQL、圖形等)、商業(yè)智能(néng),以及日益完善的人工(gōng)智能(néng)能(néng)力,并且在深度學習方面頗有建樹(完整清單可參閱這裡(lǐ))。按照(zhào)這樣的速度,AWS很快将具備我們的大數據全景中所涉及的幾乎所有基礎架構和分析産品。
雖然Google涉足雲計算(suàn)的時間較晚,但他們正在圍繞大數據積極主動地構建一(yī)系列産品(BigQuery、Dataflow、Dataproc、Datalab、Dataprep等),并且已将人工(gōng)智能(néng)視作超越競争對手的方法之一(yī)。過去一(yī)年(nián)來,Google在人工(gōng)智能(néng)方面公布了很多(duō)消息,例如:一(yī)個(gè)新的轉換引擎,雇傭了兩名出色的人工(gōng)智能(néng)專家Fei-FeiLi和JiaLi來領導新成立的CloudAIandMachineLearning部門(mén),針對視頻識别提供的全新機(jī)器(qì)學習API(這裡(lǐ)),并且收購了數據科學家社區Kaggle。
更大規模的企業(yè)級IT供應商–尤其是Microsoft、IBM、SAP、Oracle以及Salesforce–也在努力推出大數據(以及人工(gōng)智能(néng))産品,這些産品都支持雲端(最引人注目的是Microsoft)和本地部署。除了通(tōng)過自(zì)行開(kāi)發,以及收購而來的技(jì)術(shù)構建這些産品,他們的合作意願也在逐漸加強,尤其是與“有數據的”公司(數據倉儲)和“有人工(gōng)智能(néng)的”公司進行合作。例如IBM和Salesforce以及SAP與Google的合作都是其中的典型。
按照(zhào)企業(yè)IT行業(yè)的标準來說,雲供應商的規模依然不算(suàn)大,但這些公司的野心(包括在企業(yè)技(jì)術(shù)棧中,将自(zì)己的地位從(cóng)IaaS層面上(shàng)升至應用程序層面的明确意圖)和穩紮穩打将企業(yè)數據遷往雲端的做法相(xiàng)結合,意味著(zhe)與傳統IT供應商的全面戰争已然打響,大家在争奪龐大的企業(yè)級技(jì)術(shù)市(shì)場的控制權,而大數據和人工(gōng)智能(néng)将會(huì)是核心戰場。
大數據生(shēng)态系統全景回顧
基礎架構
去年(nián)發生(shēng)的很多(duō)事(shì)依舊(jiù)餘波未平,例如流處理的重要性與日俱增,目前Spark已獨占鳌頭,但人們對競争産品,例如Flink的關注也逐漸開(kāi)始湧現。此外還(hái)有一(yī)的有趣的話題時不時地出現在人們的對話中:
SQL已經正式回歸了
過去十多(duō)年(nián)來一(yī)直面對NoSQL技(jì)術(shù)“打壓”的SQL數據庫技(jì)術(shù)現已正式回歸。Google最近發布了雲服務版的Spanner數據庫。Spanner和CockroachDB(Spanner的開(kāi)源版本)承諾提供一(yī)種高(gāo)存活性、強一(yī)緻性,可橫向擴展的SQL數據庫。Amazon發布的Athena與諸如Snowflake等産品類似,是一(yī)種大型的SQL數據引擎,可直接查詢S3Bucket中存儲的數據。GoogleBigQuery、SparkSQL以及Presto也開(kāi)始在企業(yè)領域占有了一(yī)席之地–這些都是SQL産品。
數據虛拟化
在公有雲的接受度方面有個(gè)有趣的趨勢:數據虛拟化産品的使用率正在快速激增。較為(wèi)古老的ETL流程需要移動海量數據(并且通(tōng)常需要為(wèi)數據集創建副本)并創建數據倉庫,數據虛拟化技(jì)術(shù)使得企業(yè)可以無需移動,在原地進行數據分析,借此提高(gāo)速度和敏捷性。很多(duō)下(xià)一(yī)代數據分析産品供應商,現在均已同時提供數據虛拟化和數據準備産品,借此幫助客戶更輕松地訪問雲中存儲的數據。
數據管控和安全性
随著(zhe)大數據在企業(yè)中的應用日益成熟,并且數據的種類和數量依然在與日俱增,有關數據管控之類的話題也變的越來越重要。很多(duō)企業(yè)已經選擇通(tōng)過“數據湖(hú)”的方式創建一(yī)個(gè)中央倉庫,用于保存自(zì)己的所有數據。但除非人們知道數據湖(hú)中到(dào)底有什麽,并且能(néng)按需訪問分析工(gōng)作所需的恰當數據,否則數據湖(hú)将全無用處。然而幫助用戶輕松找到(dào)自(zì)己需要的數據,同時妥善地管理數據訪問權,這一(yī)點并不容易實現。
不僅需要考慮數據湖(hú)本身,管控的一(yī)個(gè)核心主題在于讓用戶輕松訪問可信賴的數據,借此滿足企業(yè)中任何人的需求,同時必須要以安全、可審計的方式做到(dào)這一(yī)切。或大或小(xiǎo)的供應商(Informatica、Collibra、Alation)紛紛提供功了數據編錄、參考數據管理、數據辭典,以及數據幫助台等産品。
分析
數據科學家是否已經成為(wèi)瀕危物(wù)種?
就(jiù)在幾年(nián)前,數據科學家還(hái)被視作“21世紀最性感的職業(yè)”。就(jiù)算(suàn)到(dào)現在,Glassdoor的“美國(guó)最佳工(gōng)作”清單中,“數據科學家”依然名列榜首。
但是僅僅在誕生(shēng)幾年(nián)後,這個(gè)職業(yè)就(jiù)已陷入困頓。部分原因在于其必要性,雖然學校和程序員(yuán)課程依然在塑造大量粗制濫造的新手數據科學家,但這個(gè)崗位依然有很大空缺,尤其是财富1000強公司,他們都覺得很難招募到(dào)頂尖的技(jì)術(shù)人才。在某些組織中,數據科學部門(mén)已經從(cóng)原本的促進者一(yī)舉“堕落”為(wèi)瓶頸。
與此同時,随著(zhe)人工(gōng)智能(néng)技(jì)術(shù)的民(mín)主化和自(zì)服務工(gōng)具的飛(fēi)速湧現,現在無論數據科學技(jì)能(néng)極為(wèi)有限的數據工(gōng)程師(shī),甚至非技(jì)術(shù)型的數據分析師(shī),都已經可以承擔原本隻能(néng)由數據科學家負責的基本任務。企業(yè)中與大數據有關的很多(duō)工(gōng)作,尤其是枯燥乏味的簡單工(gōng)作,也許會(huì)越來越多(duō)地開(kāi)始由數據工(gōng)程師(shī)和數據分析師(shī)通(tōng)過自(zì)動化工(gōng)具來執行,而不再需要具備娴熟技(jì)能(néng)的數據科學家參與。
也就(jiù)是說,數據科學最終可能(néng)會(huì)完全由機(jī)器(qì)來處理。一(yī)些初創公司已經明确将自(zì)己的産品定位為(wèi)“自(zì)動化的數據科學”,其中最值得一(yī)提的是,DataRobot剛剛通(tōng)過這種想法籌集到(dào)5400萬美元投資(數據科學如何實現自(zì)身的自(zì)動化),SalesforceEinstein也聲稱自(zì)己可以提供能(néng)自(zì)動生(shēng)成的模型。
毫無疑問,這些趨勢尚未流行起來,目前在數據科學的社區裡(lǐ)依然存在一(yī)些争議。然而數據科學家目前還(hái)不需要對此過于擔心。在不遠(yuǎn)的将來,自(zì)服務工(gōng)具和自(zì)動化模型選擇将成為(wèi)數據科學家的“左膀右臂”,而非徹底取代他們,他們可以将更多(duō)精力用于需要進行判斷、創新、社交技(jì)能(néng),或需要具備垂直行業(yè)知識的任務。
讓一(yī)切協同工(gōng)作:數據工(gōng)作台的崛起
在大部分大型企業(yè)中,大數據技(jì)術(shù)的運用通(tōng)常都是從(cóng)少數相(xiàng)對獨立的項目開(kāi)始的(這裡(lǐ)部署個(gè)Hadoop群集,那裡(lǐ)部署個(gè)分析工(gōng)具),并且會(huì)産生(shēng)一(yī)些新的工(gōng)作崗位(數據科學家、首席數據官)。
然而今天的情況截然不同:異構的情況愈加普遍,企業(yè)内部使用了五花八門(mén)的工(gōng)具。從(cóng)組織結構方面來看(kàn),在大型企業(yè)中,集中化的“數據科學部門(mén)”正在逐漸變成更加“分散化的組織”,通(tōng)常會(huì)有數據科學家、數據工(gōng)程師(shī),以及數據分析師(shī)組成的跨職能(néng)群體,并且更加深入地融入到(dào)不同業(yè)務部門(mén)中。因此對于平台來說,需求已經變的更加明确,需要讓所有人能(néng)夠就(jiù)各種技(jì)術(shù)進行協同工(gōng)作,這一(yī)點在我們去年(nián)的文章中就(jiù)有提及,大數據項目能(néng)否成功,主要取決于能(néng)否将不同技(jì)術(shù)、人員(yuán)和流程完美融合在一(yī)起。
因此協作平台這一(yī)領域目前正在經曆快速發展,并催生(shēng)出一(yī)種被部分人稱作DataOps(類似于DevOps)的概念。FirstMark也正是出于這個(gè)原因而投資了Dataiku(可參閱我的上(shàng)一(yī)篇文章:Dataiku,亦或早熟的大數據)。這一(yī)領域其他比較重大的投資包括Knime(A輪,2千萬美元)以及DominoDataLab(A輪1千萬美元)。Cloudera剛剛發布了一(yī)款基于所收購的Sense技(jì)術(shù)開(kāi)發的工(gōng)作台産品。這一(yī)領域的開(kāi)源活動也很活躍,例如Jupyter和Anaconda。
應用程序
人工(gōng)智能(néng)驅動的垂直應用程序
至少幾年(nián)前,我們就(jiù)開(kāi)始讨論垂直領域人工(gōng)智能(néng)應用程序的崛起(x.ai以及人工(gōng)智能(néng)驅動的應用程序逐漸湧現),但原本的溪流何時演變成了現在的滔天巨浪?突然之間,似乎每個(gè)人都開(kāi)始開(kāi)發人工(gōng)智能(néng)應用程序了,無論新成立的,或已經取得重大進展的初創公司,都開(kāi)始壓賭于人工(gōng)智能(néng),認為(wèi)這是下(xià)一(yī)輪增長(cháng)點(例如InsideSales)。
在這種狀況和趨勢影響下(xià),一(yī)些新成立的初創公司提出了很多(duō)激動人心的技(jì)術(shù),雖然其中一(yī)些猶如霧裡(lǐ)看(kàn)花,但為(wèi)了追逐熱點趨勢,也有很多(duō)公司在激進地進行重塑。在某些領域使用了某種機(jī)器(qì)學習技(jì)術(shù)的公司,并不算(suàn)人工(gōng)智能(néng)公司。
總地來說,人工(gōng)智能(néng)初創公司的創建并不容易。而其中最關鍵的第一(yī)步在于選擇一(yī)個(gè)垂直領域所面臨的問題。除了深入的技(jì)術(shù)DNA,還(hái)需要深思熟慮的定位和策略(構建人工(gōng)智能(néng)初創公司:現實和策略)。
然而要确保自(zì)己不被各種可能(néng)性看(kàn)花眼,面對飛(fēi)速的發展保持冷靜(jìng),要做到(dào)這些其實很難。
尤其是去年(nián),趨勢已經很明顯了:通(tōng)過人工(gōng)智能(néng)技(jì)術(shù),解決與數據有關的任何問題。無論企業(yè)級應用程序或垂直行業(yè),都采取了這樣的方式。考慮到(dào)現實情況,今年(nián)我們在圖表的應用程序分類中添加了多(duō)個(gè)類别,包括交通(tōng)運輸、房地産(借助數據科學實現房地産的現代化),以及保險業(yè)。同時我們将一(yī)些非常活躍的行業(yè)拆分為(wèi)兩個(gè)類别,例如營銷應用(拆分為(wèi)B2B和B2C)以及生(shēng)命科學(拆分為(wèi)醫(yī)療健康和生(shēng)命科學)。
除了這些領域外,還(hái)有一(yī)些非常新潮的應用(例如無人駕駛汽車),今天的人工(gōng)智能(néng)技(jì)術(shù)正在缺乏想象力的企業(yè)應用領域閃爍著(zhe)耀眼的光(guāng)輝,從(cóng)人員(yuán)流失預測到(dào)後端辦公室自(zì)動化,再到(dào)安全,以不同形式提供了切實可行的收效。
人工(gōng)智能(néng)導緻人類失業(yè),也許還(hái)沒有得到(dào)政府部門(mén)的重視,但沒有任何一(yī)個(gè)職業(yè)是不受影響的,至少需要考慮會(huì)如何受到(dào)影響,也許會(huì)通(tōng)過人工(gōng)智能(néng)得以“增強”。這些問題已得到(dào)很多(duō)白(bái)領職業(yè)的證明,例如醫(yī)生(shēng)(人工(gōng)智能(néng)vs醫(yī)生(shēng))或律師(shī)(人工(gōng)智能(néng)開(kāi)始從(cóng)事(shì)法務工(gōng)作)。
尤其是金融領域,似乎充分考慮了人工(gōng)智能(néng)的潛力。多(duō)年(nián)來艱難度日的對沖基金正在為(wèi)自(zì)己的算(suàn)法尋找可替代數據(全新淘金潮?華爾街想要你的數據)。由人工(gōng)智能(néng)驅動的全新對沖基金(Numerai、DataCapitalManagement等)雖然還(hái)不完善,但已經實現了快速發展。華爾街一(yī)些最重要的事(shì)務所均在使用人工(gōng)智能(néng)取代人類(BlackRock、GoldmanSachs)。
機(jī)器(qì)人的反擊
無論是愛是恨,2016年(nián)都是機(jī)器(qì)人的元年(nián)。很多(duō)消息交流服務均提供過完全自(zì)動化,可以實時交談的代理程序。雖然昙花一(yī)現,但這些機(jī)器(qì)人程序似乎已經全面經曆了不同的炒作周期,從(cóng)一(yī)開(kāi)始的承諾,到(dào)Tay所面臨的災難(譯注:Tay是微軟提供的一(yī)種基于人工(gōng)智能(néng)技(jì)術(shù)的聊天機(jī)器(qì)人,該機(jī)器(qì)人一(yī)經上(shàng)線,與衆多(duō)網友(yǒu)交流後,變成了“帶有種族歧視傾向并且固執的存在”),到(dào)微型文藝複興,再到(dào)Facebook相(xiàng)關研究放(fàng)緩,有報(bào)告稱聊天平台上(shàng)70%的人工(gōng)智能(néng)聊天機(jī)器(qì)人最終都以失敗告終。
對于機(jī)器(qì)人程序的熱情似乎有些早,得出這種結論的原因有很多(duō),建議參閱BradfordCross的觀點,他在文中非常恰當地指出,人們可能(néng)因為(wèi)機(jī)器(qì)人程序在亞洲的崛起,或者Slack等底層基礎架構的快速增長(cháng)而得出了過于樂觀的預期。我們相(xiàng)信,最終這種機(jī)器(qì)人程序有著(zhe)很大的潛力,但畢竟這一(yī)領域還(hái)需要更長(cháng)的成長(cháng)時間。“生(shēng)産商”一(yī)端(初創公司需要專注于每個(gè)具體的業(yè)務領域,少作承諾)和“消費(fèi)方”一(yī)端(我們都需要習慣于機(jī)器(qì)人程序可以和不能(néng)做到(dào)的事(shì)情,Alexa正在幫助我們意識到(dào)這些!)都需要進行徹底的心态調整。
就(jiù)目前來看(kàn),最光(guāng)明的未來可能(néng)屬于重要領域需要人類介入的服務,或者完全采取不同于機(jī)器(qì)人程序的定位,使用人工(gōng)智能(néng)技(jì)術(shù)擴充人類能(néng)力的技(jì)術(shù)(我們得出這一(yī)結論的依據來自(zì)frame.ai)。
寫在最後
大數據與人工(gōng)智能(néng)強強聯合,我們即将進入“收獲”的季節。忽略各種炒作,我們迎來了數量衆多(duō)的可能(néng)性。
随著(zhe)核心基礎架構以及應用程序端日漸成熟,人工(gōng)智能(néng)技(jì)術(shù)驅動的應用将迎來井噴期,2017年(nián),大數據(以及人工(gōng)智能(néng))生(shēng)态幾将火力全開(kāi)。
獲取更多(duō)專業(yè)資訊
微信掃一(yī)掃