21世紀最性感的職業(yè),你覺得是什么?美國媒體認為,是數(shù)據(jù)科學家。
大數(shù)據(jù)炙手可熱,每家公司都在試圖利用大數(shù)據(jù)做點什么。與此同時,一個新的工作職位應運而生——數(shù)據(jù)科學家。別小看了這個聽起來貌似還略顯青澀的名稱,先來看看它掀起了怎樣的波浪吧:它被美國媒體稱為21世紀最性感的職業(yè),因為這個職位聽起來充滿誘惑卻又不被大眾所了解;在知名招聘網站INDEED上,它的需求百分比在短短一年之內由0增長到現(xiàn)在的近0.02%;中國的各大網站如阿里巴巴等公司也相繼貼出了高薪聘請數(shù)據(jù)科學家的OFFER……
那么,數(shù)據(jù)科學家,到底是做什么的呢?
數(shù)據(jù)科學家這個職位來源于喬納森·高德曼(Jonathan Goldman)。他在2006年的6月份進入商務社交網站LinkedIn工作。在那時,LinkedIn只有不到800萬用戶。高德曼在之后的研究中創(chuàng)造出新的模型,利用數(shù)據(jù)預測注冊用戶的人際網絡。具體來講,他以用戶在LinkedIn的個人資料,來找到和這些信息最匹配的三個人,并以推薦的形式顯示在用戶的使用頁面上——這也就是我們熟悉的“你可能認識的人(People you may know)"。這個小小的功能讓LinkedIn增加了數(shù)百萬的新的頁面點擊量。從此,數(shù)據(jù)在Linkedin的重要性被不斷提升,而高德曼的角色就是一位數(shù)據(jù)科學家。
曾經投資過Facebook,LinkedIn的格雷洛克風險投資公司把數(shù)據(jù)科學家描述成“能夠管理和洞察數(shù)據(jù)的人”。在IBM的網站上,數(shù)據(jù)科學家的角色被形容成“一半分析師,一半藝術家”。他們代表了商業(yè)或數(shù)據(jù)分析這個角色的一個進化。
真正區(qū)別數(shù)據(jù)科學家與傳統(tǒng)職位的是對于商業(yè)的強烈敏感,以及以何種組織來處理商業(yè)問題的影響力,將研究結果傳達給商業(yè)和IT界的覺得者們。優(yōu)秀的數(shù)據(jù)科學家將不僅僅處理商業(yè)問題,他們還要有具備發(fā)現(xiàn)對于公司影響最大的問題的能力。Anjul Bhambhri是IBM的大數(shù)據(jù)產品副總裁,她認為 “數(shù)據(jù)科學家是一個好奇的,不斷質疑現(xiàn)有假設,能盯著數(shù)據(jù)就能指出趨勢的人。這就好像在文藝復興時期,一個非常想為組織帶來挑戰(zhàn)并從挑戰(zhàn)中學習的人一樣。”
我們可以從大家的描述中看到數(shù)據(jù)科學家的輪廓:既是分析師,也是數(shù)學家,有可能是個黑客,也有可能是個解碼員。不一定必須是個博士才能成為一個數(shù)據(jù)科學家,但“能在數(shù)據(jù)的海洋里暢游”一定得是他的長項。并且,被人們反復提到的詞是:洞察力(insight)。數(shù)據(jù)科學家必須要通過大量的數(shù)據(jù)產生對商業(yè)發(fā)展的洞察力。他們應該能推理出數(shù)據(jù)上尚未顯示出來的被掩蓋的事實和趨勢。
提出“數(shù)據(jù)科學家”這個詞的Thomas H. Davenport 和 D.J. Patil在他們的文章中談到數(shù)據(jù)科學家的能力:數(shù)據(jù)科學家傾向于用探索數(shù)據(jù)的方式來看待周圍的世界。把大量散亂的數(shù)據(jù)變成結構化的可供分析的數(shù)據(jù),還要找出豐富的數(shù)據(jù)源,整合其他可能不完整的數(shù)據(jù)源,并清理成結果數(shù)據(jù)集。
新的競爭環(huán)境中,挑戰(zhàn)不斷地變化,新數(shù)據(jù)不斷地流入,數(shù)據(jù)科學家需要幫助決策者穿梭于各種分析,從臨時數(shù)據(jù)分析到持續(xù)的數(shù)據(jù)交互分析。數(shù)據(jù)科學家會遇到技術的局限性,但不會讓技術阻擾他們尋找新穎的解決方案。當他們有所發(fā)現(xiàn),便交流他們的發(fā)現(xiàn),建議新的業(yè)務方向。通常他們很有創(chuàng)造力的展示視覺化的信息,也讓找到的模式清晰而有說服力。他們會把蘊含在數(shù)據(jù)中的規(guī)律建議給產品經理和主管們,從而影響產品,流程,和決策。
Nate Silver利用收集到的數(shù)據(jù),在美國2012年總統(tǒng)大選預測對了50州的投票結果以及最終的大選的結果。數(shù)據(jù)科學家們正在向世界昭示他們愈來愈重要的作用。
在可見的未來,數(shù)據(jù)科學家這個新興職業(yè)將愈發(fā)活躍商業(yè)世界。當他們在硅谷的各大科技公司站穩(wěn)腳跟后,更多的傳統(tǒng)行業(yè)將很有可能擁抱這個目前還不被大多人了解的群體,因為他們在大數(shù)據(jù)分析領域的聰明才智可以為公司節(jié)省上千萬的資金并且發(fā)現(xiàn)更具價值的投資方向。
他們這么看數(shù)據(jù)科學家
John Rauser, 亞馬遜大數(shù)據(jù)科學家:
數(shù)據(jù)科學家是工程師和統(tǒng)計學家的結合體。從事這個職位要求極強的駕馭和管理海量數(shù)據(jù)的能力;同時也需要有像統(tǒng)計學家一樣萃取、分析數(shù)據(jù)價值的本事,二者缺一不可。
Steven Hillion, EMC Greenplum數(shù)據(jù)分析副總裁:
數(shù)據(jù)科學家是具有極強分析能力和對統(tǒng)計和數(shù)學有很深研究的數(shù)據(jù)工程師。他們能從商業(yè)信息等其他復雜且海量的數(shù)據(jù)庫中洞察新趨勢。
Monica Rogati, LinkedIn資深數(shù)據(jù)科學家:
所有的科學家都是數(shù)據(jù)學家,因為他們整天都在和海量數(shù)據(jù)打交道。在我眼中,數(shù)據(jù)學家是一半黑客加一半分析師。他們通過數(shù)據(jù)建立看待事物的新維度。數(shù)據(jù)學家必須能夠用一只眼睛發(fā)現(xiàn)新世界,用另一只眼睛質疑自己的發(fā)現(xiàn)。
Daniel Tunkelang,LinkedIn首席數(shù)據(jù)科學家:
我是bit.ly 首席科學家Hilary Mason的忠實崇拜者。關于這個新概念的定義我也想引用她的說法:數(shù)據(jù)科學家是能夠利用各種信息獲取方式、統(tǒng)計學原理和機器的學習能力對其掌握的數(shù)據(jù)進行收集、去噪、分析并解讀的角色。
Michael Rappa,北卡羅萊納州立大學教授:
盡管數(shù)據(jù)科學家這個名稱最近才開始在硅谷出現(xiàn),但這個新職業(yè)的產生卻是基于人類上百年對數(shù)據(jù)分析的不斷積累和衍生。和數(shù)據(jù)科學家最接近的職業(yè)應該是統(tǒng)計學家,只不過統(tǒng)計學家是一個成熟的定義且服務領域基本局限于政府和學界。數(shù)據(jù)科學家把統(tǒng)計學的精髓帶到了更多的行業(yè)和領域。