人工智能專家李飛飛傳記,她的故事有多勵志
人工智能時代正撲面而來。上周末,谷歌AI中國中心正式成立。宣布這一消息的,是被稱為“AI女神”的華裔女科學家李飛飛。
站在臺前和聚光燈下的李飛飛,現(xiàn)在被人提及時總會加上一串響當當?shù)念^銜:她是斯坦福大學計算機系終身教授、斯坦福大學人工智能實驗室主任、谷歌云人工智能和機器學習首席科學家……隨便拿出一個身份都足以證明其江湖地位。她最大的貢獻,便是主導(dǎo)的計算機視覺識別項目,每年吸引著包括Google、Facebook、Amazon等科技巨頭在內(nèi)的上百家頂尖機構(gòu),共同向前推進人工智能的邊界。在這些矚目的光環(huán)之下,卻是一位華裔女子非比尋常的勵志故事。
奮斗每天只睡4小時拼來全額獎學金1976年,李飛飛出生于北京,后來在四川長大。1993年,李飛飛跟隨父母移民到美國新澤西州小鎮(zhèn)帕西帕尼。
一到美國,困難就橫亙面前。李飛飛的父親只能找到做相機修理的工作,母親則當了名收銀員,微薄的收入遠不足以支撐全家的生活和學費。
這時,距離大學入學只有2年時間。如果想要進入一所好大學,李飛飛不僅要在少得可憐的學習時間里迅速掌握英語,還要拿出一份極其優(yōu)秀的成績單,只有這樣才能拿到頂尖大學的獎學金。否則,以他們的家境,是付不起高昂學費的。
李飛飛不得不分出大量精力,掙扎在唐人街中國餐館之間,到處端盤子,當清潔工,做收銀員……最辛苦的時候,她一天只睡4小時,周旋于工作和學習之中。
這就是普通新移民的生活,想要站穩(wěn)腳跟,就需要犧牲和決心。李飛飛曾回憶說:那是一段殘酷的時光,我不是很喜歡那時的自己。
一份付出,一份收獲。李飛飛收到了普林斯頓大學的錄取通知,還有全額獎學金。當時,這個消息在帕西帕尼算是個大新聞,她奮斗的故事登上了當?shù)氐膱蠹?,標題是《“美國夢”成真了!》。追夢聽從內(nèi)心去選擇自己的方向。
1995年,李飛飛進入普林斯頓大學,希望的大門漸漸為她打開。
讀書期間,李飛飛敏銳地注意到了市場上的機會,她決定借錢買下一家洗衣店,交給父母經(jīng)營。她從此過上了雙城生活:周一到周五,她是普林斯頓的高材生,拼命努力吸收知識;周六到周日,她則走出實驗室,穿上白圍裙,置身于成堆的衣服中,給洗衣店幫忙。
1999年,李飛飛從普林斯頓大學畢業(yè)。那時的華爾街趕上了大牛市,李飛飛接到了包括高盛在內(nèi)的多家頂級金融公司的offer,然而她卻沒有從中選擇任何一份工作開始賺更多的錢。那個時候,她的興趣是希望能去西藏,在那兒做一年的藏藥研究,這聽上去有點兒瘋狂。之后,她的夢想是攻讀一個博士,盡管在這期間一分錢也掙不到。
一年的西藏之行并非人生插曲。在科學界,藏醫(yī)與中醫(yī)一樣存在很多爭議,她在接受采訪中表示,作為一個科學家,藏醫(yī)可以在哲學和方法論層面上帶給她很多,她非常看重小眾科研項目在更大領(lǐng)域范圍內(nèi)的意義,每一項研究開始之前都要經(jīng)過深思熟慮。“對我來說,真正的挑戰(zhàn)是,你需要充分發(fā)揮自己的潛力,同時兼顧自己所身負的責任,然后又必須忠于自己的內(nèi)心。”
西藏歸來之后,李飛飛進入了加州理工學院,攻讀人工智能和計算神經(jīng)科學方向的博士學位。
生活依舊沒有停止對她的刁難。李飛飛讀博士期間,她的母親接連患上了癌癥與中風。那是一段艱苦的日子。李飛飛說,我們經(jīng)歷了很多困難,然后一起挺過來了。飛躍改變計算機視覺識別方向的人。
2005年博士畢業(yè)后,李飛飛進入了斯坦福大學AI實驗室,選擇了當時陷入瓶頸期不被看好的研究方向——計算機視覺識別領(lǐng)域。
計算機視覺識別,通俗地講,就是拿一張圖片,讓計算機認出來這張圖片所包含的內(nèi)容以及不同內(nèi)容區(qū)域的關(guān)系,讓機器讀懂圖像。這對于正在學習新事物的三歲小孩來說很簡單的事,但對于計算機智能的發(fā)展卻是一座大山。
彼時,圖像識別已經(jīng)走過了20個年頭,但計算機可識別的物體卻不到20種,這是遠遠不夠的。面對圖像識別如此匱乏的“詞匯量”,李飛飛產(chǎn)生了一個瘋狂的想法。她拿出一本字典,決定要讓圖像識別涵蓋到字典里的每一個詞條。當她把這個想法告訴其他教授時,大家都紛紛勸她換個方向,因為研究這個是“拿不到終生教授”的。
剛開始時,李飛飛將很大部分的精力都放在算法的優(yōu)化上,然而這并沒有帶來太大的突破。突然有一天,一個非常簡單但卻非常有沖擊力的想法,使李飛飛找準了方向。她想,沒人教嬰兒怎么“看”,也沒有人告訴他們“貓”的特征,但是他們卻能夠很快地知道這就是貓,無論什么品種或什么形態(tài)。因為人類的眼睛就好像一個生物照相機,每200毫秒就能獲取一幅圖片,一個三歲的孩子就已經(jīng)見過上億張貓的圖片了,能分辨圖片當然不在話下。所以要讓計算機學會“識圖”,關(guān)鍵是在于數(shù)據(jù)訓(xùn)練量——讓計算機看更多的圖片。
李飛飛與團隊便從互聯(lián)網(wǎng)上下載了近10億張圖片,在這之后便是對這些圖片進行分類、打上標簽,為計算機提供學習用的“題庫”,而這個“題庫”就是現(xiàn)在的ImageNet。然而,自己主導(dǎo)的研究初期并沒有獲得太多支持,研究經(jīng)費很快用完了。她曾想過雇用本科生,每人10美元一小時來人工歸類圖像,但人工完成項目需要90年。在最困難時,李飛飛曾打算重開洗衣店籌措科研經(jīng)費,就像當年籌措學費一樣。