對于人工智能真正的人類智慧才是核心
微軟宣布將與研究實驗室OpenAI合作,投資10億美元打造“通用人工智能”(AGI)。OpenAI 首席執(zhí)行官 Sam Altman表示:“強人工智能的研發(fā)將是人類歷史上最重要的技術進步。”眾所周知,計算機在一些具體任務的處理上遠超人類,但它們并不具有人類智慧、常識以及批判性思維,在不明確的條件下它們往往很難執(zhí)行任務,作出判斷或選擇。因此,開發(fā)出類似于人腦的計算機將會是巨大的進步,然而微軟在這方面的嘗試似乎也并不讓人滿意。
通用人工智能也許只是一個虛幻的夢想,不過數(shù)據(jù)科學企圖依靠大數(shù)據(jù)和強大的計算功能,讓計算機根據(jù)事實做出明智的決策,而不是依賴人類的一時興起、預感或偏見。然而實際情況是,企業(yè)和政府依舊犯著大數(shù)據(jù)時代之前的那些錯誤。因為將重大決策交給計算機只會重復曾經(jīng)的錯誤判斷。
數(shù)據(jù)科學不僅僅是數(shù)學證明、統(tǒng)計計算和計算機編程。實驗設計、人類智慧、常識、懷疑和批判性思維,這些真正的人類智慧才是核心所在。如果數(shù)據(jù)科學想要發(fā)揮其巨大的潛力,就要避免以下9個常見的“陷阱”:第一臺機械計算機的發(fā)明者查爾斯·巴貝奇(Charles Babbage)曾兩次被問到:“巴貝奇先生,請問如果你把錯誤的數(shù)字輸入機器,會得出正確的答案嗎?”答案是否定的。
芝加哥一家醫(yī)院曾做過關于敗血癥病人的研究,他們認為,血液pH值低的患者出院后很快再次入院的概率較低。不過,他們的數(shù)據(jù)包括了在住院期間去世的病人!要知道,最不可能再次入院的病人正是那些躺在太平間里的人。所以,事實上,當我們排除那些“死亡數(shù)據(jù)”之后,pH值低的病人他們的病情其實并不樂觀。
一些數(shù)據(jù)科學家在沒有理論或常識指導的情況下,單單從龐大的數(shù)據(jù)中企圖尋找某種模式。他們認為思考一個問題限制了新知識的發(fā)現(xiàn)。不幸的是,大數(shù)據(jù)時代使得各種模式成千上萬,然而其中大多數(shù)都是毫無意義的。這一悖論在于:為了得出某種模式越是瘋狂地去搜索數(shù)據(jù),得出的結論可能越?jīng)]有價值。
一家互聯(lián)網(wǎng)營銷公司在100多個國家測試了其登陸頁面的三種顏色(黃色、紅色和藍綠色),并將其與傳統(tǒng)的藍色相對比。他們得出的結論是,英國人喜歡藍綠色,但事實并非如此。數(shù)學家熱愛數(shù)學,非數(shù)學家“畏懼”數(shù)學。這一致命的組合,往往會導致建立很多極其不現(xiàn)實的模型。
許多抵押貸款違約的數(shù)學模型在大衰退期間崩潰了,因為他們簡單的假設,違約的概率呈現(xiàn)正態(tài)分布且是獨立存在的。他們低估了極端事件發(fā)生的可能性,也忽略了經(jīng)濟衰退等宏觀經(jīng)濟事件將引發(fā)的大量抵押貸款違約的可能性。由于計算機能夠非常高效的處理某些問題,人們很容易認為,計算機擁有高智能。但是應對具體任務的高效性與應對各類復雜情況的綜合智力,這兩者是十分不同的。我們對于計算機的“崇拜”其實是一種有害的癡迷。
現(xiàn)如今,算法犯罪學在審前保釋、審后判決和定罪后假釋等決定中使用黑箱模型變得司空見慣。然而,黑箱的算法往往帶有種族偏見,甚至不如那些只考慮年齡和前科的簡單模型。為了能夠找到數(shù)據(jù)之間的重要關系,研究者試圖以各種各樣的方式對數(shù)據(jù)進行分析。羅納德科斯(Ronald Coase)曾精辟的對此表示,“如果你‘折磨’數(shù)據(jù)的時間夠久,它們總會‘招供’?!?/p>
物理學家理查德·費曼(Richard Feynman)曾說過:首先你不能欺騙自己——而自己是最容易被欺騙的人。真正的科學家會分享他們的理論,質(zhì)疑他們的假設,并尋找機會進行實驗來驗證或否定其理論與假設。而“數(shù)據(jù)小丑”只會看到他們想看的東西。
當數(shù)據(jù)波動較大時,大部分被測數(shù)據(jù)會高于現(xiàn)象,但隨后越來越多的值才更接近平均值。簡單來說,就是某項指標的表現(xiàn)過高或過低后會自然回歸到平均水平。一位高爾夫球手如果單憑僥幸在一次比賽中贏得了金牌,他很可能在下一次的比賽中表現(xiàn)欠佳,這并非是運氣不好或者發(fā)揮失常,只是因為上次的勝利其實高估了他的實力。
對于公司也是如此。一名數(shù)據(jù)分析師曾對過去三個月“表現(xiàn)欠佳”的網(wǎng)頁布局進行修改,希望能夠提高其收益。他顯然“大獲全勝”。在他對頁面布局做出調(diào)整之后的第二天,收益激增20%。之后收益增長依舊持續(xù)了一小段時間。不過,好景不長,事實證明這些確實是表現(xiàn)欠佳的網(wǎng)站,其收入已逐漸向平均水平回歸。
在大數(shù)據(jù)時代,企業(yè)和政府不斷地監(jiān)控我們,以便預測我們的行為并操縱我們的行為。優(yōu)秀的數(shù)據(jù)科學家懂得謹慎行事,尊重我們的權利和隱私?!凹核挥鹗┯谌恕边@句話對于數(shù)據(jù)科學同樣適用。所以,要想避免以上那些“錯誤”或“陷阱”,我們需要有批判性的思維。要將科學應用到數(shù)據(jù)科學之中,因此,我們更應該像科學家那樣去思考,而不是像機器那樣。