硅基模型vs.碳基大腦:AI能否成為超越人類(lèi)的超級(jí)預(yù)測(cè)者?
如果能精準(zhǔn)預(yù)測(cè)未來(lái),就能在生活中占盡先機(jī),無(wú)論是預(yù)判房?jī)r(jià)漲跌,還是捕捉下一個(gè)產(chǎn)業(yè)風(fēng)口,預(yù)測(cè)的魅力都無(wú)人可擋。隨著 AI 技術(shù)的蓬勃發(fā)展,一個(gè)核心問(wèn)題開(kāi)始引發(fā)思考:人工智能能否成為超越人類(lèi)的超級(jí)預(yù)測(cè)者?
在這一思潮的推動(dòng)下,預(yù)測(cè)領(lǐng)域正加速構(gòu)建 AI 預(yù)測(cè)機(jī)器人。事實(shí)上,這類(lèi)技術(shù)早就已經(jīng)出現(xiàn)在金融市場(chǎng),比如 DeepSeek就是憑借算法交易模型起家的。但目前業(yè)界的共識(shí)是:頂尖人類(lèi)預(yù)測(cè)者仍全面領(lǐng)先于機(jī)器。
以專(zhuān)業(yè)預(yù)測(cè)平臺(tái) Metaculus 為例,它定期舉辦季度預(yù)測(cè)錦標(biāo)賽。最開(kāi)始時(shí)賽事只允許人類(lèi)參與,近年新增 AI 機(jī)器人組別。觀察2024 年三季度、四季度及 2025年一季度的預(yù)測(cè)結(jié)果,我們可以發(fā)現(xiàn)人類(lèi)超級(jí)預(yù)測(cè)者優(yōu)于機(jī)器。
不過(guò) Metaculus CEO 德格?圖蘭(Deger Turan)指出一個(gè)關(guān)鍵趨勢(shì):人類(lèi)預(yù)測(cè)的能力基本穩(wěn)定,而 AI 的進(jìn)步肉眼可見(jiàn),兩者的差距正在縮小。
能否優(yōu)化AI的預(yù)測(cè)能力
預(yù)測(cè)能力蘊(yùn)含著巨大價(jià)值:律師想預(yù)判對(duì)手是否接受和解,建筑項(xiàng)目要估算竣工時(shí)間,電影制片人想押中爆款劇本,甚至單身者都想知道約會(huì)對(duì)象更愛(ài)咖啡還是啤酒。毫無(wú)疑問(wèn),人人都想成為預(yù)測(cè)大師。
從技術(shù)本質(zhì)看,AI 預(yù)測(cè)的邏輯并不復(fù)雜:通過(guò)海量數(shù)據(jù)訓(xùn)練大模型,使其具備對(duì)未知場(chǎng)景的推演能力。預(yù)測(cè)已經(jīng)形成獨(dú)特的知識(shí)體系,比如“基礎(chǔ)率”(某現(xiàn)象的歷史發(fā)生概率,以避免過(guò)度樂(lè)觀或悲觀的預(yù)測(cè)偏差)、“布里爾分?jǐn)?shù)”(用于衡量概率預(yù)測(cè)準(zhǔn)確性的評(píng)估指標(biāo))、“校準(zhǔn)度”(模型預(yù)測(cè)的概率與實(shí)際事件發(fā)生概率之間的一致性)已經(jīng)成為預(yù)測(cè)學(xué)的基石。人類(lèi)將終極目標(biāo)指向 “超級(jí)預(yù)測(cè)者”,它們的準(zhǔn)確率遠(yuǎn)超平均水平,預(yù)測(cè)結(jié)果具有持續(xù)可靠性。
2024 年 10 月,國(guó)際AI領(lǐng)域非營(yíng)利組織人工智能安全中心(Center for AI Safety)宣稱(chēng),僅通過(guò)大語(yǔ)言模型抓取新聞就能實(shí)現(xiàn) “超人級(jí)” 預(yù)測(cè),但這一結(jié)論很快因 “數(shù)據(jù)污染” 崩塌,模型誤將本不該獲取的信息納入其中,導(dǎo)致結(jié)果無(wú)法復(fù)現(xiàn)。
相比之下,加州大學(xué)伯克利分校的方案更具參考價(jià)值,它的預(yù)測(cè)模型也是基于大模型開(kāi)發(fā)的,但增加了許多限制,比如,不允許機(jī)器人自動(dòng)運(yùn)行,而是按特定順序執(zhí)行系列任務(wù)。具體來(lái)說(shuō)就是增加的特定框架,首先要求模型制定一系列問(wèn)題,根據(jù)問(wèn)題獲取相關(guān)新聞內(nèi)容;第二步,新聞服務(wù)給出回應(yīng),大語(yǔ)言模型判斷哪些回應(yīng)最實(shí)用;然后根據(jù)相關(guān)度最高的回應(yīng)進(jìn)行匯總。
實(shí)驗(yàn)數(shù)據(jù)顯示,若直接調(diào)用大語(yǔ)言模型進(jìn)行預(yù)測(cè),不做結(jié)構(gòu)化處理,其準(zhǔn)確率經(jīng)常接近甚至低于隨機(jī)猜測(cè)水平,這表明單純依賴(lài)大模型難以有效捕捉復(fù)雜邏輯關(guān)系。而經(jīng)過(guò)結(jié)構(gòu)化訓(xùn)練后,AI 機(jī)器人的預(yù)測(cè)準(zhǔn)確率顯著提升。
盡管近年來(lái) AI 能力取得顯著進(jìn)步,但在預(yù)測(cè)領(lǐng)域仍未能超越人類(lèi),更無(wú)法企及 "超級(jí)預(yù)測(cè)者" 水平。展望未來(lái),預(yù)測(cè)模型將更趨 "結(jié)構(gòu)化" 發(fā)展,人機(jī)協(xié)作的深度與廣度也將進(jìn)一步提升。
預(yù)測(cè)的難點(diǎn)在哪里
開(kāi)發(fā) AI 預(yù)測(cè)工具的 FutureSearch 公司 CEO 丹?施瓦茨指出:“從學(xué)術(shù)層面看,至今沒(méi)有成果能超越加州大學(xué)伯克利分校的論文,而那篇研究已發(fā)布超一年?!痹?AI 領(lǐng)域,一年時(shí)光足以見(jiàn)證技術(shù)迭代。這一現(xiàn)狀既印證了伯克利團(tuán)隊(duì)的突破性,也暴露了 AI 預(yù)測(cè)的深層困境:語(yǔ)言模型在定量分析與邏輯推理上存在天然缺陷,面對(duì)復(fù)雜問(wèn)題時(shí),大模型的預(yù)測(cè)能力更糟糕。
但伯克利研究團(tuán)隊(duì)仍保持樂(lè)觀。他們強(qiáng)調(diào),盡管 AI 存在局限性,但從 ChatGPT 問(wèn)世至今不過(guò)數(shù)年,當(dāng)前 AI 預(yù)測(cè)能力已逼近人類(lèi)平均水平。若能將專(zhuān)業(yè)預(yù)測(cè)概念深度植入 AI 系統(tǒng),其表現(xiàn)完全有可能超越人類(lèi)頂尖預(yù)測(cè)團(tuán)隊(duì)。
回望歷史,人類(lèi)本就是極不擅長(zhǎng)預(yù)測(cè)的物種,無(wú)論是經(jīng)濟(jì)危機(jī)還是技術(shù)變革,無(wú)數(shù)誤判早已證明這一點(diǎn)。
想擁有良好的預(yù)測(cè)能力,需要誠(chéng)實(shí)面對(duì)錯(cuò)誤,不斷汲取教訓(xùn),要不斷調(diào)整觀點(diǎn),不能被新聞評(píng)論或者別人的討論干擾,還要對(duì)所有信息都給予恰當(dāng)重視,這本來(lái)就反人性的。如果讓AI來(lái)處理,可能效果會(huì)更好。
幾年前,美國(guó)曾出版過(guò)一本名叫《超級(jí)預(yù)測(cè)》的書(shū),作者是賓夕法尼亞大學(xué)心理學(xué)家Philip Tetlock,雖然本書(shū)曾引起熱議,但幾乎沒(méi)多少人認(rèn)為有明確的預(yù)測(cè)策略存在。一個(gè)耐人尋味的現(xiàn)象是:當(dāng)印巴沖突升級(jí)或中美關(guān)稅談判膠著時(shí),鮮見(jiàn) “超級(jí)預(yù)測(cè)者” 在媒體頭條發(fā)表觀點(diǎn);在白宮政策制定過(guò)程中,也難覓他們的身影;就連最依賴(lài)預(yù)測(cè)的投資機(jī)構(gòu)也極少將 “超級(jí)預(yù)測(cè)者” 納入決策鏈條。
如此現(xiàn)狀引出另一個(gè)問(wèn)題:世界對(duì)人類(lèi)超級(jí)預(yù)測(cè)者的需求并不強(qiáng),但如果是由機(jī)器來(lái)預(yù)測(cè)呢,情況會(huì)不會(huì)改變?
從當(dāng)前各大科技公司的研發(fā)方向看,"超級(jí) AI 預(yù)測(cè)工具" 尚未成為重點(diǎn)研發(fā)領(lǐng)域。即便成功研發(fā)出強(qiáng)大的 AI 預(yù)測(cè)工具,如何獲取決策者的信任仍是一大難題。
現(xiàn)代大語(yǔ)言模型本質(zhì)上是一個(gè) "黑箱" 系統(tǒng):當(dāng)人們提出問(wèn)題并讓其預(yù)測(cè)時(shí),實(shí)際上無(wú)法知曉大模型是如何通過(guò)計(jì)算得出最終答案的。
未來(lái),人類(lèi)可能會(huì)要求 AI 對(duì)預(yù)測(cè)結(jié)果進(jìn)行解釋?zhuān)鴽Q策者往往只會(huì)在解釋合理的情況下才采納其建議。當(dāng)工具出現(xiàn)時(shí),我們最開(kāi)始肯定會(huì)保持懷疑態(tài)度,隨著時(shí)間推移,AI需要用令人信服的預(yù)測(cè)成績(jī)征服人類(lèi),然后才能改變?nèi)祟?lèi)的決策方式。(小刀)