當(dāng)前位置：首頁 > 芯聞號 > 極客網(wǎng)

原創(chuàng)

幻覺成了AI的“癌癥”，連OpenAI也治不了

時間：2025-09-10 10:47:44

關(guān)鍵字：幻覺 AI OpenAI AI聊天機(jī)器人

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]學(xué)生參加考試，當(dāng)他不知道題目的答案時，可能會猜測。實際上，AI聊天機(jī)器人也一樣。AI給出的答案可能看起來正確，實際卻是完全錯誤的，這就是所謂的“幻覺”。

學(xué)生參加考試，當(dāng)他不知道題目的答案時，可能會猜測。實際上，AI聊天機(jī)器人也一樣。AI給出的答案可能看起來正確，實際卻是完全錯誤的，這就是所謂的“幻覺”。

從本質(zhì)上講，AI大語言模型生成的回復(fù)偏離事實或者不符合邏輯，就會產(chǎn)生幻覺。在訓(xùn)練時模型難免存在數(shù)據(jù)空白，但它會用看似合理、實則錯誤的細(xì)節(jié)填補、掩飾。

AI并非有意欺騙人類，而是人類利用龐大數(shù)據(jù)進(jìn)行訓(xùn)練時存在缺陷。AI預(yù)測序列的下一個單詞或者詞匯時，并未真正理解含義，所以導(dǎo)致錯誤。

雖然近年來AI技術(shù)有所進(jìn)步，但即便是在OpenAI的GPT-5模型中，幻覺依然存在，而且還很嚴(yán)重。

AI幻覺出現(xiàn)與獎勵出錯有關(guān)

為什么會出現(xiàn)幻覺？一些專家認(rèn)為，主要是訓(xùn)練數(shù)據(jù)和算法存在局限性。OpenAI開發(fā)的AI模型實際上就是模式匹配機(jī)器，它擅長模仿，但是當(dāng)數(shù)據(jù)不完整或者含糊不清時就容易出錯。

OpenAI最近發(fā)表論文，認(rèn)為造成幻覺的原因是訓(xùn)練時方法錯誤。當(dāng)模型輸出充滿自信的結(jié)果時會獲得“獎勵”，哪怕給出的結(jié)果是猜測的，也會得到獎勵，這就誘導(dǎo)AI輸出過度自信但存在錯誤的信息。

也就是說，在回復(fù)時AI喜歡“假裝”自己能準(zhǔn)確回答問題，不承認(rèn)自己存在不確定性，這一問題屬于隱性結(jié)構(gòu)性缺陷，暫時找不到解決方法。

一些專家斷言，當(dāng)前的訓(xùn)練方法鼓勵A(yù)I猜測，導(dǎo)致AI過度自信，不承認(rèn)自己無知，結(jié)果導(dǎo)致“幻覺”問題有可能越來越嚴(yán)重。

就連OpenAI也不得不承認(rèn)，幻覺可能是永遠(yuǎn)無法解決的問題。所以O(shè)penAI認(rèn)為，不應(yīng)該鼓勵A(yù)I猜測，而應(yīng)該鼓勵A(yù)I承認(rèn)不確定性。

然而，另一個問題隨之到來。Claude模型鼓勵A(yù)I承認(rèn)不確定性，對于不準(zhǔn)確的回復(fù)，它總是避免給出定論。但如此一來，必然會導(dǎo)致Claude在回復(fù)時拒絕率居高不下，進(jìn)而導(dǎo)致用戶不滿，最終影響實用性。

今天的AI實際上有點像“應(yīng)試者”，面對問題時如果無法給出確定答案，為了提高成績，AI會通過猜測來應(yīng)對，因為猜測后成績更高。我們的世界并非絕對的二元對立，對與錯、黑與白，并非如此純粹簡單。生活中到處都是不確定性，真正的準(zhǔn)確可能根本就無法實現(xiàn)。

作為人類，當(dāng)我們走出校園，經(jīng)歷挫折和實踐，會逐漸領(lǐng)悟到“表達(dá)存在不確定性”的價值，但在語言模型中，表達(dá)不確定卻會遭到懲罰。

為了解決這一問題，OpenAI建議重新設(shè)計評估標(biāo)準(zhǔn)。在評估AI時，如果存在不確定情況，AI棄權(quán)，拒絕回應(yīng)，不應(yīng)該懲罰它。

OpenAI認(rèn)為：“我們的評估方法偏愛準(zhǔn)確性，這種方法需要更新，評分機(jī)制應(yīng)該努力抑制猜測行為。如果主要的評分系統(tǒng)一直鼓勵猜測，那么模型就會不斷學(xué)習(xí)如何猜測。”

幻覺成了AI的“癌癥”

“幻覺”問題嚴(yán)重阻礙了AI的普及。如果應(yīng)用于醫(yī)療保健或者金融領(lǐng)域，不可靠的結(jié)果可能會造成嚴(yán)重后果。

美國普渡大學(xué)研究人員Tianyang Xu認(rèn)為：“對于大多數(shù)幻覺而言，發(fā)生概率已經(jīng)降低到一個用戶可以接受的水平?！钡诜?、數(shù)學(xué)等領(lǐng)域，幻覺仍然是一大障礙。

加州大學(xué)認(rèn)知科學(xué)與人工智能研究專家Mark Steyvers表示：“OpenAI在做一些小努力，有進(jìn)步，但離目標(biāo)還很遠(yuǎn)，GPT并沒有頻繁地承認(rèn)自己不知道?！?

Tianyang Xu認(rèn)為，擴(kuò)大模型規(guī)?？梢愿纳苹糜X問題，我們還可以豐富模型的內(nèi)部關(guān)聯(lián)，提高訓(xùn)練數(shù)據(jù)質(zhì)量。當(dāng)模型訓(xùn)練數(shù)據(jù)不足或者基礎(chǔ)信息存在錯誤時，幻覺問題尤其嚴(yán)重。此外，當(dāng)AI面對的論文太長、內(nèi)容超出理解能力時，無論是總結(jié)還是分析，都會產(chǎn)生幻覺現(xiàn)象。

哥本哈根AI公司Silvi的研究人員Mushtaq Bilal指出，完全消除幻覺幾乎是不可能的，如果能做到，AI企業(yè)早就做了。

Saachi Jain管理一個AI安全團(tuán)隊，他認(rèn)為，減少錯誤，讓模型承認(rèn)自己不知道，這是OpenAI關(guān)注的重點。針對問題，OpenAI傾向于給出冗長、開放式回答，這樣也能減少幻覺現(xiàn)象。

艾倫人工智能研究所AI研究員Akari Asai認(rèn)為，在一項名為“ScholarQA-CS”的文獻(xiàn)綜述基準(zhǔn)測試中，如果GPT-5允許聯(lián)網(wǎng)，它的表現(xiàn)很好。如果無法聯(lián)網(wǎng)，GPT-5就會出現(xiàn)問題，因為大多文獻(xiàn)綜述系統(tǒng)具備與學(xué)術(shù)數(shù)據(jù)庫交叉核對的能力，交叉校對至關(guān)重要。如果不聯(lián)網(wǎng)，GPT-5出現(xiàn)錯誤的概率相當(dāng)于GPT-4的兩倍。

New Scientist在一篇文章中表示，AI出現(xiàn)一定程度的幻覺是難以避免的，人類可以通過檢索增強生成技術(shù)來緩解，也就是讓模型參考外部數(shù)據(jù)，進(jìn)行交叉對比。問題在于，隨著模型的擴(kuò)大，“幻覺率”似乎并沒有降低，反而提高了。

New Scientist在2025年5月的一篇文章中指出，由于AI復(fù)雜度增加，幻覺更嚴(yán)重了。甚至有人大聲疾呼：“當(dāng)AI變得更智能時，幻覺不僅不會減少，反而會增加。”

看來幻覺的確像是AI的癌癥，人類努力多年，無法治愈癌癥，可能幻覺也超出了人類認(rèn)知，屬于不可解決的范疇。（小刀）

聲明：該篇文章為本站原創(chuàng)，未經(jīng)授權(quán)不予轉(zhuǎn)載，侵權(quán)必究。

換一批

2025年世界人才排名公布：香港位列亞洲第一

9月10日消息，據(jù)媒體報道，瑞士洛桑國際管理發(fā)展學(xué)院最新發(fā)布的《2025年世界人才排名》顯示，中國香港排名大幅上升，由去年的第九位躍升至全球第四，創(chuàng)下歷來最高位次，位居亞洲之首。

關(guān)鍵字：科技 AI

[美通社全球TMT]

富士膠片商業(yè)創(chuàng)新（中國）攜手合合信息：從AI智取文檔信息到業(yè)務(wù)洞察

北京2025年9月8日 /美通社/ -- 近日，富士膠片商業(yè)創(chuàng)新（中國）有限公司與上海合合信息科技股份有限公司達(dá)成合作。富士膠片商業(yè)創(chuàng)新（中國）推出集成合合信息AI智能文檔抽取、鴻翼文檔云元數(shù)據(jù)管理的司錄掃描開放中臺，既...

關(guān)鍵字：富士 AI 數(shù)字化自動化

[美通社全球TMT]

新銳科技品牌ASTRAUX亮相柏林IFA展，加速進(jìn)軍歐洲主要市場

柏林2025年9月9日 /美通社/ -- 總部位于迪拜的生活方式科技品牌ASTRAUX強勢亮相2025年柏林國際電子消費品展覽會（IFA），首次推出的三款原創(chuàng)產(chǎn)品引發(fā)廣泛關(guān)注，成功將品牌推向綠色出行與智能生活領(lǐng)域的輿論焦...

關(guān)鍵字： ST COM AI GLOBAL

[美通社全球TMT]

武漢站告捷！慧聰品牌巡展掀起智能生態(tài)新篇

武漢2025年9月9日 /美通社/ -- 7月24日，2025慧聰跨業(yè)品牌巡展——湖北?武漢站在武漢中南花園酒店隆重舉辦！本次巡展由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏網(wǎng)、慧聰教育網(wǎng)聯(lián)合主辦，吸引了安防、...

關(guān)鍵字： AI 希捷 BSP 平板

[美通社全球TMT]

大華股份智能網(wǎng)絡(luò)落地成果榮獲物聯(lián)網(wǎng)領(lǐng)域十大科技進(jìn)展

杭州2025年9月9日 /美通社/ -- 近日，由中國電子學(xué)會、中國通信學(xué)會聯(lián)合主辦的2025物聯(lián)網(wǎng)大會在江蘇無錫舉辦。會上發(fā)布了"2025年度物聯(lián)網(wǎng)領(lǐng)域十大科技進(jìn)展"，由浙江大學(xué)、中國電信集團(tuán)有限公...

關(guān)鍵字：智能網(wǎng)絡(luò) 物聯(lián)網(wǎng) 智能化 AI

[美通社全球TMT]

上海外服攜AI智能體求職助手"凌佳佳"亮相上海市第二屆人力資源服務(wù)業(yè)創(chuàng)新發(fā)展大會

上海2025年9月9日 /美通社/ -- 為全面落實黨中央、國務(wù)院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務(wù)業(yè)的決策部署，更好發(fā)揮人力資源服務(wù)業(yè)賦能百業(yè)作用，8月29日，以"AI智領(lǐng) HR智鏈靜候你來&quo...

關(guān)鍵字：智能體 AI BSP 人工智能

[美通社全球TMT]

廣汽IAA MOBILITY首秀，AION V正式上市開啟歐洲市場新里程

慕尼黑2025年9月8日 /美通社/ -- 2025年9月8日德國國際汽車及智慧出行博覽會（IAA MOBILITY）于慕尼黑開幕，廣汽攜旗下五款新能源明星車型亮相，正式發(fā)布未來移動出行的"廣汽方案"...

關(guān)鍵字：廣汽 IO AI 移動

[美通社全球TMT]

安防集成商"破局"新機(jī)遇，2025慧聰品牌巡展重慶站圓滿落幕！

重慶2025年9月8日 /美通社/ -- 7月29日，山城重慶迎來一場科技與智慧交融的盛宴。2025慧聰跨業(yè)品牌巡展——重慶站在重慶富力艾美酒店隆重拉開帷幕。本次活動由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏...

關(guān)鍵字：安防集成 AI 索尼

[美通社全球TMT]

精彩收官！2025慧聰品牌巡展南寧站壓軸登場，科技碰撞燃爆綠城

南寧2025年9月8日 /美通社/ -- 8月8日，2025慧聰跨業(yè)品牌巡展南寧站在南寧荔園維景國際大酒店盛大啟幕！作為本年度巡展的收官之戰(zhàn)，本次活動由慧聰安防網(wǎng)、慧聰教育網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰 LED...

關(guān)鍵字：億光 AI 光電工業(yè)交換機(jī)

[美通社全球TMT]