www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 芯聞號 > 極客網(wǎng)
[導(dǎo)讀]學(xué)生參加考試,當(dāng)他不知道題目的答案時,可能會猜測。實際上,AI聊天機(jī)器人也一樣。AI給出的答案可能看起來正確,實際卻是完全錯誤的,這就是所謂的“幻覺”。

學(xué)生參加考試,當(dāng)他不知道題目的答案時,可能會猜測。實際上,AI聊天機(jī)器人也一樣。AI給出的答案可能看起來正確,實際卻是完全錯誤的,這就是所謂的“幻覺”。

從本質(zhì)上講,AI大語言模型生成的回復(fù)偏離事實或者不符合邏輯,就會產(chǎn)生幻覺。在訓(xùn)練時模型難免存在數(shù)據(jù)空白,但它會用看似合理、實則錯誤的細(xì)節(jié)填補、掩飾。

AI并非有意欺騙人類,而是人類利用龐大數(shù)據(jù)進(jìn)行訓(xùn)練時存在缺陷。AI預(yù)測序列的下一個單詞或者詞匯時,并未真正理解含義,所以導(dǎo)致錯誤。

雖然近年來AI技術(shù)有所進(jìn)步,但即便是在OpenAI的GPT-5模型中,幻覺依然存在,而且還很嚴(yán)重。

AI幻覺出現(xiàn)與獎勵出錯有關(guān)

為什么會出現(xiàn)幻覺?一些專家認(rèn)為,主要是訓(xùn)練數(shù)據(jù)和算法存在局限性。OpenAI開發(fā)的AI模型實際上就是模式匹配機(jī)器,它擅長模仿,但是當(dāng)數(shù)據(jù)不完整或者含糊不清時就容易出錯。

OpenAI最近發(fā)表論文,認(rèn)為造成幻覺的原因是訓(xùn)練時方法錯誤。當(dāng)模型輸出充滿自信的結(jié)果時會獲得“獎勵”,哪怕給出的結(jié)果是猜測的,也會得到獎勵,這就誘導(dǎo)AI輸出過度自信但存在錯誤的信息。

也就是說,在回復(fù)時AI喜歡“假裝”自己能準(zhǔn)確回答問題,不承認(rèn)自己存在不確定性,這一問題屬于隱性結(jié)構(gòu)性缺陷,暫時找不到解決方法。

一些專家斷言,當(dāng)前的訓(xùn)練方法鼓勵A(yù)I猜測,導(dǎo)致AI過度自信,不承認(rèn)自己無知,結(jié)果導(dǎo)致“幻覺”問題有可能越來越嚴(yán)重。

就連OpenAI也不得不承認(rèn),幻覺可能是永遠(yuǎn)無法解決的問題。所以O(shè)penAI認(rèn)為,不應(yīng)該鼓勵A(yù)I猜測,而應(yīng)該鼓勵A(yù)I承認(rèn)不確定性。

然而,另一個問題隨之到來。Claude模型鼓勵A(yù)I承認(rèn)不確定性,對于不準(zhǔn)確的回復(fù),它總是避免給出定論。但如此一來,必然會導(dǎo)致Claude在回復(fù)時拒絕率居高不下,進(jìn)而導(dǎo)致用戶不滿,最終影響實用性。

今天的AI實際上有點像“應(yīng)試者”,面對問題時如果無法給出確定答案,為了提高成績,AI會通過猜測來應(yīng)對,因為猜測后成績更高。我們的世界并非絕對的二元對立,對與錯、黑與白,并非如此純粹簡單。生活中到處都是不確定性,真正的準(zhǔn)確可能根本就無法實現(xiàn)。

作為人類,當(dāng)我們走出校園,經(jīng)歷挫折和實踐,會逐漸領(lǐng)悟到“表達(dá)存在不確定性”的價值,但在語言模型中,表達(dá)不確定卻會遭到懲罰。

為了解決這一問題,OpenAI建議重新設(shè)計評估標(biāo)準(zhǔn)。在評估AI時,如果存在不確定情況,AI棄權(quán),拒絕回應(yīng),不應(yīng)該懲罰它。

OpenAI認(rèn)為:“我們的評估方法偏愛準(zhǔn)確性,這種方法需要更新,評分機(jī)制應(yīng)該努力抑制猜測行為。如果主要的評分系統(tǒng)一直鼓勵猜測,那么模型就會不斷學(xué)習(xí)如何猜測。”

幻覺成了AI的“癌癥”

“幻覺”問題嚴(yán)重阻礙了AI的普及。如果應(yīng)用于醫(yī)療保健或者金融領(lǐng)域,不可靠的結(jié)果可能會造成嚴(yán)重后果。

美國普渡大學(xué)研究人員Tianyang Xu認(rèn)為:“對于大多數(shù)幻覺而言,發(fā)生概率已經(jīng)降低到一個用戶可以接受的水平?!钡诜?、數(shù)學(xué)等領(lǐng)域,幻覺仍然是一大障礙。

加州大學(xué)認(rèn)知科學(xué)與人工智能研究專家Mark Steyvers表示:“OpenAI在做一些小努力,有進(jìn)步,但離目標(biāo)還很遠(yuǎn),GPT并沒有頻繁地承認(rèn)自己不知道?!?

Tianyang Xu認(rèn)為,擴(kuò)大模型規(guī)??梢愿纳苹糜X問題,我們還可以豐富模型的內(nèi)部關(guān)聯(lián),提高訓(xùn)練數(shù)據(jù)質(zhì)量。當(dāng)模型訓(xùn)練數(shù)據(jù)不足或者基礎(chǔ)信息存在錯誤時,幻覺問題尤其嚴(yán)重。此外,當(dāng)AI面對的論文太長、內(nèi)容超出理解能力時,無論是總結(jié)還是分析,都會產(chǎn)生幻覺現(xiàn)象。

哥本哈根AI公司Silvi的研究人員Mushtaq Bilal指出,完全消除幻覺幾乎是不可能的,如果能做到,AI企業(yè)早就做了。

Saachi Jain管理一個AI安全團(tuán)隊,他認(rèn)為,減少錯誤,讓模型承認(rèn)自己不知道,這是OpenAI關(guān)注的重點。針對問題,OpenAI傾向于給出冗長、開放式回答,這樣也能減少幻覺現(xiàn)象。

艾倫人工智能研究所AI研究員Akari Asai認(rèn)為,在一項名為“ScholarQA-CS”的文獻(xiàn)綜述基準(zhǔn)測試中,如果GPT-5允許聯(lián)網(wǎng),它的表現(xiàn)很好。如果無法聯(lián)網(wǎng),GPT-5就會出現(xiàn)問題,因為大多文獻(xiàn)綜述系統(tǒng)具備與學(xué)術(shù)數(shù)據(jù)庫交叉核對的能力,交叉校對至關(guān)重要。如果不聯(lián)網(wǎng),GPT-5出現(xiàn)錯誤的概率相當(dāng)于GPT-4的兩倍。

New Scientist在一篇文章中表示,AI出現(xiàn)一定程度的幻覺是難以避免的,人類可以通過檢索增強生成技術(shù)來緩解,也就是讓模型參考外部數(shù)據(jù),進(jìn)行交叉對比。問題在于,隨著模型的擴(kuò)大,“幻覺率”似乎并沒有降低,反而提高了。

New Scientist在2025年5月的一篇文章中指出,由于AI復(fù)雜度增加,幻覺更嚴(yán)重了。甚至有人大聲疾呼:“當(dāng)AI變得更智能時,幻覺不僅不會減少,反而會增加。”

看來幻覺的確像是AI的癌癥,人類努力多年,無法治愈癌癥,可能幻覺也超出了人類認(rèn)知,屬于不可解決的范疇。(小刀)

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月10日消息,據(jù)媒體報道,瑞士洛桑國際管理發(fā)展學(xué)院最新發(fā)布的《2025年世界人才排名》顯示,中國香港排名大幅上升,由去年的第九位躍升至全球第四,創(chuàng)下歷來最高位次,位居亞洲之首。

關(guān)鍵字: 科技 AI

北京2025年9月8日 /美通社/ -- 近日,富士膠片商業(yè)創(chuàng)新(中國)有限公司與上海合合信息科技股份有限公司達(dá)成合作。富士膠片商業(yè)創(chuàng)新(中國)推出集成合合信息AI智能文檔抽取、鴻翼文檔云元數(shù)據(jù)管理的司錄掃描開放中臺,既...

關(guān)鍵字: 富士 AI 數(shù)字化 自動化

柏林2025年9月9日 /美通社/ -- 總部位于迪拜的生活方式科技品牌ASTRAUX強勢亮相2025年柏林國際電子消費品展覽會(IFA),首次推出的三款原創(chuàng)產(chǎn)品引發(fā)廣泛關(guān)注,成功將品牌推向綠色出行與智能生活領(lǐng)域的輿論焦...

關(guān)鍵字: ST COM AI GLOBAL

武漢2025年9月9日 /美通社/ -- 7月24日,2025慧聰跨業(yè)品牌巡展——湖北?武漢站在武漢中南花園酒店隆重舉辦!本次巡展由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏網(wǎng)、慧聰教育網(wǎng)聯(lián)合主辦,吸引了安防、...

關(guān)鍵字: AI 希捷 BSP 平板

杭州2025年9月9日 /美通社/ -- 近日,由中國電子學(xué)會、中國通信學(xué)會聯(lián)合主辦的2025物聯(lián)網(wǎng)大會在江蘇無錫舉辦。會上發(fā)布了"2025年度物聯(lián)網(wǎng)領(lǐng)域十大科技進(jìn)展",由浙江大學(xué)、中國電信集團(tuán)有限公...

關(guān)鍵字: 智能網(wǎng)絡(luò) 物聯(lián)網(wǎng) 智能化 AI

上海2025年9月9日 /美通社/ -- 為全面落實黨中央、國務(wù)院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務(wù)業(yè)的決策部署,更好發(fā)揮人力資源服務(wù)業(yè)賦能百業(yè)作用,8月29日,以"AI智領(lǐng) HR智鏈 靜候你來&quo...

關(guān)鍵字: 智能體 AI BSP 人工智能

慕尼黑2025年9月8日 /美通社/ -- 2025年9月8日德國國際汽車及智慧出行博覽會(IAA MOBILITY)于慕尼黑開幕,廣汽攜旗下五款新能源明星車型亮相,正式發(fā)布未來移動出行的"廣汽方案"...

關(guān)鍵字: 廣汽 IO AI 移動

重慶2025年9月8日 /美通社/ -- 7月29日,山城重慶迎來一場科技與智慧交融的盛宴。2025慧聰跨業(yè)品牌巡展——重慶站在重慶富力艾美酒店隆重拉開帷幕。本次活動由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏...

關(guān)鍵字: 安防 集成 AI 索尼

南寧2025年9月8日 /美通社/ -- 8月8日,2025慧聰跨業(yè)品牌巡展南寧站在南寧荔園維景國際大酒店盛大啟幕! 作為本年度巡展的收官之戰(zhàn),本次活動由慧聰安防網(wǎng)、慧聰教育網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰 LED...

關(guān)鍵字: 億光 AI 光電 工業(yè)交換機(jī)

浙江寧波2025年9月8日 /美通社/ -- 人工智能的熱流在寧波翻涌。9月4日,由浙江數(shù)字經(jīng)濟(jì)百人會主辦的"智能時代 浙里領(lǐng)航——智能體創(chuàng)新與應(yīng)用圓桌會",成為一場重量級思想碰撞的樞紐。匯聚政產(chǎn)學(xué)研...

關(guān)鍵字: 智能體 離散 AI 模型
關(guān)閉