原創(chuàng)

DeepSeek新AI模型有多震撼？外媒：相當于30美元iPhone降臨

時間：2025-01-23 11:24:22

關鍵字： DeepSeek AI模型 iPhone

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]DeepSeek（深度求索）再次推出新版開源AI模型，它的性能與美國最先進的AI模型雖然還有一些差距，但差距極小，成本低很多很多。西方許多人認為，美國限制中國AI發(fā)展的企圖遇挫，中國正在加速前進，以更高效率打造高端AI模型。

DeepSeek（深度求索）再次推出新版開源AI模型，它的性能與美國最先進的AI模型雖然還有一些差距，但差距極小，成本低很多很多。西方許多人認為，美國限制中國AI發(fā)展的企圖遇挫，中國正在加速前進，以更高效率打造高端AI模型。

去年12月，杭州幻方量化推出DeepSeek V3開源大語言模型，它的性能與OpenAI 40和Anthropic Claude 3.5 Sonnet差不多，當時OpenAI和Anthropic正在開發(fā)下一代模型。按照描述，V3的成本只有560萬美元！要知道OpenAI、谷歌、Anthropic為了搭建、訓練模型花費數(shù)億美元，未來可能達幾十億。

Andrej Karpathy曾經說過，V3的投資“低得有些荒謬”，在資源受限的條件下，無論是研究還是工程，都取得了令人驚嘆的成就。

DeepSeek創(chuàng)始人、CEO、幻方量化創(chuàng)始人梁文鋒去年曾說：“對我們而言錢不是問題，先進芯片受限卻是一個問題?！?

V3是用Nvidia H800芯片訓練的，它比美國版本性能弱一些，之后美國連Nvidia H800也禁了，不能向中國出售。

有人將同一時間發(fā)布的DeepSeek-R1-Zero和DeepSeek-R1進行了對比：

——DeepSeek-R1-Zero的優(yōu)勢：它具備創(chuàng)造性推理能力，擅長獨立發(fā)現(xiàn)獨特、創(chuàng)造性的推理策略。擁有自我驗證與反思能力，可以驗證自己的推理，在處理時進行反思，能有效進行長鏈思維。

——DeepSeek-R1的優(yōu)勢：可讀性高，精準，模型輸出的結果是可讀的，更精致，出錯率低。性能方面有強大競爭力，與最頂級的OpenAI模型可以一較高下，無論是數(shù)學、編程還是邏輯推理，都不遜色。

——DeepSeek-R1-Zero的弱點：輸出有時會重復，顯得雜亂，對用戶不夠友好，有時很難解釋輸出的結果。

相比較而言，DeepSeek-R1給出的結果更精致、更可靠，更加具有一致性。DeepSeek-R1-Zero在AI研究領域具有突破性意義，它向我們證明，單靠增強學習就能學會推理，不需要人類引導，這對AI發(fā)展來說具有里程碑意義。

R1是以Zero作為基礎開發(fā)的，它將SFT和SR結合在一起，在性能、與人類偏好保持一致兩個方面達到了平衡，更適合現(xiàn)實應用。

接下來讓我們看看外媒都是如何評價的：

Venturebeat：中國企業(yè)戲劇性后來居上

最新的DeepSeek-R1性能與OpenAI開發(fā)的o1差不多，無論是數(shù)學、編程還是推理，都很出色。最讓人吃驚的依然是成本，DeepSeek-R1的成本比o1低90-95%。

DeepSeek-R1的出現(xiàn)標志著開源模型取得了重大進步。它告訴我們，開源模型與閉源模型的差距正在縮小，二者將同時向AGI邁進。

報告顯示，DeepSeek-R1在AIME2024數(shù)學測試中取得79.8%的成績，與OpenAI o1的79.2%水平相當。在Codeforces測試中達到了2029的評分，超過96.3%的人類程序員（o1約為96.6%）。

英偉達高級科學家Jim Fan第一時間發(fā)表評論稱，OpenAI的目標本來是開發(fā)真正開源、具有前沿性的AI模型，但現(xiàn)在這一目標卻被一家非美國企業(yè)達成，最戲劇性的結果可能已經出現(xiàn)。在X平臺上，他的評論目前已經被閱讀106萬次。

OpenAI o1的每百萬tokens輸入成本約為15美元，每百萬tokens輸出成本為60美元，DeepSeek Reasoner（基于R1模型）分別只有0.55美元和2.19美元。

Arstechnica：在硬件上進行本地處理將會實現(xiàn)

R1模型與其它大語言模型有著不同的運行機制，用到了所謂的“Inference-time reasoning approach”，也就是在模型推理階段進行邏輯推理，這種推理方式和人類極為相似，又叫“模擬推理”（SR）。雖然SR推理給出回應時會慢一點，多耗費一點時間，但面對數(shù)學、物理、科學任務時結果更好。

不只是DeepSeek，中國的阿里巴巴、Kimi也都發(fā)布可以媲美o1的模型。

喬治梅森大學（George Mason University）AI研究人員Dean Ball說：“DeepSeek的小模型（distilled model，也就是R1的小號版本）性能讓人驚嘆，未來將會出現(xiàn)一大批推理能力不錯的模型，它們可以在本地硬件上完成處理?！?

forexlive網(wǎng)站：相當于30美元的iPhone問世

回想2017年時蘋果推出iPhone X，售價999美元，手機狂賣，讓蘋果生態(tài)系統(tǒng)迅猛擴張。我們假設一下，如果有一家公司，它推出一款手機和一個手機平臺，各方面更強，但價格只有30美元，會怎樣？

沒錯，今天的AI世界正在發(fā)生這種戲劇性的變化。中國DeepSeek開源模型的性能居然追上了o1，但成本卻低很多。不只如此，你還可以下載，免費使用。

無論是規(guī)模還是效率，R1取得了巨大進步，它改變了我們預期。我們曾經認為AI革命需要大量算力和電力，現(xiàn)在看來并非如此。就在新模型發(fā)布前幾小時，特朗普剛剛宣布要投資1000億美元在美國建設數(shù)據(jù)中心，同時還宣布與三家科技巨頭開展5000億美元AI項目.

DeepSeek告訴我們，在訓練基本模型時有完全不同的可行方法，它們的效果同樣好，但成本低無數(shù)倍。R1的到來可以讓更多應用程序落地，之前這些程序因為成本過高不能推向市場，未來AI會在實體經濟中有更大規(guī)模的應用。（小刀）