上海MiniMax開源模型登上全球第二 創(chuàng)始人:第一次感覺到大山不是不能翻越
7月3日消息,據(jù)媒體報道,在官網(wǎng)和開源平臺GitHub上,上海國產(chǎn)AI獨角獸MiniMax拋出全球首個開源大規(guī)模混合架構(gòu)推理模型——MiniMax-M1。該模型在權(quán)威評測榜單已位列全球開源模型第二。
M1發(fā)布當(dāng)天,MiniMax創(chuàng)始人兼CEO閆俊杰在朋友圈寫下:第一次感覺到大山不是不能翻越。
M1一登場,即在權(quán)威評測榜單中位列全球開源模型第二,僅次于5月28日發(fā)布的DeepSeek-R1-0528。不過從細分項來看,M1在長文本處理、工具調(diào)用等方面形成碾壓級優(yōu)勢。
M1支持高達100萬token的上下文輸入能力,相當(dāng)于可以一次性處理整部《三體》英文原著,這一性能達到DeepSeek同類模型的8倍,甚至可與谷歌最新閉源模型Gemini2.5Pro相媲美。更令人矚目的是,在保持頂尖性能的同時,其強化學(xué)習(xí)階段僅投入53.5萬美元,遠低于行業(yè)常規(guī)的千萬級研發(fā)成本。
MiniMax展現(xiàn)出驚人的研發(fā)速度和產(chǎn)品化能力。在M1發(fā)布后的短短四個工作日內(nèi),公司連續(xù)推出視頻生成模型Hailuo 02、通用智能體MiniMax Agent、視頻創(chuàng)作智能體Hailuo Video Agent以及音色設(shè)計工具Voice Design等多款創(chuàng)新產(chǎn)品,保持著令人矚目的"日更"節(jié)奏。
這家扎根上海徐匯的AI企業(yè)始終保持著獨特的技術(shù)路線。早在2022年底ChatGPT引發(fā)全球關(guān)注之前,MiniMax就已布局通用人工智能(AGI)領(lǐng)域,并果斷放棄當(dāng)時主流的大模型稠密架構(gòu)和傳統(tǒng)注意力機制。在全球大模型研發(fā)企業(yè)普遍收縮的行業(yè)背景下,MiniMax逆勢堅持基礎(chǔ)模型研發(fā)的戰(zhàn)略選擇,最終換來了這次具有里程碑意義的技術(shù)突破。