OpenAI開源兩款gpt-oss系列推理大模型 能力接近o3和o4-mini
8月6日消息,OpenAI近期發(fā)布了開源模型系列gpt-oss,此次發(fā)布包括兩款開源模型——gpt-oss-120b和gpt-oss-20b,是針對不同應用需求特化的高效AI模型。
gpt-oss系列特點
gpt-oss-120b:適用于大規(guī)模、高性能推理任務,包含1170億個參數(shù),且有5.1億個活躍參數(shù),專為單個H100 GPU優(yōu)化。
gpt-oss-20b:專為低延遲和本地化應用設計,包含210億個參數(shù),活躍參數(shù)為3.6億,適合在資源有限的環(huán)境下運行。
這兩個模型都能為開發(fā)者提供完整的推理鏈條,并允許開發(fā)者對模型的推理過程進行監(jiān)控和調(diào)試,提升了輸出結果的可靠性和可解釋性。更重要的是,gpt-oss系列支持強大的代理功能,能夠執(zhí)行功能調(diào)用、網(wǎng)頁瀏覽和Python代碼等操作,使其在復雜應用中表現(xiàn)出色。
推理能力與優(yōu)化
gpt-oss系列不僅在標準任務中表現(xiàn)出色,其推理能力的優(yōu)化也讓它在多個實際應用中成為首選。兩個模型的參數(shù)調(diào)整可以根據(jù)具體需求靈活設置,支持低、中、高三種推理力度,滿足不同延遲需求的應用場景。開發(fā)者還可以根據(jù)具體需求,進行模型微調(diào),以進一步優(yōu)化其在特定任務中的表現(xiàn)。
模型對比:
在多個標準化測試中,gpt-oss系列的表現(xiàn)相當突出,尤其是在MMLU、GPQA、以及競賽數(shù)學等領域。以下是gpt-oss-120b和gpt-oss-20b與gpt-o3和o4-mini的對比數(shù)據(jù):
OpenAI的gpt-oss系列模型憑借其強大的推理能力和廣泛的應用場景,成為了開發(fā)者手中的有力工具。其開源特性、強大的定制能力和優(yōu)化的推理性能,使其在AI開發(fā)和應用中具有巨大的潛力。隨著AI技術的不斷發(fā)展,gpt-oss系列無疑為更多的開發(fā)者提供了探索、創(chuàng)新和實現(xiàn)突破的可能。