阿里通義千問發(fā)布小尺寸模型Qwen3-4B:超越GPT4.1-Nano
8月7日消息,今日,阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。
目前新模型已在魔搭社區(qū)、HuggingFace正式開源。
據(jù)介紹,在非推理領(lǐng)域,Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano。
在推理領(lǐng)域,Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。
官方表示,2507版本的Qwen3-4B模型對手機等端側(cè)硬件部署尤為友好。
以下為模型核心亮點
Qwen3-4B-Instruct-2507
通用能力均大幅提升,超越商業(yè)閉源的小尺寸模型GPT-4.1-nano,與中等規(guī)模的Qwen3-30B-A3B(non-thinking)性能接近。
新模型覆蓋更多語言的長尾知識,在主觀和開放性任務(wù)中增強了人類偏好對齊,可提供更符合人們需求的答復(fù)。
上下文理解擴展至256K,小模型也能處理長文本。
Qwen3-4B-Thinking-2507
推理能力大幅增強,AIME25高達81.3分,Qwen3-4B-Thinking-2507的推理表現(xiàn)可媲美中等模型Qwen3-30B-Thinking。
特別是在聚焦數(shù)學(xué)能力的AIME25測評中,以4B參數(shù)量斬獲81.3分成績。
Agent分數(shù)爆表,相關(guān)評測均超越更大尺寸的Qwen3-30B-Thinking模型。
256K tokens上下文的理解能力,支持更復(fù)雜的文檔分析、長篇內(nèi)容生成、跨段落推理等場景。