阿里通義千問發(fā)布小尺寸模型Qwen3-4B：超越GPT4.1-Nano

時(shí)間：2025-08-07 11:05:39

關(guān)鍵字：阿里通義大模型

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]8月7日消息，今日，阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

8月7日消息，今日，阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社區(qū)、HuggingFace正式開源。

據(jù)介紹，在非推理領(lǐng)域，Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano。

在推理領(lǐng)域，Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。

官方表示，2507版本的Qwen3-4B模型對(duì)手機(jī)等端側(cè)硬件部署尤為友好。

以下為模型核心亮點(diǎn)

Qwen3-4B-Instruct-2507

通用能力均大幅提升，超越商業(yè)閉源的小尺寸模型GPT-4.1-nano，與中等規(guī)模的Qwen3-30B-A3B(non-thinking)性能接近。

新模型覆蓋更多語(yǔ)言的長(zhǎng)尾知識(shí)，在主觀和開放性任務(wù)中增強(qiáng)了人類偏好對(duì)齊，可提供更符合人們需求的答復(fù)。

上下文理解擴(kuò)展至256K，小模型也能處理長(zhǎng)文本。

Qwen3-4B-Thinking-2507

推理能力大幅增強(qiáng)，AIME25高達(dá)81.3分，Qwen3-4B-Thinking-2507的推理表現(xiàn)可媲美中等模型Qwen3-30B-Thinking。

特別是在聚焦數(shù)學(xué)能力的AIME25測(cè)評(píng)中，以4B參數(shù)量斬獲81.3分成績(jī)。

Agent分?jǐn)?shù)爆表，相關(guān)評(píng)測(cè)均超越更大尺寸的Qwen3-30B-Thinking模型。

256K tokens上下文的理解能力，支持更復(fù)雜的文檔分析、長(zhǎng)篇內(nèi)容生成、跨段落推理等場(chǎng)景。

www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站