阿里Qwen3迎來(lái)驚喜升級(jí) 性能超DeepSeek-V3、Kimi-K2等開(kāi)源模型
7月22日消息,今日,Qwen3迎來(lái)驚喜升級(jí)。
目前,通義千問(wèn)已經(jīng)更新旗艦版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。
據(jù)悉,新的Qwen3模型,通用能力明顯提升,包括指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等方面。
在GQPA(知識(shí))、AIME25(數(shù)學(xué))、LiveCodeBench(編程)、Arena-Hard(人類偏好對(duì)齊)、BFCL(Agent能力)等眾多測(cè)評(píng)中表現(xiàn)出色。
超過(guò)Kimi-K2、DeepSeek-V3等頂級(jí)開(kāi)源模型以及Claude-Opus4-Non-thinking等領(lǐng)先閉源模型。
此外,本次更新的Qwen3模型,還增強(qiáng)了以下關(guān)鍵性能:
在多語(yǔ)言的長(zhǎng)尾知識(shí)覆蓋方面,模型取得顯著進(jìn)步。
在主觀及開(kāi)放性任務(wù)中,模型顯著增強(qiáng)了對(duì)用戶偏好的契合能力,能夠提供更有用的回復(fù),生成更高質(zhì)量的文本。
長(zhǎng)文本提升到256K,上下文理解能力進(jìn)一步增強(qiáng)。
目前,Qwen3新模型已在魔搭社區(qū)和HuggingFace上開(kāi)源更新。