2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢,使其成為支撐AI大模型訓練與推理的關(guān)鍵基礎(chǔ)設(shè)施。
近日,海光信息技術(shù)團隊成功完成DeepSeek-Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。這是海光團隊近期完成適配優(yōu)化的第三款DeepSeek大模型,充分展現(xiàn)了DCU強大的生態(tài)優(yōu)勢與技術(shù)能力。因DCU采用了GPGPU通用加速計算架構(gòu),DeepSeek模型可直接在DCU上運行,并不需要大量適配工作,技術(shù)團隊的主要工作是進行精度驗證和持續(xù)的性能優(yōu)化。