Qwen3發(fā)布并開(kāi)源,海光DCU實(shí)現(xiàn)全模型無(wú)縫適配
2025年4月29日,阿里巴巴云旗下的Qwen團(tuán)隊(duì)正式發(fā)布并開(kāi)源Qwen3,作為Qwen系列的最新一代大型語(yǔ)言模型(LLM),包含一系列密集型(Dense)和混合專(zhuān)家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡(jiǎn)稱(chēng)“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對(duì)Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無(wú)縫適配與優(yōu)化,實(shí)現(xiàn)零錯(cuò)誤、零兼容性問(wèn)題、秒級(jí)部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢(shì)和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗(yàn)證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢(shì),使其成為支撐AI大模型訓(xùn)練與推理的關(guān)鍵基礎(chǔ)設(shè)施。
Qwen3:開(kāi)源大型語(yǔ)言模型的新里程碑
Qwen3是阿里巴巴云Qwen系列的最新成果,旨在通過(guò)多樣化的模型架構(gòu)滿(mǎn)足廣泛的AI應(yīng)用需求。其模型包括密集型模型,參數(shù)規(guī)模涵蓋0.6億、1.7億、4億、8億、14億、32億,適用于從邊緣設(shè)備到數(shù)據(jù)中心的多種部署場(chǎng)景;以及混合專(zhuān)家(MoE)模型,包括Qwen3-30B(總參數(shù)300億,推理時(shí)激活部分參數(shù))和Qwen3-235B(總參數(shù)2350億,推理時(shí)激活部分參數(shù)),通過(guò)選擇性激活專(zhuān)家網(wǎng)絡(luò)降低計(jì)算成本,同時(shí)保持高性能。Qwen3以Apache 2.0許可開(kāi)源,模型權(quán)重通過(guò)Hugging Face、GitHub及阿里云ModelScope等平臺(tái)公開(kāi),供全球開(kāi)發(fā)者與研究人員免費(fèi)使用。這種開(kāi)源策略促進(jìn)了技術(shù)創(chuàng)新與協(xié)作,使Qwen3可廣泛應(yīng)用于金融、醫(yī)療、教育、電信等行業(yè)。
Qwen3的密集型與MoE模型組合體現(xiàn)了其在性能與效率上的平衡。密集型模型適合需要全面參數(shù)參與的復(fù)雜任務(wù),如高級(jí)自然語(yǔ)言處理或多模態(tài)應(yīng)用;MoE模型通過(guò)稀疏計(jì)算降低資源需求,適合計(jì)算資源受限的場(chǎng)景。參數(shù)規(guī)模從0.6億到2350億的設(shè)計(jì),使Qwen3能夠覆蓋從輕量級(jí)應(yīng)用到企業(yè)級(jí)數(shù)據(jù)中心的高性能需求。作為開(kāi)源模型,Qwen3延續(xù)了Qwen系列推動(dòng)AI民主化的使命,開(kāi)發(fā)者可基于其開(kāi)發(fā)定制化解決方案,特別是在中國(guó)信息技術(shù)應(yīng)用創(chuàng)新(信創(chuàng))政策支持的行業(yè)中,Qwen3有望成為關(guān)鍵的AI技術(shù)驅(qū)動(dòng)力。
海光DCU:“智能深算”戰(zhàn)略的核心支柱
海光信息的“智能深算”戰(zhàn)略以DCU為核心,聚焦高性能計(jì)算(HPC)與人工智能算力的自主研發(fā),旨在滿(mǎn)足中國(guó)對(duì)安全高效、自主可控算力的需求。該戰(zhàn)略順應(yīng)信創(chuàng)政策與AI市場(chǎng)快速增長(zhǎng)的趨勢(shì),推動(dòng)國(guó)產(chǎn)芯片在通用計(jì)算與智能計(jì)算領(lǐng)域的應(yīng)用。DCU定位于A(yíng)I、大數(shù)據(jù)處理及商業(yè)計(jì)算場(chǎng)景的協(xié)處理器,類(lèi)似英偉達(dá)GPU,但更注重成本效益與本土化適配。海光信息自2016年通過(guò)與AMD的技術(shù)授權(quán)合作,獲得x86架構(gòu)許可,開(kāi)發(fā)了通用處理器(CPU)與DCU。2019年被列入美國(guó)“實(shí)體清單”后,AMD停止技術(shù)支持,海光加速自主研發(fā),DCU成為其核心競(jìng)爭(zhēng)力。目前,DCU已廣泛應(yīng)用于金融、電信、互聯(lián)網(wǎng)、教育、醫(yī)療、政務(wù)等領(lǐng)域,成為國(guó)產(chǎn)AI算力的重要支撐。
DCU在Qwen3適配中展現(xiàn)了卓越的技術(shù)能力。其采用通用圖形處理單元(GPGPU)架構(gòu),支持高并行計(jì)算,適合AI模型訓(xùn)練與推理,類(lèi)CUDA并行計(jì)算框架兼容主流AI軟件生態(tài),確保與Qwen3等模型的無(wú)縫整合。海光的深算工具包(DTK)是一套完整的軟件開(kāi)發(fā)套件,包括開(kāi)發(fā)工具、庫(kù)和優(yōu)化框架,支持模型遷移、性能優(yōu)化與快速部署,助力DCU實(shí)現(xiàn)Qwen3全系列模型的秒級(jí)部署,無(wú)任何錯(cuò)誤或兼容性問(wèn)題。DCU支持從0.6億到2350億參數(shù)的Qwen3模型,展現(xiàn)了其適應(yīng)多樣化計(jì)算需求的靈活性,覆蓋邊緣計(jì)算到數(shù)據(jù)中心的高性能場(chǎng)景。其兼容全球AI框架及國(guó)產(chǎn)大模型,降低開(kāi)發(fā)者遷移成本,同時(shí)內(nèi)置安全硬件,支持國(guó)密算法(如SM2、SM3)與可信計(jì)算,滿(mǎn)足中國(guó)對(duì)信息安全與技術(shù)自主的高要求。
DCU通過(guò)支持Qwen3的訓(xùn)練與推理,確立了其作為AI大模型關(guān)鍵基礎(chǔ)設(shè)施的地位。相較于進(jìn)口GPU,DCU提供自主可控的算力解決方案,滿(mǎn)足金融、政務(wù)等行業(yè)對(duì)安全與效率的需求。其在信創(chuàng)市場(chǎng)中的應(yīng)用進(jìn)一步鞏固了其作為國(guó)產(chǎn)算力核心的地位。
Qwen3與DCU的協(xié)同效應(yīng)
海光信息在Qwen3發(fā)布當(dāng)天宣布完成全部8款模型的適配與優(yōu)化,實(shí)現(xiàn)了零錯(cuò)誤、零兼容性問(wèn)題、秒級(jí)部署,這一技術(shù)突破彰顯了DCU在高性能計(jì)算與AI應(yīng)用中的強(qiáng)大能力。DCU的GPGPU架構(gòu)為Qwen3的密集型與MoE模型提供了高效的并行計(jì)算支持,能夠處理從0.6億到2350億參數(shù)的多樣化計(jì)算需求,確保推理任務(wù)的穩(wěn)定性和高吞吐量。海光的DTK軟件棧在這一過(guò)程中發(fā)揮了關(guān)鍵作用,其包含的開(kāi)發(fā)工具和優(yōu)化框架支持快速模型遷移與性能調(diào)優(yōu),使Qwen3能夠在DCU上以秒級(jí)速度完成部署,且運(yùn)行過(guò)程中無(wú)任何兼容性問(wèn)題。這種高效適配能力源于DCU類(lèi)CUDA生態(tài)的兼容性設(shè)計(jì),使其能夠無(wú)縫支持主流AI框架,同時(shí)適配國(guó)產(chǎn)大模型的獨(dú)特需求。DCU對(duì)Qwen3全系列模型的支持,體現(xiàn)了其在處理輕量級(jí)邊緣計(jì)算任務(wù)到高強(qiáng)度數(shù)據(jù)中心推理任務(wù)時(shí)的通用性,進(jìn)一步驗(yàn)證了其作為國(guó)產(chǎn)AI算力基礎(chǔ)設(shè)施的技術(shù)成熟度。
Qwen3與DCU的成功整合對(duì)中國(guó)AI生態(tài)具有深遠(yuǎn)的戰(zhàn)略意義。首先,這一整合推動(dòng)了信創(chuàng)政策目標(biāo)的實(shí)現(xiàn),Qwen3作為開(kāi)源的國(guó)產(chǎn)大模型,與DCU這一自主研發(fā)的協(xié)處理器結(jié)合,顯著降低了國(guó)內(nèi)AI產(chǎn)業(yè)對(duì)國(guó)外技術(shù)的依賴(lài),增強(qiáng)了技術(shù)自主性和信息安全性,特別是在金融、政務(wù)等敏感領(lǐng)域。其次,Qwen3的開(kāi)源特性與DCU的生態(tài)兼容性共同促進(jìn)了國(guó)產(chǎn)AI生態(tài)的建設(shè),Qwen3通過(guò)Hugging Face等全球平臺(tái)吸引開(kāi)發(fā)者,而DCU的DTK工具鏈為開(kāi)發(fā)者提供高效的本地化開(kāi)發(fā)支持,降低了技術(shù)遷移門(mén)檻,助力構(gòu)建從算法到算力的完整產(chǎn)業(yè)鏈。此外,Qwen3+DCU的解決方案為信創(chuàng)重點(diǎn)行業(yè)提供了安全高效的AI能力,例如在金融領(lǐng)域支持智能客服系統(tǒng),在政務(wù)領(lǐng)域助力數(shù)據(jù)分析與決策支持,滿(mǎn)足行業(yè)對(duì)自主可控技術(shù)的高要求。雖然具體成本數(shù)據(jù)未披露,DCU的國(guó)產(chǎn)化生產(chǎn)與Qwen3的開(kāi)源模式相較于進(jìn)口GPU與閉源模型的組合,預(yù)計(jì)具有顯著的成本優(yōu)勢(shì),使更多企業(yè)能夠采用國(guó)產(chǎn)AI技術(shù),從而推動(dòng)技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級(jí)。
中國(guó)信創(chuàng)政策旨在推動(dòng)國(guó)產(chǎn)IT解決方案的研發(fā)與應(yīng)用,構(gòu)建安全自主的技術(shù)體系。Qwen3與DCU的整合是信創(chuàng)政策的具體體現(xiàn),通過(guò)國(guó)產(chǎn)大模型與芯片的結(jié)合,打造從算法到算力的完整AI技術(shù)棧,降低對(duì)國(guó)外技術(shù)的依賴(lài)。
DCU在國(guó)內(nèi)與寒武紀(jì)、華為昇騰等AI芯片競(jìng)爭(zhēng),國(guó)際上則面對(duì)英偉達(dá)、AMD等巨頭。Qwen3則與DeepSeek、百度文心一言及國(guó)際模型如Llama競(jìng)爭(zhēng)。Qwen3+DCU的開(kāi)源與國(guó)產(chǎn)化優(yōu)勢(shì),使其在信創(chuàng)市場(chǎng)中具備獨(dú)特競(jìng)爭(zhēng)力。
雖然主要服務(wù)國(guó)內(nèi)需求,Qwen3的開(kāi)源特性使其可吸引國(guó)際開(kāi)發(fā)者,DCU的性?xún)r(jià)比優(yōu)勢(shì)也可能在發(fā)展中國(guó)家市場(chǎng)獲得機(jī)會(huì)。這種內(nèi)外兼顧的潛力提升了中國(guó)AI技術(shù)的全球影響力。
結(jié)語(yǔ)
2025年4月29日Qwen3的發(fā)布及其與海光DCU的快速適配,標(biāo)志著中國(guó)AI算力與算法生態(tài)的重大進(jìn)展。Qwen3通過(guò)密集型與MoE模型滿(mǎn)足多樣化需求,其開(kāi)源策略推動(dòng)技術(shù)普及;海光DCU憑借GPGPU架構(gòu)、DTK軟件棧及自主可控特性,成為AI大模型訓(xùn)練與推理的關(guān)鍵支撐。在“智能深算”戰(zhàn)略引領(lǐng)下,Qwen3與DCU的協(xié)同效應(yīng)推動(dòng)了信創(chuàng)目標(biāo)的實(shí)現(xiàn),加速了國(guó)產(chǎn)AI生態(tài)的成熟。未來(lái),這一組合有望在金融、政務(wù)等行業(yè)深化應(yīng)用,為中國(guó)AI產(chǎn)業(yè)的自主可控與全球競(jìng)爭(zhēng)力注入新動(dòng)能。