Qwen3發(fā)布并開源，海光DCU實現(xiàn)全模型無縫適配

時間：2025-04-29 16:37:29

關(guān)鍵字： Qwen3、海光 DCU 大模型 LLM

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]2025年4月29日，阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3，作為Qwen系列的最新一代大型語言模型（LLM），包含一系列密集型（Dense）和混合專家（MoE）模型，參數(shù)規(guī)模從0.6億至2350億不等。同日，海光信息技術(shù)股份有限公司（以下簡稱“海光信息”）在其“智能深算”戰(zhàn)略引領(lǐng)下，宣布其深算單元（DCU，Deep Computing Unit）已完成對Qwen3全部8款模型（235B、32B、30B、14B、8B、4B、1.7B、0.6B）的無縫適配與優(yōu)化，實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性，展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性，充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢，使其成為支撐AI大模型訓練與推理的關(guān)鍵基礎(chǔ)設(shè)施。

2025年4月29日，阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3，作為Qwen系列的最新一代大型語言模型（LLM），包含一系列密集型（Dense）和混合專家（MoE）模型，參數(shù)規(guī)模從0.6億至2350億不等。同日，海光信息技術(shù)股份有限公司（以下簡稱“海光信息”）在其“智能深算”戰(zhàn)略引領(lǐng)下，宣布其深算單元（DCU，Deep Computing Unit）已完成對Qwen3全部8款模型（235B、32B、30B、14B、8B、4B、1.7B、0.6B）的無縫適配與優(yōu)化，實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性，展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性，充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢，使其成為支撐AI大模型訓練與推理的關(guān)鍵基礎(chǔ)設(shè)施。

Qwen3：開源大型語言模型的新里程碑

Qwen3是阿里巴巴云Qwen系列的最新成果，旨在通過多樣化的模型架構(gòu)滿足廣泛的AI應(yīng)用需求。其模型包括密集型模型，參數(shù)規(guī)模涵蓋0.6億、1.7億、4億、8億、14億、32億，適用于從邊緣設(shè)備到數(shù)據(jù)中心的多種部署場景；以及混合專家（MoE）模型，包括Qwen3-30B（總參數(shù)300億，推理時激活部分參數(shù)）和Qwen3-235B（總參數(shù)2350億，推理時激活部分參數(shù)），通過選擇性激活專家網(wǎng)絡(luò)降低計算成本，同時保持高性能。Qwen3以Apache 2.0許可開源，模型權(quán)重通過Hugging Face、GitHub及阿里云ModelScope等平臺公開，供全球開發(fā)者與研究人員免費使用。這種開源策略促進了技術(shù)創(chuàng)新與協(xié)作，使Qwen3可廣泛應(yīng)用于金融、醫(yī)療、教育、電信等行業(yè)。

Qwen3的密集型與MoE模型組合體現(xiàn)了其在性能與效率上的平衡。密集型模型適合需要全面參數(shù)參與的復雜任務(wù)，如高級自然語言處理或多模態(tài)應(yīng)用；MoE模型通過稀疏計算降低資源需求，適合計算資源受限的場景。參數(shù)規(guī)模從0.6億到2350億的設(shè)計，使Qwen3能夠覆蓋從輕量級應(yīng)用到企業(yè)級數(shù)據(jù)中心的高性能需求。作為開源模型，Qwen3延續(xù)了Qwen系列推動AI民主化的使命，開發(fā)者可基于其開發(fā)定制化解決方案，特別是在中國信息技術(shù)應(yīng)用創(chuàng)新（信創(chuàng)）政策支持的行業(yè)中，Qwen3有望成為關(guān)鍵的AI技術(shù)驅(qū)動力。

海光DCU：“智能深算”戰(zhàn)略的核心支柱

海光信息的“智能深算”戰(zhàn)略以DCU為核心，聚焦高性能計算（HPC）與人工智能算力的自主研發(fā)，旨在滿足中國對安全高效、自主可控算力的需求。該戰(zhàn)略順應(yīng)信創(chuàng)政策與AI市場快速增長的趨勢，推動國產(chǎn)芯片在通用計算與智能計算領(lǐng)域的應(yīng)用。DCU定位于AI、大數(shù)據(jù)處理及商業(yè)計算場景的協(xié)處理器，類似英偉達GPU，但更注重成本效益與本土化適配。海光信息自2016年通過與AMD的技術(shù)授權(quán)合作，獲得x86架構(gòu)許可，開發(fā)了通用處理器（CPU）與DCU。2019年被列入美國“實體清單”后，AMD停止技術(shù)支持，海光加速自主研發(fā)，DCU成為其核心競爭力。目前，DCU已廣泛應(yīng)用于金融、電信、互聯(lián)網(wǎng)、教育、醫(yī)療、政務(wù)等領(lǐng)域，成為國產(chǎn)AI算力的重要支撐。

DCU在Qwen3適配中展現(xiàn)了卓越的技術(shù)能力。其采用通用圖形處理單元（GPGPU）架構(gòu)，支持高并行計算，適合AI模型訓練與推理，類CUDA并行計算框架兼容主流AI軟件生態(tài)，確保與Qwen3等模型的無縫整合。海光的深算工具包（DTK）是一套完整的軟件開發(fā)套件，包括開發(fā)工具、庫和優(yōu)化框架，支持模型遷移、性能優(yōu)化與快速部署，助力DCU實現(xiàn)Qwen3全系列模型的秒級部署，無任何錯誤或兼容性問題。DCU支持從0.6億到2350億參數(shù)的Qwen3模型，展現(xiàn)了其適應(yīng)多樣化計算需求的靈活性，覆蓋邊緣計算到數(shù)據(jù)中心的高性能場景。其兼容全球AI框架及國產(chǎn)大模型，降低開發(fā)者遷移成本，同時內(nèi)置安全硬件，支持國密算法（如SM2、SM3）與可信計算，滿足中國對信息安全與技術(shù)自主的高要求。

DCU通過支持Qwen3的訓練與推理，確立了其作為AI大模型關(guān)鍵基礎(chǔ)設(shè)施的地位。相較于進口GPU，DCU提供自主可控的算力解決方案，滿足金融、政務(wù)等行業(yè)對安全與效率的需求。其在信創(chuàng)市場中的應(yīng)用進一步鞏固了其作為國產(chǎn)算力核心的地位。

Qwen3與DCU的協(xié)同效應(yīng)

海光信息在Qwen3發(fā)布當天宣布完成全部8款模型的適配與優(yōu)化，實現(xiàn)了零錯誤、零兼容性問題、秒級部署，這一技術(shù)突破彰顯了DCU在高性能計算與AI應(yīng)用中的強大能力。DCU的GPGPU架構(gòu)為Qwen3的密集型與MoE模型提供了高效的并行計算支持，能夠處理從0.6億到2350億參數(shù)的多樣化計算需求，確保推理任務(wù)的穩(wěn)定性和高吞吐量。海光的DTK軟件棧在這一過程中發(fā)揮了關(guān)鍵作用，其包含的開發(fā)工具和優(yōu)化框架支持快速模型遷移與性能調(diào)優(yōu)，使Qwen3能夠在DCU上以秒級速度完成部署，且運行過程中無任何兼容性問題。這種高效適配能力源于DCU類CUDA生態(tài)的兼容性設(shè)計，使其能夠無縫支持主流AI框架，同時適配國產(chǎn)大模型的獨特需求。DCU對Qwen3全系列模型的支持，體現(xiàn)了其在處理輕量級邊緣計算任務(wù)到高強度數(shù)據(jù)中心推理任務(wù)時的通用性，進一步驗證了其作為國產(chǎn)AI算力基礎(chǔ)設(shè)施的技術(shù)成熟度。

Qwen3與DCU的成功整合對中國AI生態(tài)具有深遠的戰(zhàn)略意義。首先，這一整合推動了信創(chuàng)政策目標的實現(xiàn)，Qwen3作為開源的國產(chǎn)大模型，與DCU這一自主研發(fā)的協(xié)處理器結(jié)合，顯著降低了國內(nèi)AI產(chǎn)業(yè)對國外技術(shù)的依賴，增強了技術(shù)自主性和信息安全性，特別是在金融、政務(wù)等敏感領(lǐng)域。其次，Qwen3的開源特性與DCU的生態(tài)兼容性共同促進了國產(chǎn)AI生態(tài)的建設(shè)，Qwen3通過Hugging Face等全球平臺吸引開發(fā)者，而DCU的DTK工具鏈為開發(fā)者提供高效的本地化開發(fā)支持，降低了技術(shù)遷移門檻，助力構(gòu)建從算法到算力的完整產(chǎn)業(yè)鏈。此外，Qwen3+DCU的解決方案為信創(chuàng)重點行業(yè)提供了安全高效的AI能力，例如在金融領(lǐng)域支持智能客服系統(tǒng)，在政務(wù)領(lǐng)域助力數(shù)據(jù)分析與決策支持，滿足行業(yè)對自主可控技術(shù)的高要求。雖然具體成本數(shù)據(jù)未披露，DCU的國產(chǎn)化生產(chǎn)與Qwen3的開源模式相較于進口GPU與閉源模型的組合，預計具有顯著的成本優(yōu)勢，使更多企業(yè)能夠采用國產(chǎn)AI技術(shù)，從而推動技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級。

中國信創(chuàng)政策旨在推動國產(chǎn)IT解決方案的研發(fā)與應(yīng)用，構(gòu)建安全自主的技術(shù)體系。Qwen3與DCU的整合是信創(chuàng)政策的具體體現(xiàn)，通過國產(chǎn)大模型與芯片的結(jié)合，打造從算法到算力的完整AI技術(shù)棧，降低對國外技術(shù)的依賴。

DCU在國內(nèi)與寒武紀、華為昇騰等AI芯片競爭，國際上則面對英偉達、AMD等巨頭。Qwen3則與DeepSeek、百度文心一言及國際模型如Llama競爭。Qwen3+DCU的開源與國產(chǎn)化優(yōu)勢，使其在信創(chuàng)市場中具備獨特競爭力。

雖然主要服務(wù)國內(nèi)需求，Qwen3的開源特性使其可吸引國際開發(fā)者，DCU的性價比優(yōu)勢也可能在發(fā)展中國家市場獲得機會。這種內(nèi)外兼顧的潛力提升了中國AI技術(shù)的全球影響力。

結(jié)語

2025年4月29日Qwen3的發(fā)布及其與海光DCU的快速適配，標志著中國AI算力與算法生態(tài)的重大進展。Qwen3通過密集型與MoE模型滿足多樣化需求，其開源策略推動技術(shù)普及；海光DCU憑借GPGPU架構(gòu)、DTK軟件棧及自主可控特性，成為AI大模型訓練與推理的關(guān)鍵支撐。在“智能深算”戰(zhàn)略引領(lǐng)下，Qwen3與DCU的協(xié)同效應(yīng)推動了信創(chuàng)目標的實現(xiàn)，加速了國產(chǎn)AI生態(tài)的成熟。未來，這一組合有望在金融、政務(wù)等行業(yè)深化應(yīng)用，為中國AI產(chǎn)業(yè)的自主可控與全球競爭力注入新動能。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

MCP：在傳統(tǒng) API 之外重塑 AI 開發(fā)

在人工智能飛速發(fā)展的當下，大模型展現(xiàn)出了強大的語言理解與生成能力。然而，要讓這些模型真正在實際場景中發(fā)揮作用，與外部豐富的工具及數(shù)據(jù)源順暢交互至關(guān)重要。在此背景下，Model Context Protocol(MCP)，...

關(guān)鍵字：人工智能大模型協(xié)議

[通信先鋒]

阿里通義千問發(fā)布小尺寸模型Qwen3-4B：超越GPT4.1-Nano

8月7日消息，今日，阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

關(guān)鍵字：阿里通義大模型

[通信先鋒]

我國發(fā)布新型圖像復原大模型 1.7秒讓老照片修復出8K超高清畫質(zhì)

7月30日消息，日前，中國科學院深圳先進技術(shù)研究院發(fā)布了一項名為HYPIR的圖像復原大模型。

關(guān)鍵字：大模型 AI

[Arm]

WAIC 直擊｜Arm 鄒挺：突破基礎(chǔ)設(shè)施、數(shù)據(jù)安全與人才三重挑戰(zhàn)，釋放 AI 發(fā)展新潛能

在 2025 世界人工智能大會 (WAIC) 期間，Arm 舉辦了以“AI 無處不在：從云到邊盡在 Arm” 為主題的技術(shù)論壇。該論壇匯聚了 Arm 技術(shù)專家及支付寶、聯(lián)想等合作伙伴代表，共同分享人工智能 (AI) 行...

關(guān)鍵字： AI 機器人大模型

[電子設(shè)計自動化]

大模型賦能的DFT自動化：測試向量生成與故障覆蓋率提升策略

隨著芯片規(guī)模突破百億晶體管，傳統(tǒng)可測試性設(shè)計（DFT）方法面臨測試向量生成效率低、故障覆蓋率瓶頸等挑戰(zhàn)。本文提出一種基于大語言模型（LLM）的DFT自動化框架，通過自然語言指令驅(qū)動測試向量生成，并結(jié)合強化學習優(yōu)化故障覆蓋...

關(guān)鍵字：大模型 DFT自動化

[亞馬遜云科技]

亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松：我們正處在Agentic AI爆發(fā)的前夜

在亞馬遜云科技中國峰會上，亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松表示，過去一年，機器智能已經(jīng)爆發(fā)了，如今AI的發(fā)展又來到了一個拐點，我們正處在Agentic AI 爆發(fā)的前夜。

關(guān)鍵字：機器智能 AI 大模型

[通信先鋒]

蘋果炮轟AI推理模型：全是假思考！所謂思考只是一種假象

6月8日消息，蘋果近日發(fā)表了一篇研究論文，稱推理模型全都沒真正思考，無論DeepSeek、o3-mini還是Claude 3.7都只是另一種形式的“模式匹配”，所謂思考只是一種假象。

關(guān)鍵字： AI 蘋果大模型

[嵌入式分享]

嵌入式端側(cè)大模型部署：Llama 2 - 7B在瑞薩RZ/V2L上的INT4量化與NPU加速實踐

隨著人工智能技術(shù)在各領(lǐng)域的廣泛應(yīng)用，將大型語言模型（LLM）部署到嵌入式端側(cè)設(shè)備成為重要趨勢。Llama 2 - 7B作為一款性能優(yōu)異的大語言模型，具有廣泛的應(yīng)用前景。然而，其龐大的參數(shù)量對嵌入式設(shè)備的計算資源和存儲能力...

關(guān)鍵字：嵌入式端側(cè) 大模型 Llama 2 - 7B 瑞薩RZ/V2L

[極客網(wǎng)]

模型越新幻覺越重！AI幻覺扣住產(chǎn)業(yè)發(fā)展命脈

自誕生以來，人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”，指的是大語言模型會將虛構(gòu)信息當作真實事實輸出。

關(guān)鍵字：人工智能大模型 AI

[OPPO]

OPPO擔任人工智能終端工作組副組長單位

2025年4月25日，中國，北京——人工智能終端產(chǎn)業(yè)發(fā)展研討會暨人工智能終端工作組第一次全體大會召開，工業(yè)和信息化部副部長熊繼軍出席會議并致辭，工業(yè)和信息化部電子司和科技司、國家發(fā)展和改革委員會、商務(wù)部、北京市朝陽區(qū)有關(guān)...

關(guān)鍵字：人工智能大模型 AI手機