www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 原創(chuàng) > 21ic編輯部
[導讀]2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢,使其成為支撐AI大模型訓練與推理的關(guān)鍵基礎(chǔ)設(shè)施。

2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢,使其成為支撐AI大模型訓練與推理的關(guān)鍵基礎(chǔ)設(shè)施。


Qwen3:開源大型語言模型的新里程碑

Qwen3是阿里巴巴云Qwen系列的最新成果,旨在通過多樣化的模型架構(gòu)滿足廣泛的AI應(yīng)用需求。其模型包括密集型模型,參數(shù)規(guī)模涵蓋0.6億、1.7億、4億、8億、14億、32億,適用于從邊緣設(shè)備到數(shù)據(jù)中心的多種部署場景;以及混合專家(MoE)模型,包括Qwen3-30B(總參數(shù)300億,推理時激活部分參數(shù))和Qwen3-235B(總參數(shù)2350億,推理時激活部分參數(shù)),通過選擇性激活專家網(wǎng)絡(luò)降低計算成本,同時保持高性能。Qwen3以Apache 2.0許可開源,模型權(quán)重通過Hugging Face、GitHub及阿里云ModelScope等平臺公開,供全球開發(fā)者與研究人員免費使用。這種開源策略促進了技術(shù)創(chuàng)新與協(xié)作,使Qwen3可廣泛應(yīng)用于金融、醫(yī)療、教育、電信等行業(yè)。

Qwen3的密集型與MoE模型組合體現(xiàn)了其在性能與效率上的平衡。密集型模型適合需要全面參數(shù)參與的復雜任務(wù),如高級自然語言處理或多模態(tài)應(yīng)用;MoE模型通過稀疏計算降低資源需求,適合計算資源受限的場景。參數(shù)規(guī)模從0.6億到2350億的設(shè)計,使Qwen3能夠覆蓋從輕量級應(yīng)用到企業(yè)級數(shù)據(jù)中心的高性能需求。作為開源模型,Qwen3延續(xù)了Qwen系列推動AI民主化的使命,開發(fā)者可基于其開發(fā)定制化解決方案,特別是在中國信息技術(shù)應(yīng)用創(chuàng)新(信創(chuàng))政策支持的行業(yè)中,Qwen3有望成為關(guān)鍵的AI技術(shù)驅(qū)動力。


海光DCU:“智能深算”戰(zhàn)略的核心支柱

海光信息的“智能深算”戰(zhàn)略以DCU為核心,聚焦高性能計算(HPC)與人工智能算力的自主研發(fā),旨在滿足中國對安全高效、自主可控算力的需求。該戰(zhàn)略順應(yīng)信創(chuàng)政策與AI市場快速增長的趨勢,推動國產(chǎn)芯片在通用計算與智能計算領(lǐng)域的應(yīng)用。DCU定位于AI、大數(shù)據(jù)處理及商業(yè)計算場景的協(xié)處理器,類似英偉達GPU,但更注重成本效益與本土化適配。海光信息自2016年通過與AMD的技術(shù)授權(quán)合作,獲得x86架構(gòu)許可,開發(fā)了通用處理器(CPU)與DCU。2019年被列入美國“實體清單”后,AMD停止技術(shù)支持,海光加速自主研發(fā),DCU成為其核心競爭力。目前,DCU已廣泛應(yīng)用于金融、電信、互聯(lián)網(wǎng)、教育、醫(yī)療、政務(wù)等領(lǐng)域,成為國產(chǎn)AI算力的重要支撐。

DCU在Qwen3適配中展現(xiàn)了卓越的技術(shù)能力。其采用通用圖形處理單元(GPGPU)架構(gòu),支持高并行計算,適合AI模型訓練與推理,類CUDA并行計算框架兼容主流AI軟件生態(tài),確保與Qwen3等模型的無縫整合。海光的深算工具包(DTK)是一套完整的軟件開發(fā)套件,包括開發(fā)工具、庫和優(yōu)化框架,支持模型遷移、性能優(yōu)化與快速部署,助力DCU實現(xiàn)Qwen3全系列模型的秒級部署,無任何錯誤或兼容性問題。DCU支持從0.6億到2350億參數(shù)的Qwen3模型,展現(xiàn)了其適應(yīng)多樣化計算需求的靈活性,覆蓋邊緣計算到數(shù)據(jù)中心的高性能場景。其兼容全球AI框架及國產(chǎn)大模型,降低開發(fā)者遷移成本,同時內(nèi)置安全硬件,支持國密算法(如SM2、SM3)與可信計算,滿足中國對信息安全與技術(shù)自主的高要求。

DCU通過支持Qwen3的訓練與推理,確立了其作為AI大模型關(guān)鍵基礎(chǔ)設(shè)施的地位。相較于進口GPU,DCU提供自主可控的算力解決方案,滿足金融、政務(wù)等行業(yè)對安全與效率的需求。其在信創(chuàng)市場中的應(yīng)用進一步鞏固了其作為國產(chǎn)算力核心的地位。


Qwen3與DCU的協(xié)同效應(yīng)

海光信息在Qwen3發(fā)布當天宣布完成全部8款模型的適配與優(yōu)化,實現(xiàn)了零錯誤、零兼容性問題、秒級部署,這一技術(shù)突破彰顯了DCU在高性能計算與AI應(yīng)用中的強大能力。DCU的GPGPU架構(gòu)為Qwen3的密集型與MoE模型提供了高效的并行計算支持,能夠處理從0.6億到2350億參數(shù)的多樣化計算需求,確保推理任務(wù)的穩(wěn)定性和高吞吐量。海光的DTK軟件棧在這一過程中發(fā)揮了關(guān)鍵作用,其包含的開發(fā)工具和優(yōu)化框架支持快速模型遷移與性能調(diào)優(yōu),使Qwen3能夠在DCU上以秒級速度完成部署,且運行過程中無任何兼容性問題。這種高效適配能力源于DCU類CUDA生態(tài)的兼容性設(shè)計,使其能夠無縫支持主流AI框架,同時適配國產(chǎn)大模型的獨特需求。DCU對Qwen3全系列模型的支持,體現(xiàn)了其在處理輕量級邊緣計算任務(wù)到高強度數(shù)據(jù)中心推理任務(wù)時的通用性,進一步驗證了其作為國產(chǎn)AI算力基礎(chǔ)設(shè)施的技術(shù)成熟度。

Qwen3與DCU的成功整合對中國AI生態(tài)具有深遠的戰(zhàn)略意義。首先,這一整合推動了信創(chuàng)政策目標的實現(xiàn),Qwen3作為開源的國產(chǎn)大模型,與DCU這一自主研發(fā)的協(xié)處理器結(jié)合,顯著降低了國內(nèi)AI產(chǎn)業(yè)對國外技術(shù)的依賴,增強了技術(shù)自主性和信息安全性,特別是在金融、政務(wù)等敏感領(lǐng)域。其次,Qwen3的開源特性與DCU的生態(tài)兼容性共同促進了國產(chǎn)AI生態(tài)的建設(shè),Qwen3通過Hugging Face等全球平臺吸引開發(fā)者,而DCU的DTK工具鏈為開發(fā)者提供高效的本地化開發(fā)支持,降低了技術(shù)遷移門檻,助力構(gòu)建從算法到算力的完整產(chǎn)業(yè)鏈。此外,Qwen3+DCU的解決方案為信創(chuàng)重點行業(yè)提供了安全高效的AI能力,例如在金融領(lǐng)域支持智能客服系統(tǒng),在政務(wù)領(lǐng)域助力數(shù)據(jù)分析與決策支持,滿足行業(yè)對自主可控技術(shù)的高要求。雖然具體成本數(shù)據(jù)未披露,DCU的國產(chǎn)化生產(chǎn)與Qwen3的開源模式相較于進口GPU與閉源模型的組合,預計具有顯著的成本優(yōu)勢,使更多企業(yè)能夠采用國產(chǎn)AI技術(shù),從而推動技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級。

中國信創(chuàng)政策旨在推動國產(chǎn)IT解決方案的研發(fā)與應(yīng)用,構(gòu)建安全自主的技術(shù)體系。Qwen3與DCU的整合是信創(chuàng)政策的具體體現(xiàn),通過國產(chǎn)大模型與芯片的結(jié)合,打造從算法到算力的完整AI技術(shù)棧,降低對國外技術(shù)的依賴。

DCU在國內(nèi)與寒武紀、華為昇騰等AI芯片競爭,國際上則面對英偉達、AMD等巨頭。Qwen3則與DeepSeek、百度文心一言及國際模型如Llama競爭。Qwen3+DCU的開源與國產(chǎn)化優(yōu)勢,使其在信創(chuàng)市場中具備獨特競爭力。

雖然主要服務(wù)國內(nèi)需求,Qwen3的開源特性使其可吸引國際開發(fā)者,DCU的性價比優(yōu)勢也可能在發(fā)展中國家市場獲得機會。這種內(nèi)外兼顧的潛力提升了中國AI技術(shù)的全球影響力。


結(jié)語

2025年4月29日Qwen3的發(fā)布及其與海光DCU的快速適配,標志著中國AI算力與算法生態(tài)的重大進展。Qwen3通過密集型與MoE模型滿足多樣化需求,其開源策略推動技術(shù)普及;海光DCU憑借GPGPU架構(gòu)、DTK軟件棧及自主可控特性,成為AI大模型訓練與推理的關(guān)鍵支撐。在“智能深算”戰(zhàn)略引領(lǐng)下,Qwen3與DCU的協(xié)同效應(yīng)推動了信創(chuàng)目標的實現(xiàn),加速了國產(chǎn)AI生態(tài)的成熟。未來,這一組合有望在金融、政務(wù)等行業(yè)深化應(yīng)用,為中國AI產(chǎn)業(yè)的自主可控與全球競爭力注入新動能。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在人工智能飛速發(fā)展的當下,大模型展現(xiàn)出了強大的語言理解與生成能力。然而,要讓這些模型真正在實際場景中發(fā)揮作用,與外部豐富的工具及數(shù)據(jù)源順暢交互至關(guān)重要。在此背景下,Model Context Protocol(MCP),...

關(guān)鍵字: 人工智能 大模型 協(xié)議

8月7日消息,今日,阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

關(guān)鍵字: 阿里通義 大模型

7月30日消息,日前,中國科學院深圳先進技術(shù)研究院發(fā)布了一項名為HYPIR的圖像復原大模型。

關(guān)鍵字: 大模型 AI

在 2025 世界人工智能大會 (WAIC) 期間,Arm 舉辦了以“AI 無處不在:從云到邊盡在 Arm” 為主題的技術(shù)論壇。該論壇匯聚了 Arm 技術(shù)專家及支付寶、聯(lián)想等合作伙伴代表,共同分享人工智能 (AI) 行...

關(guān)鍵字: AI 機器人 大模型

隨著芯片規(guī)模突破百億晶體管,傳統(tǒng)可測試性設(shè)計(DFT)方法面臨測試向量生成效率低、故障覆蓋率瓶頸等挑戰(zhàn)。本文提出一種基于大語言模型(LLM)的DFT自動化框架,通過自然語言指令驅(qū)動測試向量生成,并結(jié)合強化學習優(yōu)化故障覆蓋...

關(guān)鍵字: 大模型 DFT自動化

在亞馬遜云科技中國峰會上,亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松表示,過去一年,機器智能已經(jīng)爆發(fā)了,如今AI的發(fā)展又來到了一個拐點,我們正處在Agentic AI 爆發(fā)的前夜。

關(guān)鍵字: 機器智能 AI 大模型

6月8日消息,蘋果近日發(fā)表了一篇研究論文,稱推理模型全都沒真正思考,無論DeepSeek、o3-mini還是Claude 3.7都只是另一種形式的“模式匹配”,所謂思考只是一種假象。

關(guān)鍵字: AI 蘋果 大模型

隨著人工智能技術(shù)在各領(lǐng)域的廣泛應(yīng)用,將大型語言模型(LLM)部署到嵌入式端側(cè)設(shè)備成為重要趨勢。Llama 2 - 7B作為一款性能優(yōu)異的大語言模型,具有廣泛的應(yīng)用前景。然而,其龐大的參數(shù)量對嵌入式設(shè)備的計算資源和存儲能力...

關(guān)鍵字: 嵌入式端側(cè) 大模型 Llama 2 - 7B 瑞薩RZ/V2L

自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構(gòu)信息當作真實事實輸出。

關(guān)鍵字: 人工智能 大模型 AI

2025年4月25日,中國,北京——人工智能終端產(chǎn)業(yè)發(fā)展研討會暨人工智能終端工作組第一次全體大會召開,工業(yè)和信息化部副部長熊繼軍出席會議并致辭,工業(yè)和信息化部電子司和科技司、國家發(fā)展和改革委員會、商務(wù)部、北京市朝陽區(qū)有關(guān)...

關(guān)鍵字: 人工智能 大模型 AI手機
關(guān)閉