海光DCU成功適配DeepSeek-Janus-Pro多模態(tài)大模型
近日,海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek-Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。這是海光團(tuán)隊(duì)近期完成適配優(yōu)化的第三款DeepSeek大模型,充分展現(xiàn)了DCU強(qiáng)大的生態(tài)優(yōu)勢(shì)與技術(shù)能力。因DCU采用了GPGPU通用加速計(jì)算架構(gòu),DeepSeek模型可直接在DCU上運(yùn)行,并不需要大量適配工作,技術(shù)團(tuán)隊(duì)的主要工作是進(jìn)行精度驗(yàn)證和持續(xù)的性能優(yōu)化。
用戶現(xiàn)可通過(guò)“光合開(kāi)發(fā)者社區(qū)”中的“光源”板塊訪問(wèn)并下載相關(guān)模型,或直接登錄[www.sourcefind.cn]搜索“deepseek”,即可基于DCU平臺(tái)快速部署和使用相關(guān)模型,包括高性能的問(wèn)答基礎(chǔ)模型DeepSeek-V3、推理模型DeepSeek-R1和文生圖模型DeepSeek-Janus-Pro。
本次適配優(yōu)化的DeepSeek-Janus-Pro模型具備跨模態(tài)理解與生成能力,專注于結(jié)合視覺(jué)與語(yǔ)言理解能力,旨在處理更復(fù)雜的跨模態(tài)任務(wù)。
(Janus-Pro生成示例)
海光技術(shù)團(tuán)隊(duì)負(fù)責(zé)人表示,海光DCU在短時(shí)間內(nèi)快速完成多款大模型適配,充分顯示了DCU基于GPGPU架構(gòu)實(shí)現(xiàn)的兼容主流Al生態(tài)的重要優(yōu)勢(shì),同時(shí)驗(yàn)證了國(guó)產(chǎn)算力底座支撐前沿AI模型的技術(shù)能力,為金融、制造等行業(yè)的智能化轉(zhuǎn)型提供了自主可控的技術(shù)選項(xiàng)。隨著多模態(tài)AI應(yīng)用場(chǎng)景的持續(xù)拓展,國(guó)產(chǎn)算力基礎(chǔ)設(shè)施正成為驅(qū)動(dòng)產(chǎn)業(yè)智能化升級(jí)的核心引擎。