浪潮信息：推出CPU推理服務(wù)器支持DeepSeek和QwQ，元腦加速AI普及

時(shí)間：2025-03-20 15:18:26

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]北京2025年3月20日 /美通社/ -- 浪潮信息宣布推出元腦CPU推理服務(wù)器，可高效運(yùn)行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務(wù)器NF8260G7和NF8480G7設(shè)計(jì)采用4顆高性能通用CPU和多通道內(nèi)存系統(tǒng)，通過(guò)先進(jìn)的張量并行策略和AMX加速技術(shù)，...

北京2025年3月20日 /美通社/ -- 浪潮信息宣布推出元腦CPU推理服務(wù)器，可高效運(yùn)行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務(wù)器NF8260G7和NF8480G7設(shè)計(jì)采用4顆高性能通用CPU和多通道內(nèi)存系統(tǒng)，通過(guò)先進(jìn)的張量并行策略和AMX加速技術(shù)，單機(jī)即可高效運(yùn)行DeepSeek-R1 32B和QwQ-32B推理模型，單用戶性能超20 tokens/s，可同時(shí)處理20個(gè)并發(fā)用戶請(qǐng)求，是企業(yè)快速、易獲得、低投入部署上線大模型平臺(tái)的理想算力選擇，將加速DeepSeek帶動(dòng)下AI落地普及速度。

大模型行業(yè)應(yīng)用落地加速，DeepSeek-R1 32B、QwQ-32B等模型中文能力見長(zhǎng)，并在理解能力和知識(shí)儲(chǔ)備上有顯著優(yōu)勢(shì)，是企業(yè)平衡性能和部署成本的最佳模型選擇。元腦CPU推理服務(wù)器僅基于通用處理器進(jìn)行軟硬協(xié)同優(yōu)化，可為企業(yè)32B模型推理與云計(jì)算、數(shù)據(jù)庫(kù)等通用關(guān)鍵業(yè)務(wù)場(chǎng)景融合提供更高效、更靈活、更穩(wěn)定的AI通用算力支撐。

浪潮信息：推出CPU推理服務(wù)器支持DeepSeek和QwQ，元腦加速AI普及

隨著DeepSeek等大模型在企業(yè)場(chǎng)景中的應(yīng)用日趨廣泛，以及與企業(yè)業(yè)務(wù)系統(tǒng)的融合更加緊密，CPU服務(wù)器憑借其獨(dú)特優(yōu)勢(shì)成為中小規(guī)模并發(fā)場(chǎng)景部署DeepSeek的最佳選擇。CPU服務(wù)器具備卓越的通用性和靈活性，可同時(shí)支持AI推理、云計(jì)算、數(shù)據(jù)庫(kù)等多種工作負(fù)載，避免了專用AI硬件的使用局限，為大模型應(yīng)用與現(xiàn)有IT基礎(chǔ)設(shè)施的融合提供了更加靈活、經(jīng)濟(jì)的方案選擇，使企業(yè)能夠以較低的硬件投入快速實(shí)現(xiàn)大模型應(yīng)用落地。

在企業(yè)部署大模型的過(guò)程中，參數(shù)規(guī)模與其應(yīng)用場(chǎng)景息息相關(guān)。浪潮信息與IDC聯(lián)合發(fā)布的《2025年中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》顯示，目前92%企業(yè)使用的生成式人工智能模型平均參數(shù)量小于50B。一般而言，671B等超大規(guī)模參數(shù)的模型性能更強(qiáng)，但對(duì)硬件資源要求高，部署成本昂貴；而32B級(jí)模型在理解能力和知識(shí)儲(chǔ)備上有顯著優(yōu)勢(shì)，能夠平衡性能和部署成本。以業(yè)界32B模型為例，DeepSeek-R1 32B在知識(shí)問答、智能寫作、內(nèi)容生成等方面表現(xiàn)優(yōu)秀，QwQ-32B則在數(shù)學(xué)推理、編程任務(wù)和長(zhǎng)文本處理等方面的性能優(yōu)異。DeepSeek-R1 32B和QwQ-32B的訓(xùn)練數(shù)據(jù)中包含海量的高質(zhì)量中文語(yǔ)料庫(kù)，會(huì)更加適合于國(guó)內(nèi)企業(yè)應(yīng)用，而Llama 70B主要基于英文語(yǔ)料進(jìn)行訓(xùn)練，對(duì)中文用戶而言不夠友好。因此，大多數(shù)企業(yè)應(yīng)用場(chǎng)景中，如企業(yè)知識(shí)庫(kù)問答、文檔寫作、會(huì)議紀(jì)要整理等場(chǎng)景，32B參數(shù)級(jí)別的模型往往是最佳選擇，既能提供強(qiáng)大的能力支持，又能保持合理的硬件投入。

目前元腦CPU推理服務(wù)器NF8260G7和NF8480G7基于通用處理器架構(gòu)進(jìn)行軟硬協(xié)同優(yōu)化，已經(jīng)完成與DeepSeek-R1 32B和QwQ-32B等大模型的深度適配和優(yōu)化。元腦CPU推理服務(wù)器通過(guò)采用先進(jìn)的張量并行策略和AMX加速技術(shù)，業(yè)界主流企業(yè)級(jí)大模型推理服務(wù)框架，實(shí)現(xiàn)多處理器并行計(jì)算，并使用AWQ（激活感知權(quán)重量化）技術(shù)，進(jìn)一步提升推理解碼性能，成功實(shí)現(xiàn)單用戶最高20tokens/s的最佳性能，為企業(yè)的AI大模型部署應(yīng)用帶來(lái)流暢體驗(yàn)。

面對(duì)CPU服務(wù)器部署大模型面臨算力和帶寬方面的挑戰(zhàn)，元腦CPU推理服務(wù)器采用了多項(xiàng)創(chuàng)新技術(shù)。

在算力方面，元腦CPU推理服務(wù)器NF8260G7和NF8480G7，設(shè)計(jì)上采用4顆32核心的英特爾至強(qiáng)處理器6448H，具有AMX（高級(jí)矩陣擴(kuò)展）AI加速功能，支持張量并行計(jì)算，并通過(guò)多通道內(nèi)存系統(tǒng)設(shè)計(jì)可支持32組DDR5內(nèi)存，從而在單機(jī)具備超強(qiáng)的BF16精度AI推理能力、最大16T內(nèi)存容量和1.2TB/s內(nèi)存帶寬，可以更好滿足模型權(quán)重、KVCache等計(jì)算和存儲(chǔ)需求，快速讀取和存儲(chǔ)數(shù)據(jù)，大幅提升大模型推理性能。同時(shí)，元腦四路服務(wù)器具備高可靠性，平均無(wú)故障時(shí)間可達(dá)200,000小時(shí)，保障關(guān)鍵應(yīng)用和AI推理應(yīng)用持續(xù)穩(wěn)定運(yùn)行。
在算法方面，元腦CPU推理服務(wù)器對(duì)業(yè)界主流的企業(yè)級(jí)大模型推理服務(wù)框架vLLM進(jìn)行深度定制優(yōu)化，通過(guò)張量并行和內(nèi)存綁定技術(shù)，充分釋放服務(wù)器CPU算力和內(nèi)存帶寬潛能，實(shí)現(xiàn)多處理器并行計(jì)算，效率最高提升4倍，并使用AWQ（激活感知權(quán)重量化）技術(shù)進(jìn)一步加速解碼性能，實(shí)現(xiàn)了2倍解碼性能提升。測(cè)試數(shù)據(jù)顯示，基于單臺(tái)NF8260G7，在使用DeepSeek-R1 32B進(jìn)行帶思維鏈深度思考的短輸入長(zhǎng)輸出的問答場(chǎng)景下，解碼性能超過(guò)20tokens/s，20個(gè)并發(fā)用戶下，總token數(shù)達(dá)到255.2tokens/s；在使用QwQ-32B進(jìn)行模型推理時(shí)，支持20個(gè)并發(fā)用戶數(shù)，總token數(shù)達(dá)到224.3tokens/s，可以提供流暢穩(wěn)定的用戶體驗(yàn)。

基于DeepSeek-R1 32B 并發(fā)性能測(cè)試數(shù)據(jù)

基于QwQ-32B 并發(fā)性能測(cè)試數(shù)據(jù)

當(dāng)前，元腦服務(wù)器研發(fā)團(tuán)隊(duì)正與業(yè)內(nèi)團(tuán)隊(duì)密切合作，在計(jì)算架構(gòu)、算子調(diào)優(yōu)、并行策略、框架適配、調(diào)度管理等多個(gè)方面持續(xù)發(fā)力，旨在為用戶帶來(lái)高效、穩(wěn)定的DeepSeek等大模型部署方案，助力大模型快速落地應(yīng)用。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動(dòng)方式相比，共陰恒流驅(qū)動(dòng)在能效有哪些優(yōu)勢(shì)

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動(dòng)電源

[電源]

工業(yè)電機(jī)驅(qū)動(dòng)電源設(shè)計(jì)：反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)的集成方案

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動(dòng)力設(shè)備，其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié)，集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動(dòng)電源

[電源]

如何解決 LED 驅(qū)動(dòng)電源的易損壞問題

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而，在實(shí)際應(yīng)用中，LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗(yàn)。要解決這一問題，需從設(shè)計(jì)、生...

關(guān)鍵字：驅(qū)動(dòng)電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計(jì)中LED驅(qū)動(dòng)電源的公式

根據(jù)LED驅(qū)動(dòng)電源的公式，電感內(nèi)電流波動(dòng)大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計(jì) 驅(qū)動(dòng)電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動(dòng)電源方案選擇問題探討

電動(dòng)汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字：電動(dòng)汽車新能源驅(qū)動(dòng)電源

[電源]

合理的驅(qū)動(dòng)電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動(dòng)電源 LED

[消費(fèi)電子]

AC-DC電源轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字： LED 驅(qū)動(dòng)電源功率因數(shù)校正

[電源]

針對(duì)于LED照明驅(qū)動(dòng)電源技術(shù)中的電磁干擾其中的三大硬件問題措施

在LED照明技術(shù)日益普及的今天，LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作，還可能對(duì)周圍電子設(shè)備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來(lái)解決L...

關(guān)鍵字： LED照明技術(shù) 電磁干擾驅(qū)動(dòng)電源

[電源]

LED驅(qū)動(dòng)電源的核心部分“開關(guān)管”和“變換器”設(shè)計(jì)技巧

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字： LED 驅(qū)動(dòng)電源開關(guān)電源

[電源]

最全LED驅(qū)動(dòng)電源及散熱設(shè)計(jì)方案介紹

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器，通常情況下：LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字： LED 隧道燈驅(qū)動(dòng)電源