當(dāng)前位置：首頁 > > 動(dòng)態(tài)速遞

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強(qiáng)6新品處理器淺析

時(shí)間：2025-06-19 18:12:17

關(guān)鍵字：英特爾 AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]在AI異構(gòu)計(jì)算架構(gòu)中，英特爾至強(qiáng)6處理器作為主控CPU可以與NVIDIA最新GPU很好地協(xié)同。

一、至強(qiáng)6與NVIDIA GPU協(xié)同的硬件基礎(chǔ)

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強(qiáng)6新品處理器淺析

在AI異構(gòu)計(jì)算架構(gòu)中，英特爾至強(qiáng)6處理器作為主控CPU可以與NVIDIA最新GPU很好地協(xié)同。根據(jù)英偉達(dá)官網(wǎng)信息，目前其DGX B300系統(tǒng)選擇至強(qiáng)6776P作為唯一主控CPU，采用雙路配置，通過UPI總線實(shí)現(xiàn)CPU間互連。這8個(gè)GPU通過NVLink高速互連，是性能比較高端的DGX，為訓(xùn)練等應(yīng)用而設(shè)計(jì)。

作為主控CPU，它和GPU協(xié)同工作，而這個(gè)系統(tǒng)的性能受到諸多因素的影響，這里列出的是最主要的因素，包括I/O、核心性能、內(nèi)存（包括帶寬和容量）、CPU上的預(yù)處理或卸載（offload）能力、整體CPU系統(tǒng)的RAS，以及各種硬件的外形設(shè)計(jì)等。這些都會(huì)影響整個(gè)AI系統(tǒng)的端到端性能，因此AI系統(tǒng)通常比較復(fù)雜。

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強(qiáng)6新品處理器淺析

這一設(shè)計(jì)的性能提升要點(diǎn)在于：

1. 業(yè)界領(lǐng)先的I/O通道和內(nèi)存能力

AP平臺(tái)的雙路至強(qiáng)6最多可以提供192條PCIe 5.0通道，也就是可以每路提供96條通道，相比上一代提升20%，內(nèi)存通道也可以高達(dá)12個(gè)。直接匹配多GPU的高速接入需求，避免因通道不足導(dǎo)致的帶寬瓶頸。

在SP平臺(tái)上，英特爾還提供了一個(gè)差異化的產(chǎn)品，就是在單個(gè)CPU插槽上提供了更豐富的I/O資源（Rich I/O one socket），總共有136根的PCIe通道，持單插槽連接多塊加速卡與存儲(chǔ)設(shè)備，適用于邊緣端“預(yù)處理+推理”一體化場(chǎng)景。同時(shí)，其高帶寬內(nèi)存可容納更大模型參數(shù)，提升訓(xùn)練效率。在推理場(chǎng)景中，靈活的核心配置確保資源高效利用，滿足多樣化需求。

2. 核心性能優(yōu)化

至強(qiáng)6區(qū)別于上一代產(chǎn)品的關(guān)鍵技術(shù)突破是Priority Core Turbo（PCT），其技術(shù)本質(zhì)是通過Speed Select（SST）將單路CPU核心劃分為兩組：最多8個(gè)高頻核心（PCT核心）與剩余低頻核心。在DGX B300場(chǎng)景中，這一技術(shù)直接服務(wù)于“CPU驅(qū)動(dòng)GPU”的典型需求，實(shí)現(xiàn)高頻核心的精準(zhǔn)調(diào)度：當(dāng)GPU需要快速獲取預(yù)處理數(shù)據(jù)（如從內(nèi)存讀取原始數(shù)據(jù)并完成清洗、特征工程）時(shí)，8個(gè)PCT核心可睿頻至4.6GHz（傳統(tǒng)64核SKU最大睿頻為3.9GHz），相比全核睿頻（3.6GHz）提升28%。這一特性縮短了數(shù)據(jù)從CPU到GPU的傳輸延遲。

3. 資源分配的靈活性

PCT核心數(shù)量可通過BIOS或SST-TF工具動(dòng)態(tài)配置，客戶可根據(jù)實(shí)際負(fù)載調(diào)整——客戶在使用時(shí)可以根據(jù)需要選擇8個(gè)、6個(gè)、4個(gè)或2個(gè)PCT核心。例如推理場(chǎng)景中若僅需4塊GPU工作，可配置4個(gè)PCT核心對(duì)應(yīng)驅(qū)動(dòng)，避免資源浪費(fèi)。與上一代Max Turbo技術(shù)的差異在于：PCT允許全核在線（無需半數(shù)核心休眠），且維持相同TDP（350W）與散熱設(shè)計(jì)，確保硬件兼容性，降低客戶部署成本。

4. 更強(qiáng)的內(nèi)存架構(gòu)兼容性

更高的內(nèi)存帶寬對(duì)于AI工作負(fù)載至關(guān)重要，因?yàn)锳I的工作流程是一個(gè)完整的數(shù)據(jù)處理管道，而非單一環(huán)節(jié)。在這一過程中，CPU首先負(fù)責(zé)預(yù)處理，從內(nèi)存中讀取數(shù)據(jù)并進(jìn)行初步處理，隨后將數(shù)據(jù)傳輸至GPU。比如，至強(qiáng)6支持8通道到12通道的DDR5-6400內(nèi)存，還支持MRDIMMs，能提供更高的30%帶寬。

在LLM的生成式推理（如文本續(xù)寫）中，自注意力機(jī)制需為每個(gè)已處理的Token生成并存儲(chǔ)鍵（Key）和值（Value）矩陣，即KV Cache。KV Cache避免了在解碼階段重復(fù)計(jì)算歷史Token的注意力狀態(tài)，但會(huì)隨序列長(zhǎng)度線性增長(zhǎng)，占用大量GPU顯存，需要卸載到下一級(jí)存儲(chǔ)中。對(duì)于CXL內(nèi)存來說，有一個(gè)典型用例是KV Cache的卸載，通過用CXL內(nèi)存去替代SSD，這樣KV Cache的訪問速度顯著增快，從而提升了性能。

5. RAS和數(shù)據(jù)預(yù)處理

在企業(yè)級(jí)AI訓(xùn)練場(chǎng)景中，系統(tǒng)可靠性直接影響算力利用率與TCO。至強(qiáng)6的RAS體系覆蓋全硬件鏈路，可以通過RAS特性來可以提高I/O的穩(wěn)定性、內(nèi)存系統(tǒng)穩(wěn)定性、UPI鏈路穩(wěn)定性、CPU及平臺(tái)穩(wěn)定性。CPU卸載則是針對(duì)MoE（混合專家）模型的另一種優(yōu)化方式。目前市場(chǎng)上已有諸多關(guān)于通過AMX矩陣技術(shù)將部分MoE模型中的專家層卸載至至強(qiáng)處理器的案例。

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強(qiáng)6新品處理器淺析

二、為何是至強(qiáng)6776P？

NVIDIA DGX B300選擇的雙路至強(qiáng)6776P的核心價(jià)值在于業(yè)界領(lǐng)先的I/O能力、領(lǐng)先的內(nèi)存帶寬、大內(nèi)存容量、領(lǐng)先的RAS能力已經(jīng)為特定AI負(fù)載優(yōu)化的PCT產(chǎn)品。

其4.6GHz的睿頻能力顯著加速數(shù)據(jù)處理，PCT核心以4.6GHz頻率加速數(shù)據(jù)預(yù)處理（如文本分詞、圖像解碼），通過高速PCIe通道將數(shù)據(jù)傳輸至GPU，形成“CPU預(yù)處理→GPU計(jì)算”的流水線作業(yè)。這款處理器擁有單路88條PCIe通道，雙路則達(dá)到176條。

英偉達(dá)選擇了2 DPC架構(gòu)（每顆CPU提供8通道內(nèi)存，每通道2個(gè)DIMM）進(jìn)行配置，雙路系統(tǒng)可搭載32根DIMM，內(nèi)存最大容量達(dá)8TB。

綜述：開放生態(tài)的實(shí)際意義

至強(qiáng)6的核心優(yōu)勢(shì)在于開放性與兼容性?？蛻粲布x擇自由，可以根據(jù)成本動(dòng)態(tài)切換，避免被單一供應(yīng)商鎖定。在軟件生態(tài)兼容層面，至強(qiáng)6也完全支持主流AI框架（如TensorFlow、PyTorch）與云原生技術(shù)，無需重新開發(fā)適配層，降低技術(shù)遷移成本。

從英偉達(dá)的選擇邏輯看，DGX B300采用至強(qiáng)6應(yīng)該并非單一性能導(dǎo)向，而是綜合考量了生態(tài)開放性、成本可控性與技術(shù)成熟度——至強(qiáng)6作為量產(chǎn)級(jí)產(chǎn)品，其穩(wěn)定性與供應(yīng)鏈可靠性已通過大規(guī)模數(shù)據(jù)中心驗(yàn)證。

至強(qiáng)6在搭配NVIDIA GPU場(chǎng)景中的價(jià)值，本質(zhì)上源于其對(duì)“CPU角色”的清晰定位：核心數(shù)量或睿頻頻率，都是圍繞GPU協(xié)同需求而定，根據(jù)用戶的不同需求，也可以選擇不同的CPU型號(hào)。在關(guān)鍵路徑（如高頻數(shù)據(jù)傳輸、大內(nèi)存容量、系統(tǒng)穩(wěn)定性）上，至強(qiáng)6可以實(shí)現(xiàn)精準(zhǔn)優(yōu)化。對(duì)于企業(yè)客戶而言，這意味著在AI基礎(chǔ)設(shè)施建設(shè)中，可通過標(biāo)準(zhǔn)化硬件獲取可預(yù)期的性能提升，同時(shí)避免為冗余功能支付額外成本。這種“需求導(dǎo)向型”技術(shù)路線，或許正是其成為英偉達(dá)首選主控CPU的核心原因。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

美國(guó)又出“昏招”：擬全面限制高端GPU出口

近日，美國(guó)參議院公布了一項(xiàng)引人注目的國(guó)防政策方案，其中包含的“2025年國(guó)家人工智能保障準(zhǔn)入和創(chuàng)新法案”（簡(jiǎn)稱GAIN AI法案）再次在全球科技領(lǐng)域掀起波瀾。

關(guān)鍵字： AI GPU

[美通社全球TMT]

世界智能產(chǎn)業(yè)博覽會(huì)于重慶開幕，人工智能與新能源汽車成焦點(diǎn)

重慶2025年9月6日 /美通社/ -- iChongqing新聞報(bào)道：2025世界智能產(chǎn)業(yè)博覽會(huì)于9月5日在重慶開幕，550余家企業(yè)參展，展示了從自動(dòng)駕駛和人工智能(AI)座艙到擴(kuò)展現(xiàn)實(shí)(XR)影視和機(jī)器人咖啡廳的30...

關(guān)鍵字：人工智能新能源汽車 AI 機(jī)器人

[美通社全球TMT]

六大"行業(yè)領(lǐng)先"！廣汽星源增程正式發(fā)布，定義中國(guó)最強(qiáng)增程技術(shù)

慕尼黑2025年9月6日 /美通社/ -- 近日，廣汽正式推出全新增程技術(shù)——"星源增程"（英文名為ADiMOTION），全面提升增程器效率、動(dòng)力響應(yīng)及NVH表現(xiàn)，同時(shí)配合AI能量控制平臺(tái)，實(shí)現(xiàn)每一度...

關(guān)鍵字：廣汽 AI 增程器電機(jī)

[美通社全球TMT]

中瑞建交75周年之際 SGS通標(biāo)榮獲中瑞商業(yè)大獎(jiǎng)傳承獎(jiǎng)

北京2025年9月5日 /美通社/ -- 近日，2025年中瑞商業(yè)大獎(jiǎng)?lì)C獎(jiǎng)典禮在北京舉行，SGS通標(biāo)標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司（以下稱SGS通標(biāo)）作為瑞士SGS在中國(guó)的分支機(jī)構(gòu)榮獲了傳承獎(jiǎng)的殊榮。SGS通標(biāo)北京總經(jīng)理...

關(guān)鍵字：可持續(xù)發(fā)展 ST AI ABILITY

[美通社全球TMT]

軟通動(dòng)力"智"繪濟(jì)南新篇：FunAI3落地，軟通華方領(lǐng)銜，共筑北方硬核算力"底座"

北京2025年9月5日 /美通社/ -- 9月2日，濟(jì)南城市投資集團(tuán)有限公司（簡(jiǎn)稱"濟(jì)南城投"）與軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（簡(jiǎn)稱"軟通動(dòng)力"）正式簽署戰(zhàn)略合作...

關(guān)鍵字： AI 數(shù)字經(jīng)濟(jì) 智能化人工智能技術(shù)

[美通社全球TMT]

宇通車聯(lián)網(wǎng)系統(tǒng)Link+，賦能車隊(duì)實(shí)現(xiàn)智慧管理與高效運(yùn)營(yíng)升級(jí)

中國(guó)鄭州2025年9月5日 /美通社/ --?全球領(lǐng)先的電動(dòng)客車制造商宇通客車（"宇通"，上交所代碼：600066）全新升級(jí)的車聯(lián)網(wǎng)系統(tǒng)Link+采用先進(jìn)技術(shù)實(shí)現(xiàn)車隊(duì)車輛與管理平臺(tái)的智能互聯(lián)。作為Vehicle+升級(jí)版，...

關(guān)鍵字： LINK 車聯(lián)網(wǎng) AI PS

[美通社全球TMT]

更高效、更智能、更韌性：大眾汽車集團(tuán)攜手亞馬遜云科技，助力生產(chǎn)轉(zhuǎn)型邁入AI時(shí)代

大眾汽車集團(tuán)加速推進(jìn)生產(chǎn)數(shù)字化轉(zhuǎn)型數(shù)字化生產(chǎn)平臺(tái)（Digital Production Platform）成為大眾汽車的"工廠云"，在全球生產(chǎn)基地實(shí)現(xiàn)人工智能（AI）與前沿 IT...

關(guān)鍵字：亞馬遜大眾汽車 AI 數(shù)字化

[美通社全球TMT]

北京經(jīng)開區(qū)構(gòu)建五大支撐體系，加快建設(shè)全域人工智能之城

北京2025年9月5日 /美通社/ -- 9月4日，在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會(huì)上，北京經(jīng)開區(qū)對(duì)外發(fā)布，北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)（簡(jiǎn)稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字：人工智能模型開源 AI

[美通社全球TMT]