走AMD、英特爾\"膠水\"路線,NVIDIA或放棄大核心GPU戰(zhàn)略
從Kpler時(shí)代開始,NVIDIA為了兼顧GPU計(jì)算及游戲兩個(gè)市場(chǎng)采取了不同的市場(chǎng)戰(zhàn)略——GX100/102大核心主要面向GPU計(jì)算市場(chǎng),GX104/106主流核心則面向游戲GPU,砍掉了對(duì)游戲無(wú)大用的雙精度運(yùn)算,降低復(fù)雜性,減少芯片面積以節(jié)省成本、降低功耗。大核心的好處及代價(jià)都是非常明顯的,但是隨著摩爾定律終結(jié),制造大核心芯片的工藝越來(lái)越復(fù)雜,成本也越來(lái)越貴,NVIDIA對(duì)7nm工藝就表示了明顯的抵觸,那他們有什么殺招嗎?NVIDIA未來(lái)有可能放棄單一大核心GPU戰(zhàn)略,他們已經(jīng)研究了RC18超小核——基于臺(tái)積電16nm工藝,晶體管數(shù)量只有8700萬(wàn)個(gè),但一個(gè)GPU芯片內(nèi)可以堆疊36個(gè)這樣的小核心,換句話說(shuō)NVIDIA未來(lái)也要走AMD、英特爾那樣的膠水多模芯片路線了。
膠水多模這個(gè)說(shuō)法并不嚴(yán)謹(jǐn),只是網(wǎng)友的調(diào)侃,實(shí)際上這是目前半導(dǎo)體業(yè)界都在研究的Chiplets技術(shù),簡(jiǎn)單來(lái)說(shuō)就是在一個(gè)芯片內(nèi)堆疊不同的核心單元,不同的核心可以是不同架構(gòu)的,也可以是不同工藝的,而這樣做的原因就是半導(dǎo)體制造工藝越來(lái)越復(fù)雜,制造大核心的難度及成本都居高不下,而且還會(huì)有浪費(fèi),因?yàn)椴⒉皇撬泻诵膯卧夹枰钕冗M(jìn)的工藝。
AMD的7nm 64核羅馬處理器就是這樣的代表,CPU核心是7nm工藝的,一個(gè)芯片內(nèi)最多可以堆疊8組CPU單元,總計(jì)64核心,而IO核心則是14nm工藝的。
英特爾這邊也有類似的戰(zhàn)略,除了48核膠水封裝的Cascade Lake-AP處理器之外,英特爾還有真正的Chiplets設(shè)計(jì)——Foreros 3D封裝,也可以將不同架構(gòu)、不同工藝的核心封裝在一起。
AMD、NVIDIA現(xiàn)在是在CPU處理器上應(yīng)用了Chiplets設(shè)計(jì),而NVIDIA則是準(zhǔn)備在GPU芯片上研究MCM多模封裝技術(shù)。來(lái)自日本PCWatch網(wǎng)站的報(bào)道,NVIDIA研究部門主管、首席科學(xué)家、高級(jí)研究副總裁William J. Dally日前就公開了一個(gè)名為RC 18的芯片項(xiàng)目,這是一款適用于深度學(xué)習(xí)的加速器芯片,基于臺(tái)積電16nm FinFET工藝,晶體管數(shù)量只有8700萬(wàn)個(gè),相比現(xiàn)在動(dòng)輒數(shù)十億乃至上百億的GPU芯片來(lái)說(shuō)絕對(duì)是輕量級(jí)的芯片了。
但是RC18芯片只是基礎(chǔ),NVIDIA研究的目標(biāo)是在芯片上集成多個(gè)基于RC18的MCM模塊,目前已經(jīng)做到了36模塊堆棧,詳細(xì)的技術(shù)細(xì)節(jié)可以參考PCWatch的原文。值得一提的是,RC18不僅是GPU,NVIDIA還在其中集成了RISC-V指令集的CPU核心,雖然只有5級(jí)流水線、單發(fā)射順序指令架構(gòu)。
結(jié)合這里的情況來(lái)看,現(xiàn)在大家應(yīng)該可以理解NVIDIA對(duì)7nm工藝為何如此冷淡了。