AMD最強AI芯片發(fā)布:性能是英偉達H100的1.3倍!
12月7日消息,AMD于當(dāng)?shù)貢r間周三舉行了“Advancing AI”發(fā)布會,正式推出了面向AI及HPC領(lǐng)域的GPU產(chǎn)品Instinct MI300A/MI300X加速器,直接與英偉達(NVIDIA)H100加速器競爭。
同時AMD還發(fā)布了代號為Hawk Point的最新一代Ryzen 8000系列APU,可面向AI PC產(chǎn)品。
MI300A:HPC性能達到NVIDIA H100的4倍
雖然在今年6月的“數(shù)據(jù)中心與人工智能技術(shù)發(fā)布會”,AMD就有發(fā)布MI300A和MI300X,只不過當(dāng)時MI300X只是紙面上的發(fā)布,現(xiàn)在MI300A和MI300X已經(jīng)開始批量量產(chǎn)了,AMD也公布了更多關(guān)于MI300A、MI300X的性能數(shù)據(jù)。
AMD MI300A采用了Chiplet設(shè)計,其內(nèi)部擁有多達13個小芯片,均基于臺積電5nm或6nm制程工藝(CPU/GPU計算核心為5nm,HBM內(nèi)存和I/O等為6nm),其中許多是 3D 堆疊的,以便創(chuàng)建一個面積可控的單芯片封裝,總共集成1460 億個晶體管。
具體來說,MI300A與上一代的MI250X一脈相承,采用新一代的CDNA 3 GPU架構(gòu),擁有228個計算單元(14592個核心),并集成了24個Zen 4 CPU內(nèi)核,配置了128GB的HBM3內(nèi)存。
MI300A的計算核心被 8 個HBM3內(nèi)存包圍,單個HBM3的帶寬為6.3GB/s,八個16GB堆棧形成128GB統(tǒng)一內(nèi)存,帶寬高達5.3 TB/s。
在算力方面,MI300A提供了高達61 TFLOPS FP64算力,多達122 TFLOPS FP32算力。
AMD表示,MI300A GPU將HPC提升到一個新的水平,其性能是NVIDIA H100的4倍,能效是H100的兩倍。
具體來說,在OpenFOAM中,MI300A APU提供了相比H100高達4倍的性能提升,這主要來自于統(tǒng)一的內(nèi)存布局、GPU性能以及整體內(nèi)存容量和帶寬。與NVIDIA的Grace Hopper超級芯片相比,該系統(tǒng)每瓦的性能也提高了2倍。