榜單排名前十名的超級(jí)計(jì)算機(jī)中,運(yùn)算速度出現(xiàn)質(zhì)的飛躍
超級(jí)計(jì)算機(jī)(Super computer),是指能夠執(zhí)行一般個(gè)人電腦無(wú)法處理的大量資料與高速運(yùn)算的電腦。就超級(jí)計(jì)算機(jī)和普通計(jì)算機(jī)的組成而言,構(gòu)成組件基本相同,但在性能和規(guī)模方面卻有差異。超級(jí)計(jì)算機(jī)主要特點(diǎn)包含兩個(gè)方面:極大的數(shù)據(jù)存儲(chǔ)容量和極快速的數(shù)據(jù)處理速度,因此它可以在多種領(lǐng)域進(jìn)行一些人們或者普通計(jì)算機(jī)無(wú)法進(jìn)行的工作。
超級(jí)計(jì)算機(jī)(巨型計(jì)算機(jī))是相對(duì)于大型計(jì)算機(jī)而言的一種運(yùn)算速度更高、存儲(chǔ)容量更大、功能更完善的計(jì)算機(jī)。它通常是指每秒中能運(yùn)算5000萬(wàn)次以上、存儲(chǔ)容量超過(guò)百萬(wàn)個(gè)字節(jié)的電子計(jì)算機(jī)。 [9] 超級(jí)計(jì)算機(jī)信息處理能力比個(gè)人計(jì)算機(jī)快一到兩個(gè)數(shù)量級(jí)以上,它在密集計(jì)算、海量數(shù)據(jù)處理等領(lǐng)域發(fā)揮著舉足輕重的作用。作為高性能計(jì)算技術(shù)產(chǎn)品的超級(jí)計(jì)算機(jī),又稱巨型機(jī),是與高性能計(jì)算機(jī)或高端計(jì)算機(jī)相對(duì)應(yīng)的概念。
了解到,這臺(tái)人工智能計(jì)算機(jī)將在微軟的 Azure 云上運(yùn)行,使用數(shù)以萬(wàn)計(jì)的圖形處理單元(GPU)、英偉達(dá)最強(qiáng)大的 H100 及其 A100 芯片。Nvidia 拒絕透露這筆交易的價(jià)值,但業(yè)內(nèi)人士表示,每顆 A100 芯片的價(jià)格約為 1 萬(wàn)至 1.2 萬(wàn)美元,而 H100 的價(jià)格則遠(yuǎn)高于此。
除了向微軟出售芯片外,英偉達(dá)表示還將與這家軟件和云計(jì)算巨頭合作開發(fā) AI 模型。英偉達(dá)還將成為微軟 AI 云計(jì)算機(jī)的客戶,并在上面開發(fā) AI 應(yīng)用,向客戶提供服務(wù)。
諸如用于自然語(yǔ)言處理的人工智能模型的快速增長(zhǎng),急劇推動(dòng)了對(duì)更快、更強(qiáng)大的計(jì)算基礎(chǔ)設(shè)施的需求。
英偉達(dá)表示,Azure 將是第一個(gè)使用其 Quantum-2 InfiniBand 網(wǎng)絡(luò)技術(shù)的公共云,其速度為每秒 400 吉比特,這種網(wǎng)絡(luò)技術(shù)以高速連接服務(wù)器,這非常重要,因?yàn)榉敝氐娜斯ぶ悄苡?jì)算工作需要成千上萬(wàn)的芯片在幾臺(tái)服務(wù)器上協(xié)同工作。
天,微軟和英偉達(dá)宣布建立多年的合作關(guān)系,為 Azure 客戶開發(fā)新型的 AI 人工智能云端超級(jí)計(jì)算機(jī),由英偉達(dá) GPU 技術(shù)驅(qū)動(dòng)。
利用“數(shù)以萬(wàn)計(jì)”的英偉達(dá) GPU 性能顯卡(英偉達(dá)最強(qiáng)大的 H100 和 A100 芯片,消息人士稱每款 A100 芯片價(jià)格約為 1 萬(wàn)-1.2 萬(wàn)美元,而 H100 芯片價(jià)格遠(yuǎn)高于此)、400Gb / s 的 Quantum-2 InfiniBand 網(wǎng)絡(luò)以及英偉達(dá)新生的人工智能平臺(tái),兩家公司旨在加快推出和開發(fā)由英偉達(dá)技術(shù)和微軟云計(jì)算驅(qū)動(dòng)的基于人工智能的工具和應(yīng)用程序。這是英偉達(dá)首次與微軟 Azure 合作,向公眾提供其云端人工智能基礎(chǔ)設(shè)施的全部堆棧。
隨著英偉達(dá)的硬件影響力逐步擴(kuò)大,微軟 Azure 將在虛擬機(jī)實(shí)例中帶來(lái)其獨(dú)特的全球可擴(kuò)展性,英偉達(dá)表示這將有助于加快各種人工智能工具的訓(xùn)練和部署。英偉達(dá)表示,像 Megatron Turing NLG 530B 這樣的基礎(chǔ)模型將在該計(jì)劃下得到快速發(fā)展,其目標(biāo)是開發(fā)用于構(gòu)建代碼、文本、數(shù)字圖像、音頻和視頻的“無(wú)監(jiān)管”自我學(xué)習(xí)算法。英偉達(dá)和微軟還將在 Microsoft DeepSpeed 算法完善平臺(tái)上進(jìn)行合作,該平臺(tái)旨在幫助人工智能實(shí)例更快速地進(jìn)行自我學(xué)習(xí)。
微軟負(fù)責(zé)云計(jì)算和人工智能的執(zhí)行副總裁 Scott Guthrie 對(duì)這一合作關(guān)系表示歡迎,因?yàn)閮杉夜緦⒑献魈剿髯詣?dòng)化行業(yè)的下一個(gè)浪潮。“人工智能正在推動(dòng)整個(gè)企業(yè)和工業(yè)計(jì)算的下一波自動(dòng)化浪潮,使企業(yè)在應(yīng)對(duì)經(jīng)濟(jì)不確定性時(shí)能夠事半功倍。我們與英偉達(dá)的合作解鎖了世界上最具擴(kuò)展性的超級(jí)計(jì)算機(jī)平臺(tái),在微軟 Azure 上為每個(gè)企業(yè)提供最先進(jìn)的 AI 能力?!?
Wafer Scale Engine 2是世界上尺寸最大的單顆裸片,面積為462.25平方厘米,幾乎等于一塊12英寸晶圓。其擁有850000個(gè)AI內(nèi)核,2.6萬(wàn)億個(gè)晶體管,配備了40GB的SRAM,提供了20 PB/s緩存帶寬和220 Pb/s互聯(lián)帶寬,采用臺(tái)積電7nm工藝制造。這些芯片將分布在16個(gè)機(jī)架的124個(gè)服務(wù)器節(jié)點(diǎn)上,通過(guò)100 GbE網(wǎng)絡(luò)連接,并由284個(gè)AMD第三代EPYC服務(wù)器處理器提供支持,均為64核心128線程規(guī)格,總有18176個(gè)核心。
近日,“世界最強(qiáng)大超級(jí)計(jì)算機(jī) TOP 500” 名單在全球超級(jí)計(jì)算機(jī)大會(huì)上發(fā)布。Frontier、Fugaku 和 LUMI 計(jì)算機(jī)位列前三。
據(jù)悉,本次發(fā)布的 TOP 500 名單中,F(xiàn)rontier 計(jì)算機(jī)排名第一。該機(jī)型在去年發(fā)布的 TOP 500 榜單中就被稱為“世界上第一個(gè)每秒浮點(diǎn)運(yùn)算能力(FLOPS)達(dá)到百億級(jí)別”的計(jì)算機(jī)系統(tǒng)。
Frontier 是由美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室研發(fā)的超級(jí)計(jì)算機(jī),其采用 HPE Cray EX235a 架構(gòu),配備了 AMD EPYC 64C 2GHz 處理器。
Frontier 內(nèi)核數(shù)高達(dá) 8730112,能效等級(jí)為 52.23gigaflops/watt,依賴千兆以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。高級(jí)的系統(tǒng)配置使其浮點(diǎn)計(jì)算能力(速度)保持在 1.102Eflop/s(相當(dāng)于每秒可進(jìn)行幾億次計(jì)算)。
該速度是榜單上排名第 2 位計(jì)算機(jī)的近 3 倍。這與今年 6 月份發(fā)布的 FLOPS 數(shù)據(jù)相差不大。
此次榜單上排名前 10 的其它計(jì)算機(jī)與今年 6 月公布的榜單相比僅有微小的變化。
值得注意的是,日本神戶的日本理化所計(jì)算機(jī)科學(xué)中心(R-CCS,RIKEN Center for Computational Science)的 Fugaku 計(jì)算機(jī)位居此次榜單的第二位,此前其曾連續(xù)兩年占據(jù)榜首,但后來(lái)被 Frontier 系統(tǒng)取代。Fugaku 也由 ARM 處理器驅(qū)動(dòng),每秒可進(jìn)行 442 千萬(wàn)億次運(yùn)算。
榜單中前 10 名的另一個(gè)變化是,由芬蘭的 EUROHPC/CSC 打造出的 LUMI 超級(jí)計(jì)算機(jī)上榜,位居第三位。它有 2220288 個(gè)內(nèi)核,HPL 基準(zhǔn)測(cè)試成績(jī)接近 0.309Eflop/s。
新上榜的意大利博洛尼亞 EuroHPC/CINECA 打造的 Leonardo 計(jì)算機(jī)系統(tǒng)在榜單中位列第四。該機(jī)器擁有 1463616 個(gè)核心,HPL 評(píng)分高達(dá) 0.174Eflop/s。
第 60 期全球超級(jí)計(jì)算機(jī)排行榜 TOP500 榜單出爐,排在首位的依然是美國(guó)的 Frontier。前三榜單基本上沒(méi)有太大的變化,日本的 Fugaku 富岳憑借 0.442 EFlop / s 的 HPL 得分仍排在第二,LUMI 位居第三。
Frontier,橡樹嶺國(guó)家實(shí)驗(yàn)室(ORNL)的 Frontier 超算本次 HPL 得分是 1.102 EFlop / s,其成績(jī)和 2022 年 6 月公布的榜單性能相同。雖然得分并未改進(jìn),但它的 HPL 得分依然是第二名富岳的 3 倍,這對(duì)計(jì)算機(jī)科學(xué)來(lái)說(shuō)仍然是一個(gè)重大勝利。
除此之外,F(xiàn)rontier 在衡量混合精度計(jì)算性能的 HPL-MxP 基準(zhǔn)上表現(xiàn)出了 7.94 EFlop / s 的得分。Frontier 基于 HPE Cray EX235a 架構(gòu),它依賴于 AMD EPYC 64C 2 GHz 處理器。該系統(tǒng)有 8,730,112 個(gè)內(nèi)核,功率效率等級(jí)為 52.23 千兆 / 瓦,依靠千兆位以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。
Fugaku 富岳,日本神戶 Riken 計(jì)算科學(xué)中心(R-CCS)的 Fugaku 富岳系統(tǒng)在被 Frontier 機(jī)器擠下來(lái)之前,曾連續(xù)兩年占據(jù)榜首。在本期榜單中憑借 0.442 EFlop / s 的 HPL 得分,F(xiàn)ugaku 保留了其在之前榜單中的第 2 位。