當(dāng)前位置：首頁 > 廠商動(dòng)態(tài) > 亞馬遜云科技

亞馬遜云科技宣布Amazon EC2 P5實(shí)例正式可用，加速生成式AI和高性能計(jì)算應(yīng)用

時(shí)間：2023-07-31 14:38:20

關(guān)鍵字：生成式AI GPU

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]由英偉達(dá)H100 Tensor Core GPU提供支持

北京——2023年7月31日亞馬遜云科技近日在紐約峰會(huì)上宣布Amazon Elastic Compute Cloud(EC2)P5實(shí)例正式可用。這是一款下一代GPU實(shí)例，由最新的英偉達(dá)H100 Tensor Core GPU提供支持，可以滿足客戶在運(yùn)行人工智能、機(jī)器學(xué)習(xí)和高性能計(jì)算工作負(fù)載時(shí)對(duì)高性能和高擴(kuò)展性的需求。與上一代基于GPU的實(shí)例相比，Amazon EC2 P5實(shí)例可以將訓(xùn)練時(shí)間縮減6倍(從幾天縮短到幾小時(shí))，從而幫助客戶節(jié)省高達(dá)40%的訓(xùn)練成本。

Amazon EC2 P5實(shí)例提供8個(gè)英偉達(dá)H100 Tensor Core GPU，具有640 GB高帶寬GPU內(nèi)存，同時(shí)提供第三代AMD EPYC處理器、2TB系統(tǒng)內(nèi)存和30 TB本地NVMe存儲(chǔ)。Amazon EC2 P5實(shí)例還提供3200 Gbps的聚合網(wǎng)絡(luò)帶寬并支持GPUDirect RDMA，從而能夠繞過CPU進(jìn)行節(jié)點(diǎn)間通信，實(shí)現(xiàn)更低的延遲和高效的橫向擴(kuò)展性能。

亞馬遜云科技與英偉達(dá)攜手開發(fā)下一代基礎(chǔ)設(shè)施

亞馬遜云科技和英偉達(dá)(NVIDIA)在今年3月宣布了一項(xiàng)多方合作，構(gòu)建全球最具可擴(kuò)展性且按需付費(fèi)的人工智能基礎(chǔ)設(shè)施，以便訓(xùn)練日益復(fù)雜的大語言模型和開發(fā)生成式AI應(yīng)用程序。

當(dāng)時(shí)，亞馬遜云科技預(yù)發(fā)布了由英偉達(dá)H100 Tensor Core GPU支持的Amazon EC2 P5實(shí)例，可為構(gòu)建和訓(xùn)練更大規(guī)模的機(jī)器學(xué)習(xí)模型提供高達(dá)20 exaFLOPS的算力。亞馬遜云科技和英偉達(dá)合作十多年來成果頗豐，推出了包括支持視覺計(jì)算、人工智能和高性能計(jì)算集群的各種GPU實(shí)例，如CG1實(shí)例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和P4de(2022年)實(shí)例。

現(xiàn)在，機(jī)器學(xué)習(xí)模型的規(guī)模已經(jīng)達(dá)到數(shù)萬億參數(shù)，這種復(fù)雜性大大增加了客戶訓(xùn)練模型所需的時(shí)間，例如，最新的大語言模型訓(xùn)練時(shí)間長達(dá)數(shù)月之久。類似的趨勢(shì)也出現(xiàn)在高性能計(jì)算領(lǐng)域。隨著高性能計(jì)算客戶數(shù)據(jù)收集準(zhǔn)確度的提高以及數(shù)據(jù)集達(dá)到EB級(jí)規(guī)模，客戶已經(jīng)在尋找解決日益復(fù)雜應(yīng)用程序的更快方法。

關(guān)于Amazon EC2 P5實(shí)例

Amazon EC2 P5實(shí)例非常適合訓(xùn)練和運(yùn)行越來越復(fù)雜的大語言模型和計(jì)算機(jī)視覺模型，以滿足最苛刻的計(jì)算密集型生成式AI應(yīng)用的需求，包括問答、代碼生成、視頻和圖像生成、語音識(shí)別等。與上一代基于GPU的實(shí)例相比，Amazon EC2 P5實(shí)例在這些應(yīng)用中的訓(xùn)練時(shí)間縮短了6倍。那些可以在工作負(fù)載中使用較低精度FP8數(shù)據(jù)類型的客戶，例如使用Transformer框架的語言模型，將通過英偉達(dá)Transformer Engine的支持獲得高達(dá)6倍的性能提升。

高性能計(jì)算客戶通過使用Amazon EC2 P5實(shí)例可以在藥物發(fā)現(xiàn)、地震分析、天氣預(yù)報(bào)和金融建模等領(lǐng)域更大規(guī)模地部署高要求的應(yīng)用程序。此外，對(duì)于使用基于動(dòng)態(tài)規(guī)劃(Dynamic Programming)算法進(jìn)行基因組測(cè)序或加速數(shù)據(jù)分析等應(yīng)用的客戶，Amazon EC2 P5將通過新的DPX指令集提供支持。

Amazon EC2 P5實(shí)例使客戶能夠探索以前看似無法解決的問題，更快地迭代解決方案，并加速進(jìn)入市場(chǎng)。

第二代Amazon EC2 UltraClusters和Elastic Fabric Adapter

Amazon EC2 P5實(shí)例為多節(jié)點(diǎn)分布式訓(xùn)練和緊密耦合的高性能計(jì)算工作負(fù)載提供先進(jìn)的橫向擴(kuò)展功能，其使用的第二代Elastic Fabric Adapter(EFA)網(wǎng)絡(luò)設(shè)備提供高達(dá)3200 Gbps的網(wǎng)絡(luò)速度，是Amazon EC2 P4d實(shí)例的8倍。

為了滿足客戶對(duì)大規(guī)模和低延遲的需求，Amazon EC2 P5實(shí)例部署在第二代Amazon EC2 UltraClusters中，該集群目前可在超過2萬個(gè)英偉達(dá)H100 Tensor Core GPU上為客戶提供更低的延遲。作為云中最大規(guī)模的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施之一，Amazon EC2 UltraClusters中的Amazon EC2 P5實(shí)例可提供高達(dá)20 exaFLOPS的聚合計(jì)算能力。

Amazon EC2 UltraClusters使用了Amazon FSx for Lustre，這是一種完全托管的共享存儲(chǔ)，構(gòu)建在常用的高性能并行文件系統(tǒng)上?？蛻敉ㄟ^Amazon FSx for Lustre，可以按需大規(guī)?？焖偬幚砗Ａ繑?shù)據(jù)集，并實(shí)現(xiàn)亞毫秒級(jí)延遲。Amazon FSx for Lustre的低延遲和高吞吐量特性經(jīng)過優(yōu)化，可在Amazon EC2 UltraCluster上為深度學(xué)習(xí)、生成式AI和高性能計(jì)算工作負(fù)載提供支持。

Amazon FSx for Lustre可以為Amazon EC2 UltraCluster中的GPU和機(jī)器學(xué)習(xí)加速器持續(xù)提供數(shù)據(jù)，從而加速最苛刻的工作負(fù)載，包括大語言模型訓(xùn)練、生成式AI推理，以及基因組學(xué)和金融風(fēng)險(xiǎn)建模等高性能計(jì)算負(fù)載。

Amazon EC2 P5實(shí)例現(xiàn)已正式可用

Amazon EC2 P5實(shí)例現(xiàn)已在以下區(qū)域正式可用：美國東部(北弗吉尼亞)和美國西部(俄勒岡)。更多信息可訪問：Amazon EC2定價(jià)和Amazon EC2 P5實(shí)例。

客戶也可以選擇亞馬遜云科技提供的各種內(nèi)置生成式AI的云服務(wù)，它們都運(yùn)行在具有成本效益的生成式AI云基礎(chǔ)設(shè)施上，助力客戶加快創(chuàng)新和重塑應(yīng)用。更多信息請(qǐng)?jiān)L問亞馬遜云科技生成式AI頁面。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

加速PCIe 5產(chǎn)品設(shè)計(jì)和測(cè)試

PCIe（Peripheral Component Interconnect Express）是為現(xiàn)代服務(wù)器和計(jì)算機(jī)添加顯卡和網(wǎng)卡等關(guān)鍵外設(shè)的首選總線，也是推動(dòng)生成式AI、全球超大規(guī)模數(shù)據(jù)中心以及其他許多領(lǐng)域發(fā)展的重要硬...

關(guān)鍵字：生成式AI 數(shù)據(jù)中心服務(wù)器

[芯鮮事]

美國又出“昏招”：擬全面限制高端GPU出口

近日，美國參議院公布了一項(xiàng)引人注目的國防政策方案，其中包含的“2025年國家人工智能保障準(zhǔn)入和創(chuàng)新法案”（簡稱GAIN AI法案）再次在全球科技領(lǐng)域掀起波瀾。

關(guān)鍵字： AI GPU

[極客網(wǎng)]

“神” 操作！英偉達(dá)斥資15億美元，租用搭載自家GPU的服務(wù)器

9 月 5 日，一則關(guān)于英偉達(dá)的商業(yè)動(dòng)態(tài)引發(fā)行業(yè)關(guān)注。這家 AI 芯片巨頭斥資 15 億美元，從人工智能小型云服務(wù)提供商 Lambda 手中，租用了搭載自家 GPU 芯片的服務(wù)器。

關(guān)鍵字：英偉達(dá) GPU 服務(wù)器 AI芯片

[通信先鋒]

國產(chǎn)5nm自研GPU已完成流片驗(yàn)證！象帝先新一代伏羲架構(gòu)官宣

9月4日消息，國產(chǎn)GPU正在井噴式爆發(fā)，現(xiàn)在又一家國產(chǎn)廠商宣布了新的成果。

關(guān)鍵字： GPU 5nm

[美通社全球TMT]

云勢(shì)數(shù)據(jù)利用亞馬遜云科技構(gòu)建新一代智能客服體系

以生成式AI驅(qū)動(dòng)客戶交互體驗(yàn)升級(jí) 北京2025年8月27日 /美通社/ -- 云勢(shì)數(shù)據(jù)基于亞馬遜云科技領(lǐng)先的云和生成式AI服務(wù)，構(gòu)建ConnectNow全渠道智能化聯(lián)絡(luò)中心，通過全渠道接入、坐席智能輔助、Agentic...

關(guān)鍵字：亞馬遜智能客服 NEC 生成式AI

[極客網(wǎng)]

斯坦福最新研究：生成式AI重創(chuàng)美國年輕人就業(yè)，初級(jí)崗位成重災(zāi)區(qū)

斯坦福大學(xué)三位經(jīng)濟(jì)學(xué)家近日聯(lián)合發(fā)布的一項(xiàng)最新研究（尚未經(jīng)過同行評(píng)議），為生成式 AI 對(duì)勞動(dòng)力市場(chǎng)的沖擊提供了最直接的 “硬數(shù)據(jù)”。

關(guān)鍵字：生成式AI AI 人工智能就業(yè)

[Cadence]

Cadence 攜手 NVIDIA 革新功耗分析技術(shù)，加速開發(fā)十億門級(jí) AI 設(shè)計(jì)

Cadence 全新 Palladium Dynamic Power Analysis 應(yīng)用程序助力 AI/ML 芯片和系統(tǒng)設(shè)計(jì)工程師打造高能效設(shè)計(jì)，縮短產(chǎn)品上市時(shí)間

關(guān)鍵字： AI ML GPU

[Rambus]

從生成式AI到代理式AI：半導(dǎo)體技術(shù)賦能下一波創(chuàng)新浪潮

AI領(lǐng)域始終在不斷演進(jìn)，我們正見證一場(chǎng)從“生成式AI”時(shí)代到“代理式AI”時(shí)代的深刻變革。這場(chǎng)變革有望重塑各行各業(yè)，并釋放前所未有的發(fā)展機(jī)遇。與此同時(shí)，這也需要我們提供更具創(chuàng)新性的技術(shù)解決方案，從而精準(zhǔn)滿足這些新興工作負(fù)...

關(guān)鍵字：生成式AI 半導(dǎo)體代理式AI

[劉巖軒]

神經(jīng)技術(shù)進(jìn)入移動(dòng)端GPU，Arm讓手游媲美PC游戲體驗(yàn)

從畫質(zhì)優(yōu)化 (NSS) 到幀率提升 (NFRU) 和光線追蹤(NSSD)，Arm 計(jì)劃覆蓋移動(dòng)端圖形處理的多個(gè)維度，推動(dòng)邊緣 AI 圖形革命。而未來通過持續(xù)的技術(shù)迭代，Arm也將保持在移動(dòng)計(jì)算領(lǐng)域的技術(shù)領(lǐng)先，滿足手游、A...

關(guān)鍵字： ARM 神經(jīng)圖形技術(shù) GPU AI ML

[Arm]

Arm 推出神經(jīng)技術(shù)，為開發(fā)者提供更智能、清晰且高效的移動(dòng)端圖形性能

Arm 控股有限公司(納斯達(dá)克股票代碼：ARM，以下簡稱 “Arm”)今日在 SIGGRAPH 上，發(fā)布 Arm 神經(jīng)技術(shù) (Arm Neural Technology)，該技術(shù)為業(yè)界首創(chuàng)，并將專用神經(jīng)加速器引入 202...

關(guān)鍵字：人工智能 GPU 神經(jīng)加速器