AI效率260倍CPU:阿里雙11大規(guī)模部署NVIDIA GPU
一年一度的雙11、雙12購物狂歡都已經(jīng)過去,而在蘇州舉辦的GTC CHINA 2019大會上,NVIDIA和阿里巴巴共同透露了一個小“秘密”—;—;原來,雙11 2684億元創(chuàng)紀(jì)錄成交額的背后,離不開NVIDIA GPU的大規(guī)模部署。
阿里巴巴異構(gòu)計算總監(jiān)徐凌杰表示,每天有超過1億購物者在阿里網(wǎng)站上瀏覽數(shù)十億種商品,在購物高峰日,阿里的系統(tǒng)每秒需要處理數(shù)十萬個查詢,而能夠保證了這一切都能正常運行,正是AI 的功勞。
阿里引入了NVIDIA加速計算平臺,大規(guī)模部署先進的AI技術(shù),包括Tesla T4 GPU、cuBLAS運算庫、自定義混合精度、推理加速軟件等,通過其直觀的搜索功能和可靠的推薦,能夠支持比過去復(fù)雜6倍的模型,從而使點擊率提高10%。
據(jù)悉,相比于CPU,Tesla T4將最大模型的吞吐量提高了100倍,能夠為阿里廣泛、深入的推薦模型提供加速,每秒可處理780個查詢,而基于CPU的推理每秒只能處理3個,效率差了足足260倍。
對電商來說,推薦系統(tǒng)是至關(guān)重要的應(yīng)用程序,可以向用戶展示與其喜好相匹配的商品,從而提高點擊率,而點擊率的每一次小幅提高,都會直接影響用戶的體驗和商家的營收。使用能夠?qū)崟r大規(guī)模運行的先進推薦系統(tǒng)模型使點擊率提高10%,目前這只能通過GPU實現(xiàn)。
據(jù)介紹,阿里使用NVIDIA GPU支持資源分配、模型量化和圖變換三項優(yōu)化策略,從而提高吞吐量和響應(yīng)性,還部署NVIDIA GPU為各類系統(tǒng)提速,包括自動廣告橫幅生成、廣告推薦、幫助識別假冒產(chǎn)品的圖像處理、語言翻譯、語音識別等系統(tǒng)。
除了阿里云,百度、字節(jié)跳動、滴滴、快手、美團點評、平安科技、搜狗、騰訊、小米等中國科技巨頭的云服務(wù)也都部署著NVIDIA GPU。