深度學習目前取得重大進展,解決了人工智能界的盡最大努力很多年仍沒有進展的疑難雜癥。它已經(jīng)被證明,它能夠擅長發(fā)現(xiàn)高維數(shù)據(jù)中的復雜結構,因此它能夠被應用于科學、商業(yè)和政府等領域。并且深度學習使用GPU計算具有優(yōu)異表現(xiàn),催生了各類GPU服務器,帶動了 GPU 服務器的快速發(fā)展;同時,也帶動了以服務的形式提供人工智能所需要的能力,如深度學習計算類的計算平臺,以及語音識別,人臉識別等服務,這也成為人工智能企業(yè)打造生態(tài)的重要抓手。
GPU 服務器
服務器廠商相繼推出了專為 AI 而設計的、搭載 GPU 的服務器。GPU 服務器是基于GPU 應用于視頻編解碼、深度學習、科學計算等多種場景的計算服務設備。GPU 服務器為 AI 云場景對彈性配置能力予以優(yōu)化,以增強 PCI-E 拓撲和數(shù)量配比的彈性,增加適配多種軟件框架的運算需求,可以支持 AI 模型的線下訓練和線上推理兩類場景,能夠讓 AI 模型訓練性能大化或 AI 在線推斷效能大化,一般分為4 卡,8 卡,10 卡等多種類型。 另外,英偉達等公司推出了專用的 GPU 一體機。
例如 DGX-1 系列深度學習一體機,采用定制的硬件架構,并使用 NVlink 提升了 CPU、GPU 以及內(nèi)存之間的通信速度和帶寬;同時搭載了集成了 NVIDIA開發(fā)的操作系統(tǒng),NVIDIA docker 環(huán)境和很多常用的 Framework 的Docker 鏡像,實現(xiàn)了從底層硬件到上層軟件的緊密耦合。類似的產(chǎn)品還有浪潮的 AGX-1 系列服務器。
以服務的形式提供人工智能能力成為趨勢
為了解決企業(yè)自行搭建 AI 能力時遇到的資金、技術和運維管理等方面困難,人工智能企業(yè)紛紛以服務的形式提供 AI 所需要的計算資源、平臺資源以及基礎應用能力。這類服務的意義在于一是有效推動社會智能化水平的提升,降低企業(yè)使用人工智能的成本,推動人工智能向傳統(tǒng)行業(yè)融合。
二是人工智能服務化轉型的重要基礎。服務平臺使人工智能服務和應用不再封裝于具體產(chǎn)品中,而可以在以線、隨用隨取的服務形式呈現(xiàn)。三是服務平臺成為垂直行業(yè)落地的重要基礎。近兩年,教育、醫(yī)療、金融等傳統(tǒng)行業(yè)對人工智能相關技術和應用需求的不斷提升,而服務平臺是解決技術和應用的基礎。
以服務形式提供人工智能服務主要有兩類,即平臺類的服務和軟件 API 形式的服務。
平臺類服務主要包含 GPU 云服務,深度學習平臺等,類似云服務的基礎設施即服務(Infrastructure as a Service,IaaS)和平臺即服務(Platform as a Service,PaaS)層。GPU 云服務是以虛擬機的形式,為用戶提供 GPU 計算資源,可適用于深度學習、科學計算、圖形圖像渲染、視頻解碼等應用場景。
深度學習平臺是以TensorFlow、Caffe、MXNet、Torch 等主流深度學習軟件框架為基礎,提供相應的常用深度學習算法和模型,組合各種數(shù)據(jù)源、組件模塊,讓用戶可以基于該平臺對語音、文本、圖片、視頻等海量數(shù)據(jù)進行離線模型訓練、在線模型預測及可視化模型評估。
軟件 API 服務主要分為智能語音語類服務和計算機視覺服務。其中智能語音語類服務主要提供語音語義相關的在線服務,可包括語音識別、語音合成、聲紋識別、語音聽轉寫等。計算機視覺類服務主要提供物體檢測、人臉識別、人臉檢測、圖像識別、光學字符識別(Optical Character RecogniTIon,OCR)識別、智能鑒黃等服務。?