深度學(xué)習(xí)完整解決方案 可節(jié)省80%開發(fā)時(shí)間
不只軟、硬件廠商,許多云端服務(wù)商也紛紛卡位人工智能(AI)市場,但競爭白熱化對于開發(fā)者來說倒也不是一件壞事,再加上大廠之間互相合作,這也促使整個(gè)AI生態(tài)系走向開放的型態(tài),至少在市場上,資源會來越豐富與完整,從而降低開發(fā)者的入門門檻。
資源缺乏集成性 容易讓開發(fā)出現(xiàn)斷層雖然市場上已有相當(dāng)充足的資源供開發(fā)者使用,說來簡單,但實(shí)際上要投入開發(fā)卻也不簡單。在深度學(xué)習(xí)復(fù)雜龐大的知識體系下,開發(fā)者難以專精于每種技術(shù)層面,就好比擅長對大數(shù)據(jù)進(jìn)行整理與分析的人,對于最底層運(yùn)算環(huán)境中的硬件架構(gòu)、IT技術(shù)知之甚少。
一個(gè)擁有資料科學(xué)背景的人尚可自己訓(xùn)練一個(gè)深度學(xué)習(xí)模型,畢竟市場上有許多流行的深度學(xué)習(xí)開源框架可以使用,象是Tensor Flow、Caffe、CNTK、Theano等,這些框架都各有自己的優(yōu)缺點(diǎn)。
加上過去由史丹佛大學(xué)(Stanford University)舉辦ImageNet圖象識別競賽中,包括Google、微軟(Microsoft)、百度等大型企業(yè)除了爭奪圖象識別寶座外,也會藉此機(jī)會同時(shí)測試自家系統(tǒng)的效能與極限,因此在比賽過程中,透過自家的深度學(xué)習(xí)框架訓(xùn)練出一些新的神經(jīng)網(wǎng)絡(luò)算法,這些資源經(jīng)過大廠的「監(jiān)定」與「驗(yàn)證」,開發(fā)者若有需求都可取之。
利用已成熟的資源投入模型的訓(xùn)練不難,但若開發(fā)者要再往下探究到更底層的運(yùn)算環(huán)境,包括選擇合適的硬件組裝,或是建立基礎(chǔ)運(yùn)算環(huán)境時(shí),情況就變得更復(fù)雜了。研華智能系統(tǒng)事業(yè)群協(xié)理劉厚儀觀察,過去在深度學(xué)習(xí)的開發(fā)環(huán)境中,由于各技術(shù)層面之間壁壘分明,資源更難以集成。
就算開發(fā)者想對外尋求協(xié)助,在市場上也缺乏一套較完整的解決方案可以透過一次性的導(dǎo)入,解決系統(tǒng)建置所耗費(fèi)的繁瑣工程,以及軟件開發(fā)的設(shè)計(jì),這讓如SI的業(yè)者很容易在建立最基礎(chǔ)的運(yùn)算系統(tǒng)過程中止步,迫使開發(fā)進(jìn)程出現(xiàn)斷層。
深度學(xué)習(xí)完整解決方案 縮短開發(fā)時(shí)間、提高效率因此,集成性的設(shè)備對于縮短系統(tǒng)建置時(shí)間至關(guān)重要。市場上最具有代表性的是NVIDIA在2016年所推出的DGX-1,當(dāng)中便結(jié)合了硬件、深度學(xué)習(xí)軟件、程序開發(fā)工具軟件等,是全球第一款專為AI分析所打造的集成性設(shè)備。
DGX-1集成基礎(chǔ)運(yùn)算環(huán)境所需的資源與工具,用以減少系統(tǒng)集成與軟件工程設(shè)計(jì)所需的時(shí)間,有了這樣的設(shè)備,企業(yè)能快速、簡易地部署相關(guān)的運(yùn)算環(huán)境。不過DGX-1造價(jià)不斐,尤其對小規(guī)模的企業(yè)或是個(gè)人開發(fā)者而言,基于成本的考量很容易望之卻步。
所幸研華也發(fā)現(xiàn)市場上面臨資源分散、系統(tǒng)難以集成的問題,為了降低業(yè)者在建置訓(xùn)練系統(tǒng)的復(fù)雜性與技術(shù)門檻,研華近年也積極投入人工智能市場,并攜手大廠技術(shù)合作,開發(fā)深度學(xué)習(xí)完整解決方案。
研華將訓(xùn)練系統(tǒng)中最底層包括硬件設(shè)備、深度學(xué)習(xí)軟件開發(fā)套件、模型訓(xùn)練平臺等基礎(chǔ)運(yùn)算環(huán)境所需的資源集成起來,藉此除了協(xié)助業(yè)者加速訓(xùn)練系統(tǒng)的建置,縮減人力和時(shí)間成本外,亦能讓諸如SI的業(yè)者能投入更多資源專注于解決終端使用者的需求。
開發(fā)者唯一要做的事,便是「搜集資料、整理資料」如此簡單,而最繁瑣的系統(tǒng)建置工程,未來都能透過市場上完整部署的解決方案來完成。這也是為什么研華積極從投入人工智能市場、攜手大廠集成最底層運(yùn)算資源的原因,「目的即是讓開發(fā)者將有限的開發(fā)時(shí)間,投入在最具有價(jià)值的資料處理與分析上?!寡腥A智能系統(tǒng)事業(yè)群協(xié)理鮑志偉如此強(qiáng)調(diào)。
然而,「訓(xùn)練」只是深度學(xué)習(xí)的開始,更大的挑戰(zhàn)是接下來如何將深度學(xué)習(xí)技術(shù)實(shí)際運(yùn)用到各種場景中進(jìn)行預(yù)測和分析,而這部份的關(guān)鍵則是終端的推理系統(tǒng)。各種終端應(yīng)用場景象是交通運(yùn)輸、機(jī)器人、醫(yī)療保健和公共安全等,而每個(gè)應(yīng)用場景實(shí)際上也面臨一些特殊需求。
例如在交通場景需要極度安全且可靠的硬件設(shè)備進(jìn)行感知、在公共安全領(lǐng)域則需要質(zhì)量穩(wěn)定的攝影鏡頭以維持可靠的執(zhí)行效率,同樣地,在苛刻和嚴(yán)峻的應(yīng)用環(huán)境中也面臨各種挑戰(zhàn)。因此,若業(yè)者無法如實(shí)掌握產(chǎn)業(yè)端的特性,在系統(tǒng)建構(gòu)的第一步便容易卡關(guān)、遇到阻礙。
這對于在產(chǎn)業(yè)深耕已久的研華來說,除了擁有積累多年的產(chǎn)業(yè)Know-how外,更能比一般業(yè)者熟悉市場客戶的需求。研華也在市場上提供以產(chǎn)業(yè)端需求為中心所設(shè)計(jì)的推理系統(tǒng),以加速AI在終端應(yīng)用場景中落地。
象是在研華所開發(fā)的IVA(Intelligent Video Analysis)推理系統(tǒng)中,使用者便可透過內(nèi)含多種智能影像分析功能,包括移動(dòng)偵測、人臉偵測、人群密度偵測等,將其快速導(dǎo)入到AI應(yīng)用的開發(fā)中。而研華完整的深度學(xué)習(xí)解決方案不僅包括前端所需的訓(xùn)練服務(wù)器,也集成終端推論環(huán)境所需的資料存儲設(shè)備、網(wǎng)絡(luò)設(shè)備等。
80%時(shí)間都耗在開發(fā)前資料處理前百度首席科學(xué)家吳恩達(dá)曾把深度學(xué)習(xí)比喻成一個(gè)火箭。在火箭的結(jié)構(gòu)中,推進(jìn)火箭最重要的部分就是引擎,而目前在深度學(xué)習(xí)這個(gè)領(lǐng)域里,引擎的核心就是神經(jīng)網(wǎng)絡(luò)。而火箭除了引擎外,還需要有燃料,那么大數(shù)據(jù)便是構(gòu)成火箭的重要組成部分─燃料。
大數(shù)據(jù)對于深度學(xué)習(xí)的發(fā)展與推進(jìn)至關(guān)重要。研華智能系統(tǒng)事業(yè)群協(xié)理鮑志偉認(rèn)為,驅(qū)動(dòng)人工智能的核心便是來自于大數(shù)據(jù)資料,一旦獲取的數(shù)據(jù)量越多,便能藉此優(yōu)化訓(xùn)練模型,讓模型的推理與分析更佳精準(zhǔn)。不過,具有分析價(jià)值的數(shù)據(jù)必然事先經(jīng)過整理,否則最終只是「Garbage in, garbage out」。
然而,處理數(shù)據(jù)非常消耗人力與時(shí)間,以往由于缺乏資料處理工具,通常開發(fā)者在訓(xùn)練模型的過程中,會花費(fèi)將近80%的時(shí)間在資料處理,象是整理或收集資料組合、10%的時(shí)間在運(yùn)算,而10%的時(shí)間則在優(yōu)化模型。
消耗大量的資料處理時(shí)間會拖慢開發(fā)進(jìn)度,而市場也試圖解決這個(gè)惱人的問題。象是在研華的深度學(xué)習(xí)超級工作站中,因其內(nèi)建自動(dòng)卷標(biāo)工具,開發(fā)者唯一需要做得便是檢查卷標(biāo)是否正確,因而開發(fā)者在資料處理工具的輔助下,便能有效地節(jié)省80%的資料處理時(shí)間。
AI開發(fā)走向平民化人工智能之所以掀起熱潮,除了歸功于硬件運(yùn)算能力的提升、類神經(jīng)網(wǎng)絡(luò)算法的突破外,云端服務(wù)的興起也讓系統(tǒng)建置成本大幅降低。在云端建置訓(xùn)練與推論系統(tǒng)的好處除了不需花費(fèi)大量成本建構(gòu)實(shí)體機(jī)外,還可以相當(dāng)彈性地選擇擴(kuò)充或減少部署。
開發(fā)者現(xiàn)今可以透過各種云端服務(wù)商來建置訓(xùn)練、或是推論系統(tǒng),也可以選擇直接在終端環(huán)境中部署。但基本上,選擇在終端的成本無疑是最昂貴的,原則上有點(diǎn)像買斷與租用的區(qū)別。若是在終端建置推論系統(tǒng),由于需配合產(chǎn)業(yè)端的特性與需求,這對業(yè)者來說仍有一定的門檻。
現(xiàn)今市場上的云端平臺除了提供運(yùn)算資源,更打包好包括基礎(chǔ)設(shè)施、儲存空間及各種API等整套服務(wù)。目前市場上較知名的云端運(yùn)算服務(wù)有AWS EC2、Azure或GCP平臺。
亞馬遜AWS由于創(chuàng)立較早,和其它平臺相比擁有先發(fā)優(yōu)勢,如今提供的運(yùn)算、儲存、資料庫、分析、應(yīng)用程序服務(wù)等超過70種,覆蓋面極廣,自然成為用戶首選;而微軟于2010年成立的Azure也不惶多讓,擁有67項(xiàng)服務(wù),與微軟的產(chǎn)品結(jié)合度高;GCP則挾帶Google本身在人工智能領(lǐng)域的優(yōu)勢,以低價(jià)策略搶食市場大餅;而IBM的Bluemix則釋出許多人工智能API。