英特爾人工智能藍圖模型訓(xùn)練和推理技術(shù)落地
聚焦轉(zhuǎn)折性技術(shù),成立AI創(chuàng)新院:揭秘英特爾人工智能藍圖
機器之心原創(chuàng) 作者:李澤南 人工智能應(yīng)用已經(jīng)越來越多地出現(xiàn)在了我們的生活當中,但AI對于算力的無盡需求與芯片制程提升的瓶頸正逐漸成為擺在眼前的挑戰(zhàn)。未來AI技術(shù)的發(fā)展需要硬件與軟件架構(gòu)共同結(jié)合并進行革新。 6 月 20 日,由 OReilly 與英特爾共同舉辦
機器之心原創(chuàng)
作者:李澤南
人工智能應(yīng)用已經(jīng)越來越多地出現(xiàn)在了我們的生活當中,但AI對于算力的無盡需求與芯片制程提升的瓶頸正逐漸成為擺在眼前的挑戰(zhàn)。未來AI技術(shù)的發(fā)展需要硬件與軟件架構(gòu)共同結(jié)合并進行革新。
6 月 20 日,由 O'Reilly 與英特爾共同舉辦的人工智能大會終于進入了主題演講環(huán)節(jié)。當日上午,英特爾架構(gòu)圖形與軟件集團副總裁、數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅發(fā)表了主題演講,向我們介紹了英特爾在軟硬件結(jié)合加速 AI 應(yīng)用方面的成果與未來展望。
“我們正處在一個數(shù)據(jù)變革的時代,人類歷史上 90% 的數(shù)據(jù)都是在過去幾年產(chǎn)生的,其中 50% 的數(shù)據(jù)更是在最近兩年內(nèi)生成的,”馬子雅在大會上說道。“但到目前為止,只有 2% 的數(shù)據(jù)被真正分析過。這其中最主要的原因就是這些新興技術(shù),如人工智能從實驗室到最終落地,還有很多問題需要解決?!?/p>
馬子雅在大會上發(fā)表演講。
讓 AI 真正解決生產(chǎn)問題
人工智能
的應(yīng)用并不是簡單地執(zhí)行算法。以智慧生產(chǎn)為例,制造商可以在生產(chǎn)線上利用深度學(xué)習(xí),尤其是圖像識別,將產(chǎn)品的質(zhì)量檢測自動化。如自動檢測產(chǎn)品表面缺陷、零部件的缺失、標簽的錯位。已有很多實踐證明,相比人工檢測,智慧檢測可以大幅提高生產(chǎn)效率,并降低成本。但智慧檢測只有深度學(xué)習(xí)是遠遠不夠的,它需要一條完整的數(shù)據(jù)分析流水線才能夠真正落地。
這條流水線遵循這樣的步驟:
第一步,從生產(chǎn)線上收集大量原始數(shù)據(jù);
第二步,對原始數(shù)據(jù)進行大量清理和預(yù)處理,濾出數(shù)據(jù)噪音,查補缺失,校正錯誤;
第三步,利用數(shù)據(jù)進行分析、機器學(xué)習(xí)、深度學(xué)習(xí)對于清理過的數(shù)據(jù)進行歸納總結(jié),并把有質(zhì)量問題的場景從生產(chǎn)線上排除出去;
最終把分析可視化。
只有實現(xiàn)了這四步,智慧生產(chǎn)、智慧檢測才能落地。
“人工智能要走出實驗室、實現(xiàn)落地,需要一個完整的數(shù)據(jù)分析流水線,”馬子雅說道,“這個流水線的 20% 可能是在做深度學(xué)習(xí),但是 80% 都是在做數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理等等,這是為什么早前我們開源了 BigDL 的重要原因。”
BigDL 是英特爾基于 Spark 平臺的深度學(xué)習(xí)框架。它的功能與流行的深度學(xué)習(xí)框架,如 TensorFlow、Caffe、Torch 功能相同。重要是,它構(gòu)建在成熟的 Spark 數(shù)據(jù)分析平臺之上,可以為客戶提供端到端的從數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理、數(shù)據(jù)管理、機器學(xué)習(xí)、深度學(xué)習(xí),以及最終的可視化等服務(wù)。在過去兩年的時間,已經(jīng)有很多英特爾的客戶利用 BigDL 和 Spark 將人工智能落地。
是否可以把 TensorFlow 和 Spark 進行整合實現(xiàn)落地?英特爾對此開源了 Analytics Zoo。這一工具能夠在完整、成熟的 Spark 數(shù)據(jù)平臺之上支持不同深度學(xué)習(xí)框架,如 TensorFlow、Keras、BigDL 等等。除此之外它還提供深度學(xué)習(xí)預(yù)訓(xùn)練的模型,如圖像分析模型,文本處理文本匹配模型,異常檢測模型等等。它也提供非常簡單易用的 API。因為 AnalyTIcs Zoo 是構(gòu)建在 Spark 集群之上,它可以進行分布式模型訓(xùn)練和推理。
這些軟件工具也可以和英特爾最新的硬件技術(shù)相結(jié)合,獲得更高的效率?!霸谶^去幾個月里,我們把 AnalyTIcs Zoo 在英特爾最新的 Optane(傲騰)內(nèi)存技術(shù)上和 OpenVINO 技術(shù)上進行優(yōu)化。這一過程可以將深度學(xué)習(xí)、模型訓(xùn)練以及推理性能提升更多,”馬子雅介紹道。
AI 是轉(zhuǎn)折性技術(shù)
隨著機器學(xué)習(xí)等新技術(shù)的快速發(fā)展,越來越多的科技公司正在涌現(xiàn),對于英特爾這樣“久經(jīng)沙徹的玩家而言,如何保持自己的領(lǐng)導(dǎo)地位是首要問題,這家公司尋求的解決方案是大膽創(chuàng)新。
2019 年 1 月,英特爾迎來了新任首席執(zhí)行官 Bob Swan(司睿博),他在上任首日致英特爾員工、客戶與合作伙伴的公開信中就提到:“我們的抱負從未如此之大,在這個越來越以數(shù)據(jù)驅(qū)動的世界里,所有的數(shù)據(jù)都需要被處理、傳輸、存儲和分析。對此,我們必須持續(xù)進擊,銳意創(chuàng)新。”
Bob 認為,人工智能、5 G和自動駕駛對于數(shù)據(jù)的需求正日益增長,英特爾需要專注于引領(lǐng)這些轉(zhuǎn)折性技術(shù)的發(fā)展:“我們相信,面向未來更加廣闊的市場機遇,英特爾能夠在助力客戶成功方面扮演一個更加重要的角色。我們將著重于改進執(zhí)行力,加速創(chuàng)新,發(fā)展我們強大的文化,并通過嚴謹?shù)耐顿Y實現(xiàn)盈利增長?!?/p>
英特爾 CEOBob Swan (司睿博)
英特爾預(yù)計,的總體潛在市場規(guī)模正以 25% 的復(fù)合年增長率擴張。預(yù)計到 2023 年,整個市場的規(guī)模將達到 100 億美元。2018 年,英特爾獲得了全部約 40 億美元機會中的大約 40%,實現(xiàn)了 17 億美元的 AI 收入。
“英特爾遵循客戶至上 (customer obsession),致力于把最好的技術(shù)提供給用戶”馬子雅表示。“英特爾在開源方面有很多貢獻,我們希望以此能讓自己的技術(shù)在 CSP、ISP、OEM 中間被廣泛應(yīng)用。而在硬件層面上,我們致力于提供完整的解決方案?!?/p>
在 AI 大會的演講中,馬子雅以美的為例介紹了人工智能完整工作流優(yōu)化的重要性:工廠在生產(chǎn)線上需要對產(chǎn)品質(zhì)量進行檢測。人工檢測通常不能達到美的所需的質(zhì)量檢測和檢測率。在英特爾與美的的合作中,開發(fā)者們在常規(guī)服務(wù)器集群上利用 AnalyTIcs Zoo 構(gòu)建了完整的數(shù)據(jù)分析和 AI 解決方案,其將 TensorFlow 和 BigDL 整合在了 Spark 集群之上,不僅可以進行分布式的模型訓(xùn)練和推理,也可以提供完整的數(shù)據(jù)分析。
這一系統(tǒng)可以將圖像預(yù)處理的速度提升 4 倍,延遲由 200 毫秒降低到了 50 毫秒;也將推理速度提升了 16 倍:從原來的 2 秒降低到了 124 毫秒。相比人工檢測,美的的質(zhì)量解決方案,更精準、更快捷、更自動,并且避免了人工檢測對生產(chǎn)行程可能帶來的破壞。
英特爾在 AI 生態(tài)中已經(jīng)占據(jù)了一席之地。目前,國內(nèi)前七大云服務(wù)供應(yīng)商都已與這家公司展開了合作。而在終端客戶方面,英特爾去年有 30 個客戶,目前為止已經(jīng)有50個,且還在增長中。
“如果不能用于生產(chǎn)實踐,人工智能就是沒有任何價值的,”馬子雅表示?!拔覀冃枰蚱评碚摵蛯嵺`的壁壘。現(xiàn)在的 AI 在預(yù)測分析和云端已有很多應(yīng)用了。但 AI 在高性能計算(HPC)上還有很多發(fā)展空間?!?/p>
打破理論與現(xiàn)實的壁壘
英特爾正在試圖實現(xiàn)完整的 AI 應(yīng)用堆棧,近年來它已開放了深度學(xué)習(xí)框架 BigDL、AnalyTIcs Zoo 等工具。去年底,這家公司更是提出了 One API 概念,該項目旨在提供一個統(tǒng)一的編程模型,以簡化跨不同計算架構(gòu)的應(yīng)用程序開發(fā)工作。
“我們的垂直化堆棧從硬件到操作系統(tǒng),再到上層應(yīng)用,整合了生產(chǎn)流程中所需的所有技術(shù),可以打通硬件架構(gòu)的優(yōu)化,”英特爾高級首席工程師、大數(shù)據(jù)技術(shù)全球 CTO 戴金權(quán)表示,“在 Spark 上進行機器學(xué)習(xí)訓(xùn)練,我們的方法可以提供高達 8 倍的性能提升。如果優(yōu)化僅限于各個部分,我們無法實現(xiàn)這樣大的優(yōu)勢。通過全棧軟件技術(shù)(Vertical stack)我們可以讓用戶得到更好的性能和算力。”
對于開發(fā)者來說,數(shù)據(jù)清洗與特征生成是一個非常繁瑣的過程。英特爾希望通過自身努力不斷降低 AI 開發(fā)的門檻。據(jù)悉,在 Analytics Zoo 中很快也將加入 AutoML 等功能。
英特爾目前的軟件產(chǎn)品堆棧。
雖然在人們的印象中,英特爾是一家芯片公司,但實際上它已在軟件領(lǐng)域耕耘多年這家公司現(xiàn)在擁有 15,000 余名軟件工程師。
“我們不止是在做 AI 軟件,AI 的應(yīng)用還需要很多工作,”馬子雅介紹道?!拔覀儠γ恳粚榆浖膬?yōu)化,盡可能擠出硬件的全部性能。最終所有的軟件加起來,可以提升 8 倍,而不是 1-2 倍。常規(guī)的高性能計算(HPC)架構(gòu)已經(jīng)被人們使用很多年了,AI 則是新發(fā)展出來的架構(gòu)。如何把舊架構(gòu)和新架構(gòu)統(tǒng)一結(jié)合起來是我們面臨的挑戰(zhàn)。目前看來,數(shù)據(jù)分析和 HPC 的整合趨勢已經(jīng)越來越明顯了?!?/p>
在大會上,英特爾還宣布成立了“大數(shù)據(jù)分析和人工智能創(chuàng)新院”,由戴金權(quán)任院長。此舉旨在吸引公司與學(xué)界、業(yè)界的更多合作。
以前的創(chuàng)新機構(gòu)通常會進行點對點的合作,我們成立的新機構(gòu)希望能夠與全球生態(tài)中的成員有更廣泛的合作。其中包括終端客戶、合作伙伴、開源社區(qū)、學(xué)術(shù)界。這是與此前其他合作方式的不同?!瘪R子雅表示。
據(jù)介紹,這所創(chuàng)新院的工作將主要集中在三個方面:
加速人工智能在中國市場的落地,通過 AI 與數(shù)據(jù)分析的整合來加速落地;
解決中國市場的最新需求,引領(lǐng)創(chuàng)新用法、創(chuàng)新算法;
幫助中國市場更好地使用英特爾最新的軟件和硬件技術(shù)。
英特爾希望通過此舉進使得更多的企業(yè)和個人得益于最新技術(shù)進步,使人工智能真正的做到普惠。
“人工智能業(yè)務(wù)的需求牢牢地根植于數(shù)據(jù),利用大數(shù)據(jù)獲取更多的洞察需要完整而全面的戰(zhàn)略,只有充分利用以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),充分利用將數(shù)據(jù)分析與人工智能無縫銜接起來的軟件技術(shù),才能獲得成功?!瘪R子雅表示。