英特爾人工智能藍(lán)圖模型訓(xùn)練和推理技術(shù)落地
聚焦轉(zhuǎn)折性技術(shù),成立AI創(chuàng)新院:揭秘英特爾人工智能藍(lán)圖
機(jī)器之心原創(chuàng) 作者:李澤南 人工智能應(yīng)用已經(jīng)越來(lái)越多地出現(xiàn)在了我們的生活當(dāng)中,但AI對(duì)于算力的無(wú)盡需求與芯片制程提升的瓶頸正逐漸成為擺在眼前的挑戰(zhàn)。未來(lái)AI技術(shù)的發(fā)展需要硬件與軟件架構(gòu)共同結(jié)合并進(jìn)行革新。 6 月 20 日,由 OReilly 與英特爾共同舉辦
機(jī)器之心原創(chuàng)
作者:李澤南
人工智能應(yīng)用已經(jīng)越來(lái)越多地出現(xiàn)在了我們的生活當(dāng)中,但AI對(duì)于算力的無(wú)盡需求與芯片制程提升的瓶頸正逐漸成為擺在眼前的挑戰(zhàn)。未來(lái)AI技術(shù)的發(fā)展需要硬件與軟件架構(gòu)共同結(jié)合并進(jìn)行革新。
6 月 20 日,由 O'Reilly 與英特爾共同舉辦的人工智能大會(huì)終于進(jìn)入了主題演講環(huán)節(jié)。當(dāng)日上午,英特爾架構(gòu)圖形與軟件集團(tuán)副總裁、數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅發(fā)表了主題演講,向我們介紹了英特爾在軟硬件結(jié)合加速 AI 應(yīng)用方面的成果與未來(lái)展望。
“我們正處在一個(gè)數(shù)據(jù)變革的時(shí)代,人類歷史上 90% 的數(shù)據(jù)都是在過去幾年產(chǎn)生的,其中 50% 的數(shù)據(jù)更是在最近兩年內(nèi)生成的,”馬子雅在大會(huì)上說(shuō)道?!暗侥壳盀橹梗挥?2% 的數(shù)據(jù)被真正分析過。這其中最主要的原因就是這些新興技術(shù),如人工智能從實(shí)驗(yàn)室到最終落地,還有很多問題需要解決?!?/p>
馬子雅在大會(huì)上發(fā)表演講。
讓 AI 真正解決生產(chǎn)問題
人工智能
的應(yīng)用并不是簡(jiǎn)單地執(zhí)行算法。以智慧生產(chǎn)為例,制造商可以在生產(chǎn)線上利用深度學(xué)習(xí),尤其是圖像識(shí)別,將產(chǎn)品的質(zhì)量檢測(cè)自動(dòng)化。如自動(dòng)檢測(cè)產(chǎn)品表面缺陷、零部件的缺失、標(biāo)簽的錯(cuò)位。已有很多實(shí)踐證明,相比人工檢測(cè),智慧檢測(cè)可以大幅提高生產(chǎn)效率,并降低成本。但智慧檢測(cè)只有深度學(xué)習(xí)是遠(yuǎn)遠(yuǎn)不夠的,它需要一條完整的數(shù)據(jù)分析流水線才能夠真正落地。
這條流水線遵循這樣的步驟:
第一步,從生產(chǎn)線上收集大量原始數(shù)據(jù);
第二步,對(duì)原始數(shù)據(jù)進(jìn)行大量清理和預(yù)處理,濾出數(shù)據(jù)噪音,查補(bǔ)缺失,校正錯(cuò)誤;
第三步,利用數(shù)據(jù)進(jìn)行分析、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)對(duì)于清理過的數(shù)據(jù)進(jìn)行歸納總結(jié),并把有質(zhì)量問題的場(chǎng)景從生產(chǎn)線上排除出去;
最終把分析可視化。
只有實(shí)現(xiàn)了這四步,智慧生產(chǎn)、智慧檢測(cè)才能落地。
“人工智能要走出實(shí)驗(yàn)室、實(shí)現(xiàn)落地,需要一個(gè)完整的數(shù)據(jù)分析流水線,”馬子雅說(shuō)道,“這個(gè)流水線的 20% 可能是在做深度學(xué)習(xí),但是 80% 都是在做數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理等等,這是為什么早前我們開源了 BigDL 的重要原因?!?/p>
BigDL 是英特爾基于 Spark 平臺(tái)的深度學(xué)習(xí)框架。它的功能與流行的深度學(xué)習(xí)框架,如 TensorFlow、Caffe、Torch 功能相同。重要是,它構(gòu)建在成熟的 Spark 數(shù)據(jù)分析平臺(tái)之上,可以為客戶提供端到端的從數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理、數(shù)據(jù)管理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí),以及最終的可視化等服務(wù)。在過去兩年的時(shí)間,已經(jīng)有很多英特爾的客戶利用 BigDL 和 Spark 將人工智能落地。
是否可以把 TensorFlow 和 Spark 進(jìn)行整合實(shí)現(xiàn)落地?英特爾對(duì)此開源了 Analytics Zoo。這一工具能夠在完整、成熟的 Spark 數(shù)據(jù)平臺(tái)之上支持不同深度學(xué)習(xí)框架,如 TensorFlow、Keras、BigDL 等等。除此之外它還提供深度學(xué)習(xí)預(yù)訓(xùn)練的模型,如圖像分析模型,文本處理文本匹配模型,異常檢測(cè)模型等等。它也提供非常簡(jiǎn)單易用的 API。因?yàn)?AnalyTIcs Zoo 是構(gòu)建在 Spark 集群之上,它可以進(jìn)行分布式模型訓(xùn)練和推理。
這些軟件工具也可以和英特爾最新的硬件技術(shù)相結(jié)合,獲得更高的效率?!霸谶^去幾個(gè)月里,我們把 AnalyTIcs Zoo 在英特爾最新的 Optane(傲騰)內(nèi)存技術(shù)上和 OpenVINO 技術(shù)上進(jìn)行優(yōu)化。這一過程可以將深度學(xué)習(xí)、模型訓(xùn)練以及推理性能提升更多,”馬子雅介紹道。
AI 是轉(zhuǎn)折性技術(shù)
隨著機(jī)器學(xué)習(xí)等新技術(shù)的快速發(fā)展,越來(lái)越多的科技公司正在涌現(xiàn),對(duì)于英特爾這樣“久經(jīng)沙徹的玩家而言,如何保持自己的領(lǐng)導(dǎo)地位是首要問題,這家公司尋求的解決方案是大膽創(chuàng)新。
2019 年 1 月,英特爾迎來(lái)了新任首席執(zhí)行官 Bob Swan(司睿博),他在上任首日致英特爾員工、客戶與合作伙伴的公開信中就提到:“我們的抱負(fù)從未如此之大,在這個(gè)越來(lái)越以數(shù)據(jù)驅(qū)動(dòng)的世界里,所有的數(shù)據(jù)都需要被處理、傳輸、存儲(chǔ)和分析。對(duì)此,我們必須持續(xù)進(jìn)擊,銳意創(chuàng)新?!?/p>
Bob 認(rèn)為,人工智能、5 G和自動(dòng)駕駛對(duì)于數(shù)據(jù)的需求正日益增長(zhǎng),英特爾需要專注于引領(lǐng)這些轉(zhuǎn)折性技術(shù)的發(fā)展:“我們相信,面向未來(lái)更加廣闊的市場(chǎng)機(jī)遇,英特爾能夠在助力客戶成功方面扮演一個(gè)更加重要的角色。我們將著重于改進(jìn)執(zhí)行力,加速創(chuàng)新,發(fā)展我們強(qiáng)大的文化,并通過嚴(yán)謹(jǐn)?shù)耐顿Y實(shí)現(xiàn)盈利增長(zhǎng)?!?/p>
英特爾 CEOBob Swan (司睿博)
英特爾預(yù)計(jì),的總體潛在市場(chǎng)規(guī)模正以 25% 的復(fù)合年增長(zhǎng)率擴(kuò)張。預(yù)計(jì)到 2023 年,整個(gè)市場(chǎng)的規(guī)模將達(dá)到 100 億美元。2018 年,英特爾獲得了全部約 40 億美元機(jī)會(huì)中的大約 40%,實(shí)現(xiàn)了 17 億美元的 AI 收入。
“英特爾遵循客戶至上 (customer obsession),致力于把最好的技術(shù)提供給用戶”馬子雅表示?!坝⑻貭栐陂_源方面有很多貢獻(xiàn),我們希望以此能讓自己的技術(shù)在 CSP、ISP、OEM 中間被廣泛應(yīng)用。而在硬件層面上,我們致力于提供完整的解決方案。”
在 AI 大會(huì)的演講中,馬子雅以美的為例介紹了人工智能完整工作流優(yōu)化的重要性:工廠在生產(chǎn)線上需要對(duì)產(chǎn)品質(zhì)量進(jìn)行檢測(cè)。人工檢測(cè)通常不能達(dá)到美的所需的質(zhì)量檢測(cè)和檢測(cè)率。在英特爾與美的的合作中,開發(fā)者們?cè)诔R?guī)服務(wù)器集群上利用 AnalyTIcs Zoo 構(gòu)建了完整的數(shù)據(jù)分析和 AI 解決方案,其將 TensorFlow 和 BigDL 整合在了 Spark 集群之上,不僅可以進(jìn)行分布式的模型訓(xùn)練和推理,也可以提供完整的數(shù)據(jù)分析。
這一系統(tǒng)可以將圖像預(yù)處理的速度提升 4 倍,延遲由 200 毫秒降低到了 50 毫秒;也將推理速度提升了 16 倍:從原來(lái)的 2 秒降低到了 124 毫秒。相比人工檢測(cè),美的的質(zhì)量解決方案,更精準(zhǔn)、更快捷、更自動(dòng),并且避免了人工檢測(cè)對(duì)生產(chǎn)行程可能帶來(lái)的破壞。
英特爾在 AI 生態(tài)中已經(jīng)占據(jù)了一席之地。目前,國(guó)內(nèi)前七大云服務(wù)供應(yīng)商都已與這家公司展開了合作。而在終端客戶方面,英特爾去年有 30 個(gè)客戶,目前為止已經(jīng)有50個(gè),且還在增長(zhǎng)中。
“如果不能用于生產(chǎn)實(shí)踐,人工智能就是沒有任何價(jià)值的,”馬子雅表示?!拔覀冃枰蚱评碚摵蛯?shí)踐的壁壘?,F(xiàn)在的 AI 在預(yù)測(cè)分析和云端已有很多應(yīng)用了。但 AI 在高性能計(jì)算(HPC)上還有很多發(fā)展空間?!?/p>
打破理論與現(xiàn)實(shí)的壁壘
英特爾正在試圖實(shí)現(xiàn)完整的 AI 應(yīng)用堆棧,近年來(lái)它已開放了深度學(xué)習(xí)框架 BigDL、AnalyTIcs Zoo 等工具。去年底,這家公司更是提出了 One API 概念,該項(xiàng)目旨在提供一個(gè)統(tǒng)一的編程模型,以簡(jiǎn)化跨不同計(jì)算架構(gòu)的應(yīng)用程序開發(fā)工作。
“我們的垂直化堆棧從硬件到操作系統(tǒng),再到上層應(yīng)用,整合了生產(chǎn)流程中所需的所有技術(shù),可以打通硬件架構(gòu)的優(yōu)化,”英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球 CTO 戴金權(quán)表示,“在 Spark 上進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,我們的方法可以提供高達(dá) 8 倍的性能提升。如果優(yōu)化僅限于各個(gè)部分,我們無(wú)法實(shí)現(xiàn)這樣大的優(yōu)勢(shì)。通過全棧軟件技術(shù)(Vertical stack)我們可以讓用戶得到更好的性能和算力?!?/p>
對(duì)于開發(fā)者來(lái)說(shuō),數(shù)據(jù)清洗與特征生成是一個(gè)非常繁瑣的過程。英特爾希望通過自身努力不斷降低 AI 開發(fā)的門檻。據(jù)悉,在 Analytics Zoo 中很快也將加入 AutoML 等功能。
英特爾目前的軟件產(chǎn)品堆棧。
雖然在人們的印象中,英特爾是一家芯片公司,但實(shí)際上它已在軟件領(lǐng)域耕耘多年這家公司現(xiàn)在擁有 15,000 余名軟件工程師。
“我們不止是在做 AI 軟件,AI 的應(yīng)用還需要很多工作,”馬子雅介紹道?!拔覀儠?huì)對(duì)每一層軟件的優(yōu)化,盡可能擠出硬件的全部性能。最終所有的軟件加起來(lái),可以提升 8 倍,而不是 1-2 倍。常規(guī)的高性能計(jì)算(HPC)架構(gòu)已經(jīng)被人們使用很多年了,AI 則是新發(fā)展出來(lái)的架構(gòu)。如何把舊架構(gòu)和新架構(gòu)統(tǒng)一結(jié)合起來(lái)是我們面臨的挑戰(zhàn)。目前看來(lái),數(shù)據(jù)分析和 HPC 的整合趨勢(shì)已經(jīng)越來(lái)越明顯了?!?/p>
在大會(huì)上,英特爾還宣布成立了“大數(shù)據(jù)分析和人工智能創(chuàng)新院”,由戴金權(quán)任院長(zhǎng)。此舉旨在吸引公司與學(xué)界、業(yè)界的更多合作。
以前的創(chuàng)新機(jī)構(gòu)通常會(huì)進(jìn)行點(diǎn)對(duì)點(diǎn)的合作,我們成立的新機(jī)構(gòu)希望能夠與全球生態(tài)中的成員有更廣泛的合作。其中包括終端客戶、合作伙伴、開源社區(qū)、學(xué)術(shù)界。這是與此前其他合作方式的不同。”馬子雅表示。
據(jù)介紹,這所創(chuàng)新院的工作將主要集中在三個(gè)方面:
加速人工智能在中國(guó)市場(chǎng)的落地,通過 AI 與數(shù)據(jù)分析的整合來(lái)加速落地;
解決中國(guó)市場(chǎng)的最新需求,引領(lǐng)創(chuàng)新用法、創(chuàng)新算法;
幫助中國(guó)市場(chǎng)更好地使用英特爾最新的軟件和硬件技術(shù)。
英特爾希望通過此舉進(jìn)使得更多的企業(yè)和個(gè)人得益于最新技術(shù)進(jìn)步,使人工智能真正的做到普惠。
“人工智能業(yè)務(wù)的需求牢牢地根植于數(shù)據(jù),利用大數(shù)據(jù)獲取更多的洞察需要完整而全面的戰(zhàn)略,只有充分利用以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),充分利用將數(shù)據(jù)分析與人工智能無(wú)縫銜接起來(lái)的軟件技術(shù),才能獲得成功?!瘪R子雅表示。