從數據中心到物聯網設備,人工智能計算的持續(xù)發(fā)展(5)
事情變得越來越復雜,但我們正在嘗試簡化它們。但是功耗和處理之間存在關系。我想知道問題的復雜性、我們在解決該問題的處理方面所做的工作以及功耗之間的相互作用是什么。
對。嗯,這是一個很好的觀點。因為我們一直在談論的很多關于人工智能的東西聽起來像是很多軟件,而且確實如此。歸根結底,你可以在幾乎任何類型的執(zhí)行引擎上完成 AI,無論是通用 CPU、通用 DSP,當然,GPU 很早就成為了流行的選擇,對吧?因為它們在結構上的架構使得它們比 CPU 和 DSP 更有效地進行矩陣運算。
但你幾乎可以在每臺設備上運行 AI。近年來發(fā)生的事情是,我們會看到一系列專門用于創(chuàng)建專門用于運行 AI 工作負載的架構的專業(yè)化。諸如 TPU 之類的東西,它們是張量處理單元。事物有不同的名稱。NPU 代表神經處理單元,專為 AI 工作負載而設計。你能否將在 NPU 上運行的 AI 工作負載運行在通用 CPU 或 DSP 上?也許你可以。我們所暗示的問題是,與專用處理器相比,它對在通用處理器上運行該圖的效率有什么影響?兩者之間可能存在數量級的效率差異。而且,當然,
處理方面的另一個元素是我在最后提到的帶有 U 的東西:CPU、TPU 和 NPU。這意味著一種可以配置的架構,但它有點用于這些專門的工作負載。我們看到很多客戶都有非常具體的用例,他們正在構建自己的神經網絡加速器。即使是一個通用的流程被設計用來處理,比如說,一個類或廣泛的人工智能工作負載,對于他們的特定應用程序來說可能不夠高效。因此,他們正在推出自己的產品,他們正在建造自己的,并且正在建造自己的加速器。順便說一句,這些加速器可能與 CPU 或 DSP 或 NPU 并存。
但隨后他們正在處理一些特定的 AI 工作負載,這些工作負載可能需要以比我們在更通用的處理元素之一中完成的更高的性能水平運行。所以我會說,在那種學習模式下,人工智能有點像,作為一個行業(yè),我們正在開發(fā)特別適合更好地做人工智能的處理器架構。
順便說一句,AI 不會取代 SOC 上存在的一些現有處理要求。例如,我們必須能夠進行實時控制;你必須能夠進行信號處理。而且,將每種處理工作負載所需的所有門都安裝到單個執(zhí)行單元處理器中并不是很有效,甚至在技術上也不可能。
因此,客戶通常正在尋找一種方法來創(chuàng)建異構處理平臺,在這些平臺上,他們可以使用由 CPU、DSP、浮點單元,然后是信號處理器、GPU 和 AI 加速器或 AI 或 NPU、神經處理單元的總線連接的任意組合,以完成其特定應用程序的任何任務。所以他們希望基本上混合和匹配,對于我想在我的應用程序中完成的不同工作負載,最有效的處理單元是什么?
如果我們是一家大型公司,例如超大規(guī)模企業(yè)之一,那么我們可能擁有在內部執(zhí)行此操作的專業(yè)知識。如果你是一家規(guī)模較小的公司,AI 知道,你內部可能沒有這種專業(yè)知識。我們可能不想在內部擁有這種專業(yè)知識,因為我們可能不會一直需要它。我想對于那個級別的公司來說,走出去尋找同時具備 IP 專業(yè)知識和設計專業(yè)知識的人是一種溢價。
是的。并且不要忘記其中的工具部分。所以有硬件部分,你剛才準確地描述了客戶,根據這些客戶的規(guī)模,做出權衡。這是經典的構建與購買。如果我能找到現成的組件——例如 IP——滿足我的要求,我的 PPA——我的性能、功率和面積要求——那么這可能是我的最佳選擇。
而且我可以把我寶貴的資源投入到做更有差異化的事情上。
因此,客戶正在與他們交談的供應商中做出這些選擇。他們從一個供應商那里得到的東西越多,通常就越好。但工具方面也很重要。我不僅指實現 SOC 所需的各種工具,我還指與處理器架構配套使用的工具。處理器本身,無論架構多么巧妙,如果你不能對它們進行編程,它們就毫無價值。理解大部分努力都用于開發(fā)軟件并不是一個革命性的想法,并且我們需要能夠將軟件投資從一代處理器帶到下一代。因此,這些工具對于程序員能夠以有效的方式創(chuàng)建以及標準之間的互操作性非常重要,
而且,在邊緣設備的情況下,你必須擔心內存。設備上有多少內存?所以代碼密度。云中沒有人擔心代碼。關于他們的計劃有多大。在這些類型的應用程序中,大部分內存都是免費的。
在受限設備中,情況并非如此。所以你甚至在看類似的東西,我的編譯器會創(chuàng)建非常密集的程序嗎?因此,一些編譯器比其他編譯器更優(yōu)化,更擅長做這件事。因此,我們將所有這些因素都考慮在內——所需的工具、可用的操作系統(tǒng)、用于執(zhí)行機器學習應用程序的庫構建塊,以及它們在多大程度上允許我映射到我擁有的不同硬件資源— SOC 開發(fā)人員在考慮選擇供應商時會考慮所有這些因素。
我們一直在與 Synopsys 的 Matt Gutierrez 討論邊緣人工智能。我提到,隨著去年收購 Virage,Synopsys 現在擁有更豐富的 IP 組合來為其客戶提供服務。這是 Matt 提供了一些關于其中包含的內容的細節(jié)。
大多數人都知道 Synopsys 是用于實施和驗證 SOC 的 EDA 工具提供商。當然,我們以廣泛的知識產權組合而聞名。Synopsys 的 IP 產品線之一是弧形處理器 IP 產品組合,專為嵌入式設備而設計:具有功率和面積限制的設備。因此,我們針對不同的處理工作負載開發(fā)了一系列處理器。
我們有 CPU;我們有 DSP,包括高端矢量 DSP;我們有視覺處理器;我們有神經網絡加速器。所以我們認識到 SOC 正變得越來越異構。特別是在邊緣設備中,我們需要能夠高效地處理工作負載。我們無法在一個大型處理器上完成所有工作,我們需要將這些工作負載分解為各種處理元素,這些元素將以最省電和最節(jié)省面積的方式完成。這就是我們構建投資組合的方式。
如果你考慮一下這個應用程序,我認為這是一個真正的應用程序,我們將在不遠的將來看到,走進那個商場,讓一些東西能夠識別你和你的風格并提出建議。我認為對于某些人來說,這將是一個問題,有時是原則性的,只是因為這感覺像是對某種隱私的侵犯。而且我認為還有其他像我這樣的人可能會受到時尚挑戰(zhàn),他們實際上可能會欣賞一些人工智能大腦找出可能符合我的風格或我對我的偏好并提出建議的人。
因此,它與我們在互聯網上描述的尾隨并沒有太大區(qū)別。當我們在亞馬遜上尋找一些東西時,我們會發(fā)現有多煩人,而我們在其他網站甚至亞馬遜本身上卻被一堆廣告擊中?嘿,如果你買了這個,你可能會對這五樣東西感興趣。有時它非常有用,有時它很煩人。我認為同樣的事情也適用于這些更多零售環(huán)境中的一些人工智能用例。