英國語音與音頻方案供貨商XMOS發(fā)表專用于機器學(xué)習(xí)的Xcore處理器核心,從而為人工智能物聯(lián)網(wǎng)(AIoT)應(yīng)用打造全新的跨界處理器(crossover processor)。機器學(xué)習(xí)版Xcore.ai處理器量產(chǎn)成本可望低于1美元。
Xcore.ai基于XMOS專有核心設(shè)計建構(gòu)的第三代產(chǎn)品,專用于端點設(shè)備中進行實時的AI推論和決策,還能夠執(zhí)行訊號處理、控制與通訊功能。
該第三代芯片的新亮點在于專為機器學(xué)習(xí)應(yīng)用而設(shè)計的向量管線功能。它是同類產(chǎn)品中唯一支持二值化(1位)神經(jīng)網(wǎng)絡(luò)的跨界處理器。針對端點應(yīng)用中的超低功耗AI而言,二值化神經(jīng)網(wǎng)絡(luò)的重要性正日益提高,因為它們提供了大幅改善的性能和內(nèi)存密度,而僅適度地折衷一點精度(Xcore.ai仍可支持32位、16位和8位數(shù)字)。
Xcore.ai跨界處理器(來源:XMOS)
這讓Xcore.ai躋身支持AI功能的新興端點處理器之列,成為所謂的“跨界處理器”。“跨界處理器”(crossover processor)一詞由恩智浦半導(dǎo)體(NXP Semiconductors)創(chuàng)造,形容一種重要的新設(shè)備類型,兼具應(yīng)用處理器(AP)的性能以及微控制器(MCU)的易用性、低功耗與實時操作;透過“跨界處理器”,有助于將AP的性能帶到MCU領(lǐng)域,打破高階MCU和低階AP之間的技術(shù)鴻溝。
XMOS首席技術(shù)官Mark Lippett在接受《EE Times》的專訪時說:“如果您與客戶討論到『微控制器』(MCU),他們想到的是價格約75美分或更低、性能相對較低以及約為100MIPS的Cortex-M0、M3或M4系列。而‘SoC’可能是采用四核架構(gòu)A53核心且執(zhí)行速度達到1KHz的產(chǎn)品。在二者之間還存在很大的差距,例如語音處理器就是一道難解的數(shù)學(xué)習(xí)題,它需要數(shù)千MIPS。因此,在二者中間這個真正重大的應(yīng)用領(lǐng)域之間還存在著很大的空白,應(yīng)該為其定義一個新的名稱?!?/p>
Xcore.ai躋身新興的AIoT跨界處理器之列(來源:XMOS)
語音接口
XMOS于去年7月發(fā)布的第二代產(chǎn)品XVF3510是一款語音接口ASIC,但在該芯片底層同樣基于該公司專有的Xcore設(shè)計,并隨附韌體出貨。其基于XVF3510的遠場語音解決方案參考設(shè)計能夠滿足亞馬遜(Amazon)的Alexa語音服務(wù)要求。
鑒于XMOS長期在語音領(lǐng)域的耕耘,Xmos.ai芯片理所當然地最初將針對需要AI用于關(guān)鍵詞偵測或詞典搜尋功能的語音接口應(yīng)用。
“明確來說,語音是端點上最重要的AI工作負載,而且可能還會持續(xù)相當長的一段時間。但是,為了讓語音接口的表現(xiàn)更好,您會發(fā)現(xiàn)設(shè)備將變得更加多模態(tài)?!盠ippett描述了一種使用不同類型傳感器而使應(yīng)用更具情境感知能力的趨勢,無論是偵測個人的存在還是從某個位置發(fā)話,都需要這種情境感知功能。
XMOS首席技術(shù)官Mark Lippett
他說:“改善用戶體驗的機會很多,不只是透過傾聽音訊,還可以執(zhí)行更多功能來實現(xiàn)?!?/p>
物聯(lián)網(wǎng)(IoT)設(shè)備中的許多AI應(yīng)用都取決于隱私、安全和防護的組合,這必須在端點進行處理。例如,如果廚房中只有小孩的話,以語音和雷達開關(guān)烤箱的電器安全功能就很重要。
因此,Xcore.ai將為市場提供可用于創(chuàng)建語音接口的工具庫,但是Lippett表示,客戶已有足夠的容量建構(gòu)自己的系統(tǒng)。它包括一個用于攝影機輸入的MIPI接口。
Xcore架構(gòu)
Xcore.ai芯片可提供高達3200MIPS、51.2GMACC和1600 MFLOPS的性能,并具備1MB的嵌入式SRAM,以及一個用于擴展的低功耗DDR界面。
據(jù)XMOS表示,相較于Cortex-M7,雖然可提供相當于Xcore.ai的整合度以及類似的操作頻率,XMOS的芯片則使其AI處理性能提高了32倍,DSP性能提高15倍。
Lippett說:“端點應(yīng)用必須具有性價比,顧此失彼地討論其中一項性能并沒什么意義。我們在價格方面一向具有競爭力,量產(chǎn)后的價格還可以低至1美元。廣義而言,我們的成本僅為“Cortex-M7同類產(chǎn)品的一半”,而在性能上更是無與倫比?!?/p>
Xcore方塊圖(來源:XMOS)
Xcore.ai采用XMOS專有的Xcore架構(gòu)。Xcore本身建立在稱為邏輯核心的建構(gòu)模塊上,可用于I/O、DSP、控制功能或AI加速。在每個圖塊(TIle)中有8個邏輯核心,每個Xcore.ai芯片中有2個TIle,設(shè)計人員可以選擇為每項功能分配多少核心。每個TIle中還包含內(nèi)存、算數(shù)邏輯單元(ALU)以及與邏輯核心共享訪問權(quán)限的向量單元。
Lippett說:“重點在于其以一種非??深A(yù)測的方式[共享存?。荨_@就是Xcore的特色。最初,我們希望為軟件工程師提供I/O的靈活性,但如果錯過期限,硬件就無法兼容。因此,Xcore采用多核心,原因并不在于我們想分擔工作負載而加處理——這部份我們已能做到。采用多核心是因為我們希望為應(yīng)用的特定部份提供專用資源,以便在需要時即已就緒。它采用由下而上的設(shè)計,因而可提供這種定時精度?!?/p>
將各種不同的功能(I/O、DSP、控制與AI)映像到韌體的邏輯核心,可以創(chuàng)建一種完全以軟件編寫的“虛擬SoC”。在以下的圖示中,一個核心正執(zhí)行通常以硬件完成的任務(wù)(例如I2S、I2C和LED驅(qū)動器),有些核心處理神經(jīng)網(wǎng)絡(luò),而其他核心則執(zhí)行通常以軟件完成的任務(wù)。在軟件中定義這些任務(wù)可能速度更快些,更能因應(yīng)IoT設(shè)備的瞬態(tài)需求。Lippett說,開發(fā)成本也較便宜,讓開發(fā)商即使是在較小的細分市場中也能打造更經(jīng)濟的解決方案。
Xcore應(yīng)用(來源:XMOS)
Lippett說:“我們觀察市場進展的方式是,市場需要更多樣化的功能,而公司必須更快地做出回應(yīng)。如果不建立一款非常通用的平臺,最終可能無法滿足任何細分市場的需求,那么也就難以在IoT上押注兩年的時間。而今,“藉由Xcore.ai”,就能更輕松地以更低的資本支出讓設(shè)備更快地投放市場,也能實際針對較小市場少量投注,讓這些市場更具經(jīng)濟效益?!?/p>
然而,大型MCU制造商也積極進軍這一類跨界處理器領(lǐng)域,XMOS將如何與其競爭?
Lippett強調(diào),“當然不會是打造基于ARM的SoC!因為他們確實已經(jīng)做得有聲有色了。要與這些MCU巨擘競爭的唯一方法就是擁有架構(gòu)的優(yōu)勢。這也正是Xcore在性能方面的固有功能,當然還有靈活性?!?/p>