清華類腦芯片登上Nature封面,已成立公司,顛覆馮諾伊曼!
8月1日消息,又一支清華芯片團隊取得重大突破!來自清華的“天機”類腦芯片架構(gòu)登上了頂級學(xué)術(shù)雜志《自然(Nature)》封面。
28nm的天機芯片由156個FCores組成,面積為3.8×3.8毫米,包含大約40000個神經(jīng)元和1000萬個突觸,可以同時支持機器學(xué)習(xí)算法和類腦電路。
據(jù)智東西了解,“天機”類腦芯片項目脫胎于清華精密儀器系,是清華精密儀器系教授、腦計算中心主任施路平教授帶隊主導(dǎo)的類腦芯片項目之一。
2018年1月,“天機”團隊注冊成立了北京靈汐科技,董事長兼CEO為祝夭龍。靈汐科技于2018年8月披露了其天使輪融資,投資方來自華控基石基金、優(yōu)選資本、清華控股。
而本篇Nature論文的第一作者裴京也是靈汐科技的監(jiān)事,施路平教授則為靈汐科技公司董事。
脫身清華,落地靈汐科技這篇論文名為《面向通用人工智能的異構(gòu)融合芯片架構(gòu)“天機”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》
這篇論文中介紹了清華團隊的“天機”類腦芯片架構(gòu),它不僅算力高、功耗低、支持多種不同AI算法、而且采用了存算一體技術(shù),不需要外掛DDR,能夠節(jié)省成本功耗和空間。
在論文中,研究團隊描述了這種芯片如何幫助機器響應(yīng)語音命令,識別周圍世界,避開障礙并保持平衡。
而在附上的視頻中,“天機”團隊還展示了搭載該芯片的自動駕駛自行車
是如何自動控制平衡、并在操場上對目標人物進行識別、跟隨、自動避障。
施路平教授表示,此次發(fā)表在《自然》的論文是一個非常初步的研究,人工通用智能是一項非常具有挑戰(zhàn)性的工作,目前還處于起步階段。他和團隊的研究愿景是——“發(fā)展類腦計算,支撐人工通用智能,賦能各行各業(yè)”。
據(jù)他透露,目前,團隊已經(jīng)啟動了下一代芯片的研究,預(yù)期明年年初可以完成研發(fā)工作。
未來,天機芯片有望部署在自動駕駛汽車和智能機器人中。
“天機”芯片技術(shù)拆解“天機”是一種推進人工通用智能(AGI)發(fā)展的異構(gòu)融合芯片架構(gòu),結(jié)合了神經(jīng)科學(xué)導(dǎo)向和計算機科學(xué)導(dǎo)向方法的優(yōu)點。
在論文中,作者用一個無人自行車系統(tǒng)驗證了這一異構(gòu)融合芯片的處理能力。試驗中,僅用一個芯片,無人駕駛自行車系統(tǒng)即可同時處理多種算法和模型,不僅可以識別語音指令、實現(xiàn)自平衡控制,還能完成對前方行人的實時檢測和跟蹤,并完成自動過障、避障和平衡控制等任務(wù)。
據(jù)論文介紹,發(fā)展人工通用智能的方法主要有兩種,一種基于計算機科學(xué)導(dǎo)向,另一種基于神經(jīng)科學(xué)導(dǎo)向。
據(jù)負責(zé)芯片設(shè)計和算法細節(jié)的論文作者鄧磊介紹,此前,市面上的深度學(xué)習(xí)加速器通常只支持計算機科學(xué)模型,神經(jīng)形態(tài)芯片只支持神經(jīng)科學(xué)模型。
兩類方法依賴不同且不兼容的平臺,在一定程度上延緩了人工通用智能的發(fā)展,因此需要一個可以支持通用的基于計算機科學(xué)的人工神經(jīng)網(wǎng)絡(luò)以及神經(jīng)科學(xué)啟發(fā)的模型和算法的通用平臺。
研究團隊由此提出天機芯片(TIanjic chip),同時支持計算機科學(xué)模型和神經(jīng)網(wǎng)絡(luò)模型。
鄧磊表示,天機芯片能做到兩者都支持,同時支持神經(jīng)科學(xué)發(fā)現(xiàn)的眾多神經(jīng)回路網(wǎng)絡(luò)和異構(gòu)網(wǎng)絡(luò)的混合建模。因為兩類模型所使用的語言、計算原理、編碼方式和應(yīng)用場景都不相同,實現(xiàn)這兩種模型深度高效的融合,是天機芯片設(shè)計中最大的挑戰(zhàn)。
天機芯片采用多核架構(gòu)、可重構(gòu)的構(gòu)建模塊和采用混合編碼方案的流線型數(shù)據(jù)流,不僅可以適應(yīng)基于計算機科學(xué)的機器學(xué)習(xí)算法,還可以輕松實現(xiàn)腦啟動電路和多種編碼方案。
研究團隊的一項重要創(chuàng)新是高度可重構(gòu)的的統(tǒng)一功能核(FCore),它結(jié)合了人工神經(jīng)網(wǎng)絡(luò)和生物網(wǎng)絡(luò)的基本構(gòu)建模塊——軸突、突觸、樹突和體細胞塊。
28nm的天機芯片由156個FCores組成,面積為3.8×3.8毫米,包含大約40000個神經(jīng)元和1000萬個突觸,可以同時支持機器學(xué)習(xí)算法和類腦電路。
天機芯片提供超過每秒610千兆字節(jié)(GB)的內(nèi)部存儲器帶寬,以及運行人工神經(jīng)網(wǎng)絡(luò)的1.28 TOPS的峰值性能。
在生物啟發(fā)的尖峰神經(jīng)網(wǎng)絡(luò)模式中,天機芯片實現(xiàn)了每瓦約650千兆每秒突觸操作(GSOPS)的峰值性能。該研究團隊還展示了與GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,電源效率提高了12-10000倍。
研究團隊設(shè)計了一個無人駕駛自行車實驗,來評估芯片整合多模態(tài)信息和做出迅速決策的能力。
該自行車配備天機芯片和IMU傳感器、攝像頭、轉(zhuǎn)向電機、驅(qū)動電機、調(diào)速電機、電池。自行車可以執(zhí)行實時物體檢測、跟蹤、語音命令識別、騎行減速帶、避障,平衡控制和決策等任務(wù)。
研究小組開發(fā)了各種神經(jīng)網(wǎng)絡(luò)(CNN、CANN、SNN和MLP網(wǎng)絡(luò))來完成每項任務(wù)。這些模型經(jīng)過預(yù)訓(xùn)練并編程到天機芯片上,可以并行處理模型,實現(xiàn)不同模型之間的無縫片上通信。
在實驗中,采用天機芯片的無人駕駛自行車順利完成了所有分配的任務(wù),這標志著加速AGI發(fā)展的巨大飛躍。
研究小組還指出:“通過隨機將新變量實時引入環(huán)境中可以產(chǎn)生高時空復(fù)雜性,例如不同的道路條件、噪聲、天氣因素、多種語言、更多人等等。通過探索允許適應(yīng)這些環(huán)境變化的解決方案,可以檢查對AGI至關(guān)重要的問題,比如概括、穩(wěn)健性和自主學(xué)習(xí)?!?/p> 低功耗、低成本、高算力
在去年10月的安博會上,靈汐科技也向智東西展示了其110nm工藝的第一代、28nm的第二代“天機”架構(gòu)的類腦芯片,主打云端智能市場。
靈汐科技告訴智東西,由于繞過了HBM內(nèi)存技術(shù)對AI芯片性能和成本的限制,靈汐科技的芯片與市場同類產(chǎn)品比起來,具備低功耗、低成本、高計算力的優(yōu)勢。
“天機”架構(gòu)采用優(yōu)化過的眾核架構(gòu),由一系列核構(gòu)成陣列完成神經(jīng)網(wǎng)絡(luò)的計算。在摩爾定律即將失效的今天,在現(xiàn)有的工藝基礎(chǔ)上,從優(yōu)化架構(gòu)入手可能是提高芯片性能最重要的手段。
據(jù)靈汐科技介紹,“天機”架構(gòu)已經(jīng)超越了傳統(tǒng)的馮諾伊曼結(jié)構(gòu),不像傳統(tǒng)架構(gòu)的芯片一樣在計算的時候必須與DDR進行大量的數(shù)據(jù)交互而受存儲帶寬的限制,使整個芯片的性能受到影響。
這也是“天機”架構(gòu)芯片算力高的一個極其重要的原因。因為不用從外部導(dǎo)入數(shù)據(jù),因此它的功耗比較低,也節(jié)省了成本和空間。
結(jié)語:類腦芯片,AI計算新藍海類腦芯片其實并不是一個新話題了。早在2014年,IBM就推出了業(yè)內(nèi)首款類腦芯片TrueNorth。目前國內(nèi)外有許多公司和機構(gòu)正在類腦芯片研發(fā)上投入大量精力。
據(jù)靈汐科技介紹,與當(dāng)前市面上其他AI芯片架構(gòu)相比,“天機”類腦芯片的主要優(yōu)勢有:
1、算力高;
2、功耗低;
3、存算一體,不需要外掛DDR,節(jié)省成本功耗和空間;
4、算法的支持度靈活,既能高效支持人工神經(jīng)網(wǎng)絡(luò)算法,又能高效支持SNN算法;
5、擴展性好,能得到極大算力的芯片陣列,而且算力效率不會下降;
6、支持多核重組特性,可以實現(xiàn)多任務(wù)并行處理。
就在今年7月16日,英特爾也發(fā)布了“Pohoiki Beach”芯片系統(tǒng),該系統(tǒng)主要由Loihi神經(jīng)擬態(tài)芯片構(gòu)成,可處理深度學(xué)習(xí)任務(wù),速度比CPU快1000倍,效率高10000倍,耗電量小100倍。
Pohoiki Beach系統(tǒng)由64塊Loihi芯片的800萬個所謂的神經(jīng)元構(gòu)成。Loihi芯片是英特爾公司2017年首次推出的AI芯片,是一款模仿人類大腦的神經(jīng)擬態(tài)芯片。
相比于傳統(tǒng)芯片,類腦芯片的確在功耗上具有絕對優(yōu)勢,完成同一個任務(wù)所消耗的能源有時甚至比傳統(tǒng)芯片節(jié)省高達1000倍。
同時類腦芯片的集成度也非常高,拿浙大推出的“達爾文”芯片來說,其面積為25平方毫米,也就是說邊長只有0.5厘米,但內(nèi)部卻能包含500萬個晶體管。
隨著行業(yè)對計算力要求越來越高,馮氏瓶頸將越來越明顯,顛覆傳統(tǒng)架構(gòu)的類腦芯片已為芯片行業(yè)開啟了一扇新的大門。
本文來自智東西微信號,本文作為轉(zhuǎn)載分享。