FPGA正朝3D IC及SoC設計形式演進。得益于28納米先進制程所帶來的低功耗、小尺寸優(yōu)勢,F(xiàn)PGA不僅已能整合處理器核心,朝SoC方案演進,藉此提升整合度及產品性能,更可實現(xiàn)多種異質元件整合的3D IC,將有助開發(fā)人員設計出更智能的嵌入式系統(tǒng)。
現(xiàn)場可編程閘陣列(FPGA)廠商在28納米(nm)制程節(jié)點上推出多項全新技術,為客戶新一代的系統(tǒng)設計帶來意義重大的價值。在新的制程競賽中,F(xiàn)PGA 業(yè)者并非只將現(xiàn)有的FPGA架構移植到新的制程節(jié)點上,而是力求各種FPGA的創(chuàng)新,并在市場上推出三維晶片(3D IC)和系統(tǒng)單晶片(SoC)元件。
這些3D IC與SoC產品采用各種形式的可編程技術,包括從可編程硬件到軟件、數字到模擬和混合信號(AMS)、單晶片到多晶片3D IC方案(圖1)。有了這些全新的3D IC與SoC元件,設計團隊就能進一步提升可編程系統(tǒng)的整合度、增加整體系統(tǒng)效能、降低整體物料清單(BOM)成本,以及以更快的速度,向終端市場推出更創(chuàng)新的智慧型產品。
在性能升級之下,SoC FPGA在車用領域市占攀升
目前FPGA廠商經過多年原型設計和評估所開發(fā)出的全新元件也進入量產階段,如賽靈思(Xilinx)與臺積電合作推出全新高效能、低功耗28納米晶片制程技術,不僅是專為FPGA量身打造,更具有最佳的高效能和低功耗特性;另外,該公司成立頂尖的EDA設計團隊來開發(fā)全新現(xiàn)代化設計套件,不僅可讓客戶在采用其五個28納米元件系列時能提高工作效率,更能夠滿足往后10年客戶對于3D IC與SoC元件的可擴充性需求。
先進納米制程助陣 SoC FPGA異軍突起
SoC FPGA整合三種適用于大規(guī)??椭苹目删幊淘O計功能,包括硬件、軟件和輸入輸出(I/O)可編程設計。
從 90年代后期開始,F(xiàn)PGA供應商紛紛推出軟核處理器,客戶可將這種核心整合至FPGA的邏輯結構中,讓設計團隊能夠在統(tǒng)一的架構中緊密結合處理和邏輯功能,并進一步降低BOM成本。過程中,許多軟件處理器都被用作嵌入式狀態(tài)機 (Embedded State Machine),而非用來執(zhí)行各種更復雜系統(tǒng)中的作業(yè)系統(tǒng)和軟件堆疊。
2005年左右,新的半導體制程讓FPGA廠商能夠推出更高容量的元件,于是廠商開始將硬核處理器與FPGA邏輯配合使用,藉此有效且大幅提升FPGA的處理效能,如賽靈思先后在其高階的Virtex FX元件系列中加入PowerPC中央處理器(CPU)核心。
相較于軟件核心方案,加入硬核處理器的Virtex FX系列即可大幅提高處理器效能,然設計團隊則要先對FPGA邏輯進行程式設計才能為處理器設計程式。一旦要為FPGA邏輯設計程式,設計團隊就須建置自己的周邊功能和存儲器子系統(tǒng),并須建置“嵌入式系統(tǒng)”和相關進出邏輯的管道。
熟悉FPGA設計的專家當然可提升處理器效能,不過相較于更受歡迎的傳統(tǒng)嵌入式系統(tǒng)設計方法,這種架構更為復雜。在此經驗基礎上,賽靈思于2008年開始進行Zynq-7000 All Programmable SoC的架構設計,同時開始著手建構相關的產業(yè)體系,包括硬件和軟件開發(fā)工具,甚至基礎架構,以促進元件的編程設計作業(yè)。
此外,賽靈思選擇得到充分支援的1GHz頻率安謀國際(ARM)A9雙核處理器系統(tǒng),并與ARM合作建立AXI4介面標準,在架構的邏輯部分,能讓協(xié)力廠商、賽靈思和客戶開發(fā)的核心都有隨插即用的利便性。
此外,賽靈思也讓Zynq系列能從處理器直接啟動,讓系統(tǒng)設計人員能以熟悉的方式投入開發(fā)工作,并可盡快著手軟件開發(fā),進而加快產品上市時間。由于可先啟動處理器,軟件設計人員即便不熟悉FPGA邏輯或硬件設計也能使用元件,甚至還能擴展編程設計范圍。此外,該公司還提供豐富的外部硅智財(IP)和具可編程功能的高速I/O,不僅能為客戶提供一顆FPGA,甚至是一顆FPGA和一個處理器,更可實現(xiàn)真正的SoC FPGA。
TSV技術助力 3D IC FPGA元件出爐
此外,F(xiàn)PGA制造商在28納米制程節(jié)點上推出的另一類全新元件是3D IC。早在2004年,F(xiàn)PGA業(yè)者即已探索多晶片在統(tǒng)一IP配置中的堆疊,并推出原型設計,突破摩爾定律的限制,為可編程設計系統(tǒng)整合開創(chuàng)全新范疇。
FPGA 業(yè)者的科學家設計各種3D IC架構的測試晶片,探索堆疊晶片的各種方法,并透過硅穿孔(TSV)技術為晶片供電和支援晶片與晶片之間的通訊,如賽靈思透過廣泛的原型設計和對可靠制程的堅持,制定“堆疊矽片互連技術(SSI)”做為短期內可行且實用的商用架構。此架構可將多顆晶片并排置于被動式硅中介層上,有助于多顆晶片之間的互連和通訊。晶片透過程式設計可支援超過一萬個互連,而每顆晶片和I/O都具有可編程功能。
2012年初,首款3D IC元件已正式出貨。該3D IC元件可并排堆疊四個FPGA邏輯部分(Slice),主要都由FPGA邏輯構成。這款元件內含超過六十八億個電晶體,打破28奈米制程節(jié)點IC電晶體數量的紀錄和FPGA邏輯容量的紀錄,可提供二百萬個邏輯單元,相當于二千萬個特定應用集成電路(ASIC)閘極。該元件的尺寸相當于同類競爭元件最大型 FPGA的兩倍,以28納米制程而言其邏輯容量比預期的水準整整領先一個世代。此外,SSI技術架構也讓3D IC的容量超越摩爾定律,可滿足新一代產品的需求。
首款3D IC深受客戶歡迎,并已廣泛應用在ASIC原型設計、儲存和高效能運算系統(tǒng)等各種應用中,其對于可編程邏輯的容量都有極高的需求。
其中,產業(yè)界首款異質架構的3D IC元件的制程中,將專用的28G收發(fā)器晶片與兩顆FPGA晶片并排放置在被動式硅中介層上。如此一來,此款元件就能提供八個28Gbit/s收發(fā)器、四十八個13.1Gbit/s收發(fā)器和五十八萬個邏輯單元。對于以CFP2光學模組為基礎的2×100G光學傳輸線路卡等應用而言,異質架構的3D IC元件的BOM成本不僅可銳減五分之一,更可比上一代解決方案大幅減少電路板空間。
至于另一款3D IC元件則在同一晶片上整合兩顆八通道收發(fā)器晶片和三顆FPGA邏輯晶片,亦即在一個晶片上共有十六個28Gbit/s收發(fā)器、七十二個13.1Gbit /s收發(fā)器和八十七萬六千一百六十個邏輯單元。Virtex-7 H870T元件可全面支援400G市場的新一代有線通訊。
28nm制程助攻 FPGA功耗再下探
時至今日,快速演進的FPGA產品已遠遠超越閘極陣列的水準?,F(xiàn)階段,F(xiàn)PGA不僅包含數百萬個可編程的邏輯閘極,其內部還嵌入存儲器控制器、高速I/O及模擬/混合信號電路。過去設計團隊能用FPGA解決系統(tǒng)中的問題,或“黏合”系統(tǒng)中的元素;但現(xiàn)在客戶能利用FPGA進行高效能的資料處理、波形處理、影像/影音處理或高效能的運算功能,并能在系統(tǒng)中進行動態(tài)更新,也能在產品建置后進行升級。
如賽靈思決定采用臺積電的HPL制程生產全系列28納米3D IC和SoC元件,并以關鍵的結構性創(chuàng)新做法來降低功耗,因而FPGA產品能比其他同級效能水準的競爭產品降低35-50%的功耗,亦即在省電效率上領先一個世代。此外,該公司的28納米FPGA,不論是系統(tǒng)效能和整合度,包括區(qū)塊隨機存取存儲器(BRAM)、數字信號處理器(DSP)、存儲器介面、收發(fā)器和邏輯元件的整合都超越競爭對手1.2倍至2倍,平均優(yōu)勢更達1.5倍。
改良3D IC與SoC FPGA顛覆傳統(tǒng)架構
FPGA 廠商開發(fā)各種形式的可編程技術,超越可編程設計硬件,并涵蓋軟件領域;超越數位,并涵蓋AMS;超越單晶片,并實現(xiàn)多晶片3D IC。FPGA業(yè)者將這些技術與FPGA、SoC和3D IC整合,可幫助設計團隊提高可編程系統(tǒng)的整合度、提升系統(tǒng)效能、降低BOM成本,并加快創(chuàng)新產品的上市速度。賽靈思產品組合的轉型源自2008年,部分創(chuàng)新技術更進一步追溯至2006年,而現(xiàn)今的產品組合技術已整整領先競爭對手一個世代的水準。
放眼20納米世代,F(xiàn)PGA供應商將推出更先進的FPGA、第二代SoC、3D IC元件和設計環(huán)境/工具套件,持續(xù)擴大市占。此外,FPGA制造商多年來藉由與客戶合作改良SoC和3D IC技術,重新定義高速序列收發(fā)器等關鍵核心技術的開發(fā),改良設計方法和工具套件,并擴展系統(tǒng)級開發(fā)環(huán)境與供應鏈,確保產品的品質和可靠度。