深度解析Tegra K1架構(gòu):NVIDIA再次吹響前進號角(圖)
Tegra 2是首款雙核心安卓處理器,Tegra 3第一個做到了四核,Tegra 4則第一次帶來了四核A15。經(jīng)過四代產(chǎn)品的鋪墊,NVIDIA在移動領(lǐng)域積累了大量經(jīng)驗和教訓,再次吹響了前進的號角——Tegra K1。
這一次,NVIDIA首次在同一個名字下提供了兩種不同的版本,其一是傳統(tǒng)的4+1核心A15,其二是自主設(shè)計的雙核ARMv8 64位架構(gòu)(丹佛工程),并且都集成了開普勒架構(gòu)的GPU圖形核心,拋棄之前陳舊的NV4x而首次追上了桌面顯卡的步伐。
這一次,NVIDIA更加野心勃勃。
【CPU選擇之一:四核A15】
Tegra K1的這個版本和Tegra 4很相像,也是四個高性能A15核心、一個省電專用A15核心,但仍然有多出明顯改進:
1、晶體管布局。這個是對半導體廠商設(shè)計能力的最大考驗,也是決定芯片表現(xiàn)的關(guān)鍵。NVIDIA自稱汲取了Tegra 4上的經(jīng)驗。
2、28nm HPM制造工藝。Tegra 4使用的是臺積電28nm HPL,最高只能跑到1.9GHz,而且經(jīng)常需要為了控制功耗而不得不降頻,而更高級的新工藝技術(shù)大大降低了動態(tài)功耗。
3、A15 R3核心。Tegra 4的核心是A15 r2p1版本,現(xiàn)在升級到了r3p3版本,而伴隨每次修訂,都會有大量Bug修復和時不時的性能提升。r3系列版本中,ARM增加了更精細的時鐘柵極,直接提高了能效。
綜上,Tegra K1的最高頻率來到了2.3GHz,而且可以在四個核心全部開啟的情況下跑出這個頻率,僅此帶來的性能提升就可以超過20%。
第五個節(jié)能核心的頻率最高1GHz,不過大部分時候會徘徊在500MHz左右。
NVIDIA宣稱,在同樣的功耗下,Tegra K1的性能可以提升40%,而在同樣的頻率下,Tegra K1的功耗能夠節(jié)省55%。
緩存沒有動,還是2MB二級緩存、32+32KB一級緩存,而內(nèi)存是64-bit LPDDR3/DDR3L,最大容量翻番至8GB,因為支持了40位物理尋址。
A15版本的Tegra K1已經(jīng)在2013年底投產(chǎn),將在本季度內(nèi)提供給廠商,上半年應該就能看到實際產(chǎn)品出爐,不過有了Tegra 4的前車之鑒,廠商們肯定會更謹慎。
【CPU選擇之二:64位丹佛】
整整三年前的CES上,NVIDIA宣布正在自主開發(fā)ARM指令集微架構(gòu),代號“丹佛工程”,不過當時定位的是PC、服務器,并沒有提及移動端,可能那個時候大家還沒有想到智能手機、平板機會發(fā)展得這么猛。
Tegra K1將在今年下半年迎來新版本,集成兩個丹佛核心,工藝可能仍是28nm HPM,而且兩個版本針腳兼容,因此內(nèi)存接口也不會變。
丹佛版Tegra K1將不再有節(jié)能核心,只有兩個更大的主核心。現(xiàn)在大家都在追逐更多核心,NVIDIA一下子返回雙核,會不會讓諸多小白感到“憤慨”?
NVIDIA宣稱丹佛架構(gòu)是七發(fā)射的,看起來很寬,但這只是處理器的內(nèi)部指令格式,現(xiàn)在還不清楚哪些指令能夠并發(fā),這是很關(guān)鍵的。
丹佛的一級指令緩存是128KB,一級數(shù)據(jù)緩存是64KB,這種非對稱設(shè)計在消費級領(lǐng)域并不常見,可能和架構(gòu)設(shè)計特點有關(guān)。
28nm工藝加上七發(fā)射,丹佛版Tegra K1的主頻仍然能夠高達2.5GHz,這是挺不可思議的,不知道功耗控制會如何。
丹佛版Tegra K1的設(shè)計幾周前剛剛從工廠里返回,現(xiàn)在已經(jīng)可以運行安卓4.4了,進展順利,不過還得等半年多才能看到它。
【GPU:牛X的開普勒】
此前四代Tegra使用的圖形核心都叫做GeForce ULP,是基于古老NV40架構(gòu)而來的,非統(tǒng)一渲染,技術(shù)特性也很差,尤其是不支持OpenGL ES 2.0,好在性能還算不錯。
Tegra K1上,NVIDIA發(fā)狠首次借鑒了桌面級GPU,這在整個行業(yè)也是頭一遭,而且看上去Tegra未來會一直這么做,比如下代架構(gòu)麥克斯韋就也會很快進入Tegra。
Tegra、GeForce的開普勒在架構(gòu)上是差不多的,擁有同樣大小的寄存器文件、共享的一級緩存,100% ISA(指令集架構(gòu))兼容,這說明開普勒的設(shè)計本身就很高明,直接就能拿過來用到移動端。
當然規(guī)模小多了,只有一個陣列、192個流處理器(不過叫192核心芯片就太二了),而桌面和筆記本上至少兩個陣列、384個流處理器。我們看看筆記本上的GeForce 740M,功耗大約19W,其中包括3W左右的內(nèi)存IO、PCI-E和其它非GPU模塊,如果能再去掉6W的漏電,那就只剩下10W。
兩個陣列變成一個,功耗再降一半來到5W,而頻率和電壓再控制一下(核心頻率應該是950MHz),2-3W是非常有可能的。NVIDIA宣稱的則是GPU部分低于2W。
曲面細分、幾何引擎都沒有刪減。FP64支持也在,相當于FP32 1/24。紋理單元8個,ROP單元4個,只有PC版的四分之一。
DirectX 11、OpenGL 4.4、OpenGL ES 3.0、CUDA 6.0,這些在桌面上有的,Tegra里一個不缺,號稱有史以來最先進的移動GPU并不為過,還添加支持了自適應可伸縮紋理壓縮(ATSC)。
192個流處理器×2GFlops浮點性能每核心×950MHz核心頻率,Tegra K1的原始性能達到了365GFlops,遠遠超過Xbox 360、PS3,同時在紋理過濾、內(nèi)存帶寬上也都明顯勝出。單從指標上看,Tegra K1已經(jīng)超越了上代游戲機。
或許是吃了Tegra 4高功耗的虧,NVIDIA這次非常注重能效,包括電路/電源/多層時鐘柵極、互連和數(shù)據(jù)路徑優(yōu)化、空閑/輕負載/高負載管理、二級緩存與壓縮、后端處理等等。
桌面上的開普勒擁有眾多計算單元和模塊,彼此高效互連非常重要,而移動版規(guī)模大大縮減,這方面的壓力也就輕了很多。
NVIDIA還提出,開普勒的色彩壓縮技術(shù)可以有效降低內(nèi)存帶寬占用,而且不僅僅是3D游戲里,UI界面渲染同樣如此,可節(jié)省43-76%。
NVIDIA宣揚的另外一個數(shù)據(jù)是,在GFXBench 3.0 Manhattan OpenGL ES 3.0測試中,Tegra K1的能效是驍龍800、蘋果A7的1.5倍。
【圖像信號處理(ISP)、視頻】
ISP掌管著處理靜態(tài)圖片、動態(tài)視頻的圖像流水線,負責任務包括RGB轉(zhuǎn)換、3A(自動對焦/自動曝光/自動白平衡)、降噪、鏡頭糾正等等。
Tegra K1也使用了兩個ISP,占用面積更大,可以很好地支持雙攝像頭拍照等應用。
Tegra K1 ISP是第三代產(chǎn)品了,每個都能以14位輸入每秒處理6億像素,兩個合并就是12億像素了,相比之下Tegra 4 4億像素、10位輸入就太弱了。
它還最高支持1億像素攝像頭,最多4096個對焦點(64×64陣列),降噪、局部調(diào)和映射也都更好了。
Tegra K1兼容此前的Chimera 1.0,包括物體追蹤、始終開啟HDR、慢動作捕捉、全分辨率爆發(fā)等,并且?guī)砹诵碌腃himera 2.0,支持更好的臨時像素組合(temporal pixel binning/綜合CMOS的八個曝光點來進一步降噪)、更快的全景拍照、視頻穩(wěn)定、更好的實時特效預覽。
它的內(nèi)核仍然可以運行在CPU、GPU上,但這次應該會支持CUDA了。
視頻方面,繼續(xù)支持2160p30 4K編碼、解碼,具體來說就是H.264 High Profile Level 5.1解碼、H.264 High Profile 4.2編碼,整體來收和Tegra 4上差不多,只是進一步優(yōu)化了效率和功耗。
H.265解碼也是支持的,但沒有完整的硬件加速,而是交給NVENC、CPU共同處理。
NVIDIA展示了使用Tegra K1外接顯示器播放4K 30FPS H.264視頻,完全沒有掉幀,不過事實上Tegra 4也能做到這一點,都可以通過LVDS、HDMI 1.4b、eDP 1.4來驅(qū)動4K顯示器。
輸入輸出方面有兩個USB 3.0、三個USB 2.0、eMMC 4.5.1、PCI-E x4。
哦對了,NVIDIA目前演示用的主要是一臺更換了Tegra K1處理器的Tegra Note 7,另有4GB內(nèi)存、1920×1200分辨率,比現(xiàn)在的高級很多??雌饋碜约移桨暹€會繼續(xù)堅持做下去。
LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。
關(guān)鍵字: 驅(qū)動電源LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...
關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。
關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...
關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源
關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源