今年,知名硬件網(wǎng)站anandtech發(fā)布了對蘋果iPhone 11系列和蘋果A13芯片深入解讀。在芯片環(huán)節(jié),他們通過對蘋果這顆芯片的深入分析。并得出一個結(jié)論:與所有的安卓系芯片相比,蘋果A13擁有最佳的性能表現(xiàn)。首先在制造工藝方面,根據(jù)anandtech的分析,蘋果A13使用的是N7節(jié)點的性能調(diào)整型工藝,而不是基于EUV生產(chǎn)的N7 +節(jié)點。他們進(jìn)一步指出,他們這邊還沒披露這顆芯片的具體尺寸,但從TechInsights的數(shù)據(jù)顯示,蘋果新芯片的尺寸為98.48mm2,比去年的A12大18.3%。而在內(nèi)核性能方面,anandtech表示,A13同樣采用“2+4”的設(shè)計,其大型性能內(nèi)核的時鐘速度與前一代相比,大約提高了6%,使其達(dá)到2666MHz左右。但根據(jù)去年的經(jīng)年,當(dāng)時A12大內(nèi)核的時鐘頻率約為2500MHz,但在性能計數(shù)器測得的準(zhǔn)確數(shù)字似乎是2514MHz。同樣,A13的大核心時鐘應(yīng)比其估計的2666MHz時鐘高幾個MHz。小型效率內(nèi)核的時鐘頻率提高了8.8 – 12.3%,使其最高頻率達(dá)到了約1728MHz。這是一個很好的提升,但是重要的是,當(dāng)有更多的小核處于活動狀態(tài)時,它們現(xiàn)在不會降低時鐘頻率。anandtech進(jìn)一步指出,這一代的大型內(nèi)核稱為“Lightning”,是去年Vortex微體系結(jié)構(gòu)的直接后繼產(chǎn)品。在他們看來,新的內(nèi)核在核心設(shè)計方面,至少在通常的執(zhí)行單元方面,與去年的核心之間沒有太大差異。微體系結(jié)構(gòu)的核心仍然是7寬(wide)的解碼前端,與非常寬的執(zhí)行后端配對,該后端具有6個ALU和3個FP /矢量流水線。因為Lightning和Vortex兩者在很大程度上相似,所以anandtech認(rèn)為Apple尚未對執(zhí)行后端進(jìn)行任何實質(zhì)性更改,但值得注意的是其復(fù)雜的整數(shù)管道,在這上面確實看到了改進(jìn)。在這里,兩個乘法器單元可以減少一個周期的延遲,從4個周期減少到3個周期。整數(shù)吞吐量也得到了很大的提升,因為吞吐量現(xiàn)在已經(jīng)加倍,并且延遲/最小周期數(shù)從8個減少到8個。 7個周期。在緩存方面,蘋果似乎保留了A12的Vortex內(nèi)核中的緩存結(jié)構(gòu)。這意味著我們具有8路關(guān)聯(lián)的128KB L1指令和數(shù)據(jù)緩存。數(shù)據(jù)高速緩存保持非??斓乃俣?,并具有3個周期的加載使用延遲。內(nèi)核之間共享的L2高速緩存繼續(xù)保持8MB的大小,但是Apple已將延遲從16個周期減少到14個周期,在發(fā)布會的時候,我們記得蘋果介紹芯片的時候提到,CPU內(nèi)核的一個重大變化是Apple將“機器學(xué)習(xí)加速器”集成到微體系結(jié)構(gòu)中。從本質(zhì)上講,它們似乎是矩陣乘法單元,并帶有類似DSP的指令,Apple將其性能提高到了1太字節(jié)操作(TOP)吞吐量,聲稱比常規(guī)矢量流水線提高了6倍。根據(jù)anandtech的分析,該AMX指令集似乎是在CPU內(nèi)核上運行的ARM ISA的超集。關(guān)于這意味著什么一直有很多困惑,因為直到現(xiàn)在還不廣為人知,允許Arm體系結(jié)構(gòu)的被許可人使用自定義指令擴展其ISA。我們無法從Apple或Arm那里得到任何確認(rèn),但是,很明顯的一件事是Apple并未向開發(fā)人員公開公開這些新指令,并且它們也未包含在Apple的公共編譯器中。但是,我們確實知道,Apple內(nèi)部確實有可用的編譯器,并且Acclerate.framework之類的庫似乎能夠利用AMX。rm最近透露了將定制指令提供給供應(yīng)商以實施和集成到Arm內(nèi)核中的證據(jù),這顯然足以證明體系結(jié)構(gòu)被許可人可以自由地做自己想做的事情–蘋果選擇隱藏AMX指令至少可以解決對可能的ISA的擔(dān)憂軟件方面的碎片化。蘋果公司的小型效率內(nèi)核非常有趣,因為與Arm的典型小型內(nèi)核(例如Cortex-A55)相比,它們并沒有那么小。去年,A12中的Tempest效率核心基于一個3幅亂序的微體系結(jié)構(gòu),該體系結(jié)構(gòu)具有兩個主要執(zhí)行管道,與L / S單元一起工作,我們假設(shè)這是一個專用的單元。今年的Thunder微體系結(jié)構(gòu)似乎對效率CPU內(nèi)核進(jìn)行了重大更改,因為我們看到了新內(nèi)核的執(zhí)行功能的實質(zhì)性升級。就整數(shù)ALU而言,我們似乎仍在查看兩個單元,但是Apple已將能夠進(jìn)行標(biāo)志設(shè)置操作的單元數(shù)量從1倍增加到2倍。MUL吞吐量在每個周期保持1條指令,而除法單元也是貌似不變。從新的A13 Thunder內(nèi)核的性能來看,我們看到新的微體系結(jié)構(gòu)已大大提高了IPC,SPECint的增益從403.gcc的19%提高到400.perlbench的38%,而浮點性能在非內(nèi)存綁定的SPECfp工作負(fù)載中,性能也同樣提高了34-38%。在其他方面,我們看到一些性能下降,這是因為Apple更改了內(nèi)存子系統(tǒng)的DVFS策略,導(dǎo)致效率核心無法觸發(fā)某些內(nèi)存控制器的更高頻率性能狀態(tài)。這導(dǎo)致我們看到一些奇怪的結(jié)果,例如470.lbm。新內(nèi)核的電源效率也明顯更高。當(dāng)然,其中一些改進(jìn)將歸因于系統(tǒng)內(nèi)存運行速度不快,但考慮到內(nèi)核仍可在SPEC套件中提供10%到23%的平均性能,仍然給人留下深刻的印象,即能耗降低了25%平均而言,也指向主要的效率提升。面對Lightning核心(除AMX之外)相對保守的變化,新的Thunder核心對于A13來說似乎是徹底的巨大變化,并且與Apple過去的效率核心微體系結(jié)構(gòu)存在重大分歧。在與諸如Snapdragon 855的Cortex-A55實施方案進(jìn)行對抗時,新的Thunder內(nèi)核表現(xiàn)出2.5-3倍的性能領(lǐng)先優(yōu)勢,而能耗卻不到一半。鑒于我們沒有看到大型Lightning CPU內(nèi)核的微體系結(jié)構(gòu)有太多重大變化,因此我們不會期望其較之A12,性能會有特別大的提高。但是,由于內(nèi)存子系統(tǒng)和核心前端的改進(jìn),時鐘頻率增加了6%,而IPC卻提高了幾個百分點,因此可以,而且確實會帶來大約20%的性能提升,這與實際情況是一致的。蘋果在做廣告。我暫時仍要回到SPEC2006,因為我還沒有時間移植和測試2017年的移動設(shè)備。在SPECint2006中,性能的改進(jìn)相對平均地分布。平均而言,我們看到性能提高了17%。最大的收益來自受延遲限制的471.omnetpp和403.gcc,這給緩存帶來了更大的壓力。這些測試分別增加了25%和24%,這是非常顯著的。盡管性能數(shù)據(jù)非常簡單明了,而且沒有任何令人驚訝的地方,但另一方面,功率和效率數(shù)據(jù)卻極其出乎意料。在幾乎所有的SPECint2006測試中,Apple都采用了A13 SoC并提高了峰值功耗。因此,在許多情況下,我們比A12高出近1W。在這里,在性能達(dá)到峰值時,功率增加似乎大于性能增加,這就是為什么在幾乎所有工作負(fù)載中,A13的效率都低于A12的原因。總體而言,就性能而言,A13和Lightning內(nèi)核非???。在移動領(lǐng)域,實際上沒有競爭,因為A13的性能幾乎是次佳的非Apple SoC的兩倍。在浮點套件中,兩者的差異要小一些,但同樣,我們至少要再等待2-3年,才能期待任何適當(dāng)?shù)母偁帲褹pple也不會停滯不前。去年,我注意到A12與最好的臺式機CPU內(nèi)核相比差強人意。今年,A13至少在SPECint2006上與AMD和Intel所能提供的最佳匹配。在SPECfp2006中,A13仍落后約15%。令人震驚的功率數(shù)字的一種可能解釋是,對于A13,蘋果公司在新的Lightning核心的峰值頻率處處于頻率/電壓曲線的遠(yuǎn)端。在上圖中,我們估算了去年A12的功率曲線–在這里,我們可以看到Apple非常保守,其電壓直到最后幾百MHz。對于A13而言,蘋果在隨后的頻率狀態(tài)下可能更激進(jìn)。關(guān)于這種假設(shè)的好消息是,平均而言,在日常工作量中,A13應(yīng)該在效率更高的運行點上運行。蘋果公司的營銷材料將A13的速度提高了20%,同時還指出其耗電量比A12少30%,不幸的是,這種說法具有欺騙性(或至少不清楚)。盡管我們懷疑很多人會把它解釋為意味著A13速度提高了20%,而同時使用的功率卻減少了30%,但這實際上是其中之一。實際上,這意味著在相當(dāng)于A12峰值性能的性能點上,A13的能耗將減少30%。考慮到蘋果功率曲線的陡峭性,我可以輕易地想象出這是準(zhǔn)確的。在研究了新A13的CPU性能之后,是時候看看它在某些系統(tǒng)級測試中的性能了。不幸的是,仍然缺少針對iOS的適當(dāng)?shù)南到y(tǒng)測試,這尤其令人沮喪,尤其是涉及PCMark之類的測試時,它們可以更準(zhǔn)確地表示應(yīng)用程序用例。取而代之的是,我們必須退回到基于瀏覽器的基準(zhǔn)測試。瀏覽器性能仍然是設(shè)備性能的一個重要方面,因為它仍然是主要工作負(fù)載之一,它在顯示性能延遲(例如響應(yīng)時間)等性能特征時,給CPU帶來了很大壓力。與往常一樣,以下基準(zhǔn)測試不僅表示硬件功能,還表示手機的軟件優(yōu)化。在我們的測試中,iOS13再次將基于瀏覽器的基準(zhǔn)性能提高了約10%。我們已經(jīng)進(jìn)行了更新,并以iOS13上的新分?jǐn)?shù)更新了上一代iPhone的性能數(shù)據(jù),以對新iPhone 11進(jìn)行正確的Apple-Apple比較。在Speedometer 2.0中,我們看到新的基于A13的手機與上一代iPhone XS和A12相比,性能提高了19-20%。這一增長與蘋果的性能要求保持一致。今年的增長比我們?nèi)ツ晔褂肁12看到的要小,因為去年得分的主要提升似乎是升級到128KB L1I緩存。與A12相比,A13在達(dá)到大型Lightning內(nèi)核的最大時鐘速度所需的時間方面并沒有太大變化,而CPU內(nèi)核在超過100ms的時間內(nèi)達(dá)到了峰值。真正改變的是工作負(fù)載駐留在較小的Thunder效率內(nèi)核上的時間。在A13上,小核心的爬坡速度比在A12上要快得多。調(diào)度程序行為以及工作負(fù)載從小型內(nèi)核遷移到大型內(nèi)核時,也都發(fā)生了重大變化?,F(xiàn)在,在A13上,這種情況大約在30毫秒后發(fā)生,而在A12上,這可能需要54毫秒。由于小型內(nèi)核不再能夠獨自請求更高的內(nèi)存控制器性能狀態(tài),因此在工作負(fù)載要求更高的情況下,現(xiàn)在應(yīng)該盡快遷移到大型內(nèi)核。A13的Lightning內(nèi)核以910MHz左右的基本頻率啟動,這比A12及其1180MHz的基本頻率低了一點。這意味著Apple已將A13中大型內(nèi)核的動態(tài)范圍擴展到了更高的性能以及更低,更有效的頻率。蘋果還聲稱已經(jīng)提高了A13中神經(jīng)處理器IP模塊的性能。要使用此單元,您必須使用CoreML框架。不幸的是,到目前為止,我們還沒有一個自定義工具來測試它,因此我們不得不依靠一種罕見的外部應(yīng)用程序為它提供基準(zhǔn),那就是魯大師的AIMark。像網(wǎng)絡(luò)瀏覽器的工作負(fù)載一樣,iOS13也為過去的設(shè)備帶來了性能改進(jìn),因此我們重新運行了iPhone X和XS評分,以便與新iPhone 11進(jìn)行適當(dāng)比較。iPhone 11和新款A(yù)13的改進(jìn)取決于型號和工作負(fù)載。對于InceptionV3和ResNet34等經(jīng)典模型,我們發(fā)現(xiàn)推理率提高了23-29%。MobileNet-SSD的增長幅度有限,僅為17%,而DeepLabV3的增長幅度則為48%。通常,運行機器學(xué)習(xí)基準(zhǔn)測試的問題是它貫穿抽象層(在本例中為CoreML)運行。我們無法保證NPU與CPU和GPU上實際運行了多少模型,因為根據(jù)設(shè)備的ML驅(qū)動程序,它們之間可能會有很大差異。不過,這里的A13和iPhone 11很有競爭力,并且為這一代人提供了良好的迭代性能。總體而言,iPhone 11s的性能非常出色,因為我們已經(jīng)一次又一次地期望蘋果公司。話雖如此,我不能說我在日常使用中與iPhone XS的區(qū)別太大。因此,盡管A13提供了一流的性能,但對于來自去年A12設(shè)備的用戶而言,它可能不會非常引人注目。老式設(shè)備將帶來更大的影響。否則,憑借如此強大的功能,我覺得用戶體驗將從加速應(yīng)用程序和系統(tǒng)動畫的選項中受益匪淺,或者甚至完全關(guān)閉它們以真正感受到硬件的順暢性。我們詳細(xì)介紹了A13的CPU,GPU也是不可忽視的一部分。蘋果今年在對這個單元的性能表現(xiàn)更為保守,該公司承諾,在與A12相同的性能下,GPU性能提高20%或功率降低40%。除了芯片組和GPU的原始性能外,游戲的重要意義在于實際設(shè)備的熱特性以及如何消散和維持SoC的高熱量。對于A12,我確實批評蘋果,因為它在允許手機開始使用3D工作負(fù)載的峰值功率方面表現(xiàn)得非常激進(jìn)。這導(dǎo)致電話在降低速度之前并不能真正保持這些性能水平超過2-3分鐘。今年,蘋果公司已經(jīng)宣布,他們已經(jīng)提高了設(shè)備的SoC冷卻能力,能夠更好地將熱量從SoC散布到手機主體,從而使芯片保持更高的性能狀態(tài)。從3DMark中的物理測試開始,實際上,在GPU工作負(fù)載期間受功率限制時,這實際上更多地是CPU工作負(fù)載。在這種情況下,與去年的iPhone相比,iPhone 11在峰值性能方面的表現(xiàn)要好一些,但是它們并不能完全保持與A12 iPhone相同的持續(xù)性能。切換到對GPU施加最大壓力的圖形工作負(fù)載,我們現(xiàn)在在這里看到分?jǐn)?shù)和排名的重大變化。首先,與去年的A12設(shè)備相比,新的iPhone 11s和A13現(xiàn)在顯示出顯著的性能提升。我注意到,當(dāng)我們分析該芯片時,蘋果在3DMark方面表現(xiàn)異常差強人意,并且看來蘋果能夠解決這一代的任何瓶頸,性能提高了38%。實際上,我已經(jīng)回過頭來,迅速對iOS13上的iPhone XS進(jìn)行了測試,與我們在此圖中看到的相比,確實看到了20%的性能提升。新的iPhone得分不及某些Snapdragon 855(+)設(shè)備,但這是因為Apple不允許iPhone的發(fā)熱量幾乎與其他某些設(shè)備一樣高。我無法在任何新iPhone上測量高于41°C的場景。通過測量功耗,我們再次看到A13設(shè)備的峰值功率極激進(jìn),超過6.2W。有趣的是,即使在這種耗電的峰值性能狀態(tài)下,A13的效率也比A12高,并且比競爭對手的效率高得多。通過一系列的測試,anandteh指出,去年,A13的GPU性能是同類產(chǎn)品中最佳。他們表示,去年A12在GPU方面進(jìn)行了令人印象深刻的改進(jìn),這是蘋果第一次在性能和效率方面能夠非常明顯地領(lǐng)先于高通。首先,A13的峰值性能確實提高了約20%。但是,這不是人們應(yīng)該最關(guān)注的指標(biāo)。與去年的iPhone相比,蘋果的持續(xù)性能得分提高更為顯著,達(dá)到50%至60%??雌饋恚O果聲稱改善了SoC散熱性能的說法非常好。最重要的是,蘋果在A13上的新型GPU微體系結(jié)構(gòu)令人印象深刻。鑒于流程節(jié)點的發(fā)展微不足道,我沒想到該公司能夠推動如此大的性能和功率效率提升。我們需要從競爭對手中看到一些重大的模式轉(zhuǎn)變,以使它們能夠趕上下一代設(shè)備。