7nm的力量，蘋果A13芯片完勝所有競(jìng)爭(zhēng)對(duì)手

時(shí)間：2019-10-29 10:52:03

關(guān)鍵字： a13芯片

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]今年，知名硬件網(wǎng)站anandtech發(fā)布了對(duì)蘋果iPhone 11系列和蘋果A13芯片深入解讀。在芯片環(huán)節(jié)，他們通過對(duì)蘋果這顆芯片的深入分析。并得出一個(gè)結(jié)論：與所有的安卓系芯片相比，蘋果A13擁有最佳

今年，知名硬件網(wǎng)站anandtech發(fā)布了對(duì)蘋果iPhone 11系列和蘋果A13芯片深入解讀。在芯片環(huán)節(jié)，他們通過對(duì)蘋果這顆芯片的深入分析。并得出一個(gè)結(jié)論：與所有的安卓系芯片相比，蘋果A13擁有最佳的性能表現(xiàn)。

下面我們來摘取一下文章中的一些亮點(diǎn)：

首先在制造工藝方面，根據(jù)anandtech的分析，蘋果A13使用的是N7節(jié)點(diǎn)的性能調(diào)整型工藝，而不是基于EUV生產(chǎn)的N7 +節(jié)點(diǎn)。他們進(jìn)一步指出，他們這邊還沒披露這顆芯片的具體尺寸，但從TechInsights的數(shù)據(jù)顯示，蘋果新芯片的尺寸為98.48mm2，比去年的A12大18.3％。

而在內(nèi)核性能方面，anandtech表示，A13同樣采用“2+4”的設(shè)計(jì)，其大型性能內(nèi)核的時(shí)鐘速度與前一代相比，大約提高了6％，使其達(dá)到2666MHz左右。但根據(jù)去年的經(jīng)年，當(dāng)時(shí)A12大內(nèi)核的時(shí)鐘頻率約為2500MHz，但在性能計(jì)數(shù)器測(cè)得的準(zhǔn)確數(shù)字似乎是2514MHz。同樣，A13的大核心時(shí)鐘應(yīng)比其估計(jì)的2666MHz時(shí)鐘高幾個(gè)MHz。

小型效率內(nèi)核的時(shí)鐘頻率提高了8.8 – 12.3％，使其最高頻率達(dá)到了約1728MHz。這是一個(gè)很好的提升，但是重要的是，當(dāng)有更多的小核處于活動(dòng)狀態(tài)時(shí)，它們現(xiàn)在不會(huì)降低時(shí)鐘頻率。

anandtech進(jìn)一步指出，這一代的大型內(nèi)核稱為“Lightning”，是去年Vortex微體系結(jié)構(gòu)的直接后繼產(chǎn)品。在他們看來，新的內(nèi)核在核心設(shè)計(jì)方面，至少在通常的執(zhí)行單元方面，與去年的核心之間沒有太大差異。微體系結(jié)構(gòu)的核心仍然是7寬（wide）的解碼前端，與非常寬的執(zhí)行后端配對(duì)，該后端具有6個(gè)ALU和3個(gè)FP /矢量流水線。

因?yàn)長(zhǎng)ightning和Vortex兩者在很大程度上相似，所以anandtech認(rèn)為Apple尚未對(duì)執(zhí)行后端進(jìn)行任何實(shí)質(zhì)性更改，但值得注意的是其復(fù)雜的整數(shù)管道，在這上面確實(shí)看到了改進(jìn)。在這里，兩個(gè)乘法器單元可以減少一個(gè)周期的延遲，從4個(gè)周期減少到3個(gè)周期。整數(shù)吞吐量也得到了很大的提升，因?yàn)橥掏铝楷F(xiàn)在已經(jīng)加倍，并且延遲/最小周期數(shù)從8個(gè)減少到8個(gè)。 7個(gè)周期。

在緩存方面，蘋果似乎保留了A12的Vortex內(nèi)核中的緩存結(jié)構(gòu)。這意味著我們具有8路關(guān)聯(lián)的128KB L1指令和數(shù)據(jù)緩存。數(shù)據(jù)高速緩存保持非常快的速度，并具有3個(gè)周期的加載使用延遲。內(nèi)核之間共享的L2高速緩存繼續(xù)保持8MB的大小，但是Apple已將延遲從16個(gè)周期減少到14個(gè)周期，

在發(fā)布會(huì)的時(shí)候，我們記得蘋果介紹芯片的時(shí)候提到，CPU內(nèi)核的一個(gè)重大變化是Apple將“機(jī)器學(xué)習(xí)加速器”集成到微體系結(jié)構(gòu)中。從本質(zhì)上講，它們似乎是矩陣乘法單元，并帶有類似DSP的指令，Apple將其性能提高到了1太字節(jié)操作（TOP）吞吐量，聲稱比常規(guī)矢量流水線提高了6倍。根據(jù)anandtech的分析，該AMX指令集似乎是在CPU內(nèi)核上運(yùn)行的ARM ISA的超集。

關(guān)于這意味著什么一直有很多困惑，因?yàn)橹钡浆F(xiàn)在還不廣為人知，允許Arm體系結(jié)構(gòu)的被許可人使用自定義指令擴(kuò)展其ISA。我們無法從Apple或Arm那里得到任何確認(rèn)，但是，很明顯的一件事是Apple并未向開發(fā)人員公開公開這些新指令，并且它們也未包含在Apple的公共編譯器中。但是，我們確實(shí)知道，Apple內(nèi)部確實(shí)有可用的編譯器，并且Acclerate.framework之類的庫似乎能夠利用AMX。

rm最近透露了將定制指令提供給供應(yīng)商以實(shí)施和集成到Arm內(nèi)核中的證據(jù)，這顯然足以證明體系結(jié)構(gòu)被許可人可以自由地做自己想做的事情–蘋果選擇隱藏AMX指令至少可以解決對(duì)可能的ISA的擔(dān)憂軟件方面的碎片化。

CPU內(nèi)核：重大升級(jí)

蘋果公司的小型效率內(nèi)核非常有趣，因?yàn)榕cArm的典型小型內(nèi)核（例如Cortex-A55）相比，它們并沒有那么小。去年，A12中的Tempest效率核心基于一個(gè)3幅亂序的微體系結(jié)構(gòu)，該體系結(jié)構(gòu)具有兩個(gè)主要執(zhí)行管道，與L / S單元一起工作，我們假設(shè)這是一個(gè)專用的單元。

今年的Thunder微體系結(jié)構(gòu)似乎對(duì)效率CPU內(nèi)核進(jìn)行了重大更改，因?yàn)槲覀兛吹搅诵聝?nèi)核的執(zhí)行功能的實(shí)質(zhì)性升級(jí)。就整數(shù)ALU而言，我們似乎仍在查看兩個(gè)單元，但是Apple已將能夠進(jìn)行標(biāo)志設(shè)置操作的單元數(shù)量從1倍增加到2倍。MUL吞吐量在每個(gè)周期保持1條指令，而除法單元也是貌似不變。

從新的A13 Thunder內(nèi)核的性能來看，我們看到新的微體系結(jié)構(gòu)已大大提高了IPC，SPECint的增益從403.gcc的19％提高到400.perlbench的38％，而浮點(diǎn)性能在非內(nèi)存綁定的SPECfp工作負(fù)載中，性能也同樣提高了34-38％。

在其他方面，我們看到一些性能下降，這是因?yàn)锳pple更改了內(nèi)存子系統(tǒng)的DVFS策略，導(dǎo)致效率核心無法觸發(fā)某些內(nèi)存控制器的更高頻率性能狀態(tài)。這導(dǎo)致我們看到一些奇怪的結(jié)果，例如470.lbm。

新內(nèi)核的電源效率也明顯更高。當(dāng)然，其中一些改進(jìn)將歸因于系統(tǒng)內(nèi)存運(yùn)行速度不快，但考慮到內(nèi)核仍可在SPEC套件中提供10％到23％的平均性能，仍然給人留下深刻的印象，即能耗降低了25％平均而言，也指向主要的效率提升。

面對(duì)Lightning核心（除AMX之外）相對(duì)保守的變化，新的Thunder核心對(duì)于A13來說似乎是徹底的巨大變化，并且與Apple過去的效率核心微體系結(jié)構(gòu)存在重大分歧。在與諸如Snapdragon 855的Cortex-A55實(shí)施方案進(jìn)行對(duì)抗時(shí)，新的Thunder內(nèi)核表現(xiàn)出2.5-3倍的性能領(lǐng)先優(yōu)勢(shì)，而能耗卻不到一半。

SPEC2006性能：臺(tái)式機(jī)水平

鑒于我們沒有看到大型Lightning CPU內(nèi)核的微體系結(jié)構(gòu)有太多重大變化，因此我們不會(huì)期望其較之A12，性能會(huì)有特別大的提高。但是，由于內(nèi)存子系統(tǒng)和核心前端的改進(jìn)，時(shí)鐘頻率增加了6％，而IPC卻提高了幾個(gè)百分點(diǎn)，因此可以，而且確實(shí)會(huì)帶來大約20％的性能提升，這與實(shí)際情況是一致的。蘋果在做廣告。

我暫時(shí)仍要回到SPEC2006，因?yàn)槲疫€沒有時(shí)間移植和測(cè)試2017年的移動(dòng)設(shè)備。

在SPECint2006中，性能的改進(jìn)相對(duì)平均地分布。平均而言，我們看到性能提高了17％。最大的收益來自受延遲限制的471.omnetpp和403.gcc，這給緩存帶來了更大的壓力。這些測(cè)試分別增加了25％和24％，這是非常顯著的。

盡管性能數(shù)據(jù)非常簡(jiǎn)單明了，而且沒有任何令人驚訝的地方，但另一方面，功率和效率數(shù)據(jù)卻極其出乎意料。在幾乎所有的SPECint2006測(cè)試中，Apple都采用了A13 SoC并提高了峰值功耗。因此，在許多情況下，我們比A12高出近1W。在這里，在性能達(dá)到峰值時(shí)，功率增加似乎大于性能增加，這就是為什么在幾乎所有工作負(fù)載中，A13的效率都低于A12的原因。

總體而言，就性能而言，A13和Lightning內(nèi)核非常快。在移動(dòng)領(lǐng)域，實(shí)際上沒有競(jìng)爭(zhēng)，因?yàn)锳13的性能幾乎是次佳的非Apple SoC的兩倍。在浮點(diǎn)套件中，兩者的差異要小一些，但同樣，我們至少要再等待2-3年，才能期待任何適當(dāng)?shù)母?jìng)爭(zhēng)，而且Apple也不會(huì)停滯不前。

去年，我注意到A12與最好的臺(tái)式機(jī)CPU內(nèi)核相比差強(qiáng)人意。今年，A13至少在SPECint2006上與AMD和Intel所能提供的最佳匹配。在SPECfp2006中，A13仍落后約15％。

令人震驚的功率數(shù)字的一種可能解釋是，對(duì)于A13，蘋果公司在新的Lightning核心的峰值頻率處處于頻率/電壓曲線的遠(yuǎn)端。在上圖中，我們估算了去年A12的功率曲線–在這里，我們可以看到Apple非常保守，其電壓直到最后幾百M(fèi)Hz。對(duì)于A13而言，蘋果在隨后的頻率狀態(tài)下可能更激進(jìn)。

關(guān)于這種假設(shè)的好消息是，平均而言，在日常工作量中，A13應(yīng)該在效率更高的運(yùn)行點(diǎn)上運(yùn)行。蘋果公司的營(yíng)銷材料將A13的速度提高了20％，同時(shí)還指出其耗電量比A12少30％，不幸的是，這種說法具有欺騙性（或至少不清楚）。盡管我們懷疑很多人會(huì)把它解釋為意味著A13速度提高了20％，而同時(shí)使用的功率卻減少了30％，但這實(shí)際上是其中之一。實(shí)際上，這意味著在相當(dāng)于A12峰值性能的性能點(diǎn)上，A13的能耗將減少30％。考慮到蘋果功率曲線的陡峭性，我可以輕易地想象出這是準(zhǔn)確的。

系統(tǒng)和ML性能

在研究了新A13的CPU性能之后，是時(shí)候看看它在某些系統(tǒng)級(jí)測(cè)試中的性能了。不幸的是，仍然缺少針對(duì)iOS的適當(dāng)?shù)南到y(tǒng)測(cè)試，這尤其令人沮喪，尤其是涉及PCMark之類的測(cè)試時(shí)，它們可以更準(zhǔn)確地表示應(yīng)用程序用例。取而代之的是，我們必須退回到基于瀏覽器的基準(zhǔn)測(cè)試。瀏覽器性能仍然是設(shè)備性能的一個(gè)重要方面，因?yàn)樗匀皇侵饕ぷ髫?fù)載之一，它在顯示性能延遲（例如響應(yīng)時(shí)間）等性能特征時(shí)，給CPU帶來了很大壓力。

與往常一樣，以下基準(zhǔn)測(cè)試不僅表示硬件功能，還表示手機(jī)的軟件優(yōu)化。在我們的測(cè)試中，iOS13再次將基于瀏覽器的基準(zhǔn)性能提高了約10％。我們已經(jīng)進(jìn)行了更新，并以iOS13上的新分?jǐn)?shù)更新了上一代iPhone的性能數(shù)據(jù)，以對(duì)新iPhone 11進(jìn)行正確的Apple-Apple比較。

在Speedometer 2.0中，我們看到新的基于A13的手機(jī)與上一代iPhone XS和A12相比，性能提高了19-20％。這一增長(zhǎng)與蘋果的性能要求保持一致。今年的增長(zhǎng)比我們?nèi)ツ晔褂肁12看到的要小，因?yàn)槿ツ甑梅值闹饕嵘坪跏巧?jí)到128KB L1I緩存。

與A12相比，A13在達(dá)到大型Lightning內(nèi)核的最大時(shí)鐘速度所需的時(shí)間方面并沒有太大變化，而CPU內(nèi)核在超過100ms的時(shí)間內(nèi)達(dá)到了峰值。

真正改變的是工作負(fù)載駐留在較小的Thunder效率內(nèi)核上的時(shí)間。在A13上，小核心的爬坡速度比在A12上要快得多。調(diào)度程序行為以及工作負(fù)載從小型內(nèi)核遷移到大型內(nèi)核時(shí)，也都發(fā)生了重大變化?，F(xiàn)在，在A13上，這種情況大約在30毫秒后發(fā)生，而在A12上，這可能需要54毫秒。由于小型內(nèi)核不再能夠獨(dú)自請(qǐng)求更高的內(nèi)存控制器性能狀態(tài)，因此在工作負(fù)載要求更高的情況下，現(xiàn)在應(yīng)該盡快遷移到大型內(nèi)核。

A13的Lightning內(nèi)核以910MHz左右的基本頻率啟動(dòng)，這比A12及其1180MHz的基本頻率低了一點(diǎn)。這意味著Apple已將A13中大型內(nèi)核的動(dòng)態(tài)范圍擴(kuò)展到了更高的性能以及更低，更有效的頻率。

機(jī)器學(xué)習(xí)推理性能

蘋果還聲稱已經(jīng)提高了A13中神經(jīng)處理器IP模塊的性能。要使用此單元，您必須使用CoreML框架。不幸的是，到目前為止，我們還沒有一個(gè)自定義工具來測(cè)試它，因此我們不得不依靠一種罕見的外部應(yīng)用程序?yàn)樗峁┗鶞?zhǔn)，那就是魯大師的AIMark。

像網(wǎng)絡(luò)瀏覽器的工作負(fù)載一樣，iOS13也為過去的設(shè)備帶來了性能改進(jìn)，因此我們重新運(yùn)行了iPhone X和XS評(píng)分，以便與新iPhone 11進(jìn)行適當(dāng)比較。

iPhone 11和新款A(yù)13的改進(jìn)取決于型號(hào)和工作負(fù)載。對(duì)于InceptionV3和ResNet34等經(jīng)典模型，我們發(fā)現(xiàn)推理率提高了23-29％。MobileNet-SSD的增長(zhǎng)幅度有限，僅為17％，而DeepLabV3的增長(zhǎng)幅度則為48％。

通常，運(yùn)行機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試的問題是它貫穿抽象層（在本例中為CoreML）運(yùn)行。我們無法保證NPU與CPU和GPU上實(shí)際運(yùn)行了多少模型，因?yàn)楦鶕?jù)設(shè)備的ML驅(qū)動(dòng)程序，它們之間可能會(huì)有很大差異。

不過，這里的A13和iPhone 11很有競(jìng)爭(zhēng)力，并且為這一代人提供了良好的迭代性能。

總體而言，iPhone 11s的性能非常出色，因?yàn)槲覀円呀?jīng)一次又一次地期望蘋果公司。話雖如此，我不能說我在日常使用中與iPhone XS的區(qū)別太大。因此，盡管A13提供了一流的性能，但對(duì)于來自去年A12設(shè)備的用戶而言，它可能不會(huì)非常引人注目。老式設(shè)備將帶來更大的影響。否則，憑借如此強(qiáng)大的功能，我覺得用戶體驗(yàn)將從加速應(yīng)用程序和系統(tǒng)動(dòng)畫的選項(xiàng)中受益匪淺，或者甚至完全關(guān)閉它們以真正感受到硬件的順暢性。

GPU性能和功耗

我們?cè)敿?xì)介紹了A13的CPU，GPU也是不可忽視的一部分。蘋果今年在對(duì)這個(gè)單元的性能表現(xiàn)更為保守，該公司承諾，在與A12相同的性能下，GPU性能提高20％或功率降低40％。

除了芯片組和GPU的原始性能外，游戲的重要意義在于實(shí)際設(shè)備的熱特性以及如何消散和維持SoC的高熱量。對(duì)于A12，我確實(shí)批評(píng)蘋果，因?yàn)樗谠试S手機(jī)開始使用3D工作負(fù)載的峰值功率方面表現(xiàn)得非常激進(jìn)。這導(dǎo)致電話在降低速度之前并不能真正保持這些性能水平超過2-3分鐘。

今年，蘋果公司已經(jīng)宣布，他們已經(jīng)提高了設(shè)備的SoC冷卻能力，能夠更好地將熱量從SoC散布到手機(jī)主體，從而使芯片保持更高的性能狀態(tài)。

從3DMark中的物理測(cè)試開始，實(shí)際上，在GPU工作負(fù)載期間受功率限制時(shí)，這實(shí)際上更多地是CPU工作負(fù)載。在這種情況下，與去年的iPhone相比，iPhone 11在峰值性能方面的表現(xiàn)要好一些，但是它們并不能完全保持與A12 iPhone相同的持續(xù)性能。

切換到對(duì)GPU施加最大壓力的圖形工作負(fù)載，我們現(xiàn)在在這里看到分?jǐn)?shù)和排名的重大變化。首先，與去年的A12設(shè)備相比，新的iPhone 11s和A13現(xiàn)在顯示出顯著的性能提升。我注意到，當(dāng)我們分析該芯片時(shí)，蘋果在3DMark方面表現(xiàn)異常差強(qiáng)人意，并且看來蘋果能夠解決這一代的任何瓶頸，性能提高了38％。實(shí)際上，我已經(jīng)回過頭來，迅速對(duì)iOS13上的iPhone XS進(jìn)行了測(cè)試，與我們?cè)诖藞D中看到的相比，確實(shí)看到了20％的性能提升。

新的iPhone得分不及某些Snapdragon 855（+）設(shè)備，但這是因?yàn)锳pple不允許iPhone的發(fā)熱量幾乎與其他某些設(shè)備一樣高。我無法在任何新iPhone上測(cè)量高于41°C的場(chǎng)景。

通過測(cè)量功耗，我們?cè)俅慰吹紸13設(shè)備的峰值功率極激進(jìn)，超過6.2W。有趣的是，即使在這種耗電的峰值性能狀態(tài)下，A13的效率也比A12高，并且比競(jìng)爭(zhēng)對(duì)手的效率高得多。

通過一系列的測(cè)試，anandteh指出，去年，A13的GPU性能是同類產(chǎn)品中最佳。他們表示，去年A12在GPU方面進(jìn)行了令人印象深刻的改進(jìn)，這是蘋果第一次在性能和效率方面能夠非常明顯地領(lǐng)先于高通。

首先，A13的峰值性能確實(shí)提高了約20％。但是，這不是人們應(yīng)該最關(guān)注的指標(biāo)。與去年的iPhone相比，蘋果的持續(xù)性能得分提高更為顯著，達(dá)到50％至60％?？雌饋?，蘋果聲稱改善了SoC散熱性能的說法非常好。

最重要的是，蘋果在A13上的新型GPU微體系結(jié)構(gòu)令人印象深刻。鑒于流程節(jié)點(diǎn)的發(fā)展微不足道，我沒想到該公司能夠推動(dòng)如此大的性能和功率效率提升。我們需要從競(jìng)爭(zhēng)對(duì)手中看到一些重大的模式轉(zhuǎn)變，以使它們能夠趕上下一代設(shè)備。