ARM Cortex-X1架構自研的終結者

隨着麒麟9000和三星Exynos 1080的發佈，Android手機芯髒領域正式進入了5nm時代。惋惜，麒麟9000的CPU架構仍然停留在ARM去年發佈的Cortex-A77階段，而Exynos 1080雖然用上了ARM最新發布的Cortex-A78，但出於定位的緣由它並沒能引入AMD在同期發佈的最強音Cortex-X1。緩存

若是不出意外，驍龍87五、Exynos 2100和天璣2000這些新一代5nm旗艦級SoC都會採用Cortex-X1超大核+Cortex-A78大核+Cortex-A55小核的組合。換句話說，2021年，只有搭配了Cortex-X1核心的SoC，纔有資格被稱爲「超旗艦」。架構

Cortex-X1之因此有着如此大的號召力，是由於它還有一個外號——自研的終結者。機器學習

自研的魅力性能

在GeekBench等專業測試軟件中，蘋果iPhone系列手機總能實現對同期旗艦級Android手機的「屠榜」。究其緣由，是蘋果從iPhone 5時期開始就展開了A系列處理器的「自研」之旅，憑藉強大的研發實力和資金優點，ARM原生的Cortex-A系列核心根本就不是對手。ARM全新Cortex-X1核心IP的出現，給予了Android陣營挑戰同期A系列處理器的一線曙光。學習

所謂的「自研」，就是購買ARM最高級的指令集受權，而後根據自身須要開發兼容ARM的架構，但能領先ARM公版的Cortex-A架構多少全看芯片商的技術水平。測試

自研遇阻魔改當道優化

除了蘋果，高通在驍龍600/800時代曾採用過自研的Krait架構，距離最近的驍龍820的核心也隸屬於自研的Kyro。只是，高通發現自研架構的能耗比很難領先同期公版Cortex-A7x架構太多，很是不經濟。所以，從驍龍835開始就採起了BoC戰略，也就是我們常說的「魔改」，基於現有的公版Cortex-A架構進行定製優化。架構設計

華爲從麒麟980開始，也採用了相似的思路，其大核也是基於Cortex-A架構進行了「based」，一樣是一種魔改。須要注意的是，公版Cortex-A架構能夠進行「魔改」的地方並很少，你們基本都是拿緩存部分開刀，因此不管是高通仍是麒麟，其魔改後的內核與公版架構之間的性能差別並不大，關鍵仍是看主頻。設計

三星從Exynos 8890開始也加入到自研大軍，並推出了名爲貓鼬（Mongoose）的架構核心。3d

可是，通過四代自主研發後，三星在2019年末已經決定放棄自研的Mongoose內核，並解散了位於德州奧斯汀的整個研發團隊，將來將全面使用ARM的公版方案。可見，除了蘋果，其餘芯片商的自研之路可謂一路荊棘，費力不討好。

好消息是，ARM這次發佈的「三劍客」中的Cortex-X1，其實就是一種容許芯片商在其上進行高度定製的IP內核，能夠徹底取代辛苦的「自研」之路。

超核降臨排憂解難

若是Cortex-A78的定位是「大核」，那Cortex-X1就至關於「超大核」，它在架構設計上與Cortex-A78一模一樣，但幾乎在每一個地方都進行了擴展。

好比，Cortex-X1的解碼帶寬從Cortex-A78的4路提高到5路，增長了25%；NEON浮點從2條128b提高到了4條128b，至關於浮點性能翻倍；緩存方面，Cortex-X1的L1緩存爲64KB，L2緩存1MB，L3緩存最高可達8MB，是Cortex-A78的兩倍。

根據ARM的官方資料顯示，在主頻相同時（也就是IPC性能），Cortex-X1的峯值性能較Cortex-A77提升了30%，比最新的Cortex-A78也有着22%的性能優點，機器學習能力則是Cortex-A77和A78的兩倍。

按照規劃，芯片商將來能夠選擇1個Cortex-X1「超核」+3個Cortex-A78「大核」+4個Cortex-A55「小核」組成的三叢集DynamIQ集羣，以實現性能和功耗的完美平衡。

惟一惋惜的，就是Cortex-X1內核會佔用更大的封裝面積。

在理論性能方面，4個Cortex-A78核心在搭配4MB L3緩存時，其性能比前代Cortex-A77可提高20%，同時核心面積下降15%；而1個Cortex-X1+3個Cortex-A78核心在搭配8MB L3緩存時，雖然核心面積會增長15%，但峯值性能提高了30%。

看到這裏，你們應該知道ARM爲何將Cortex-A78的L1指令緩存改成32KB或64KB可選項目了吧？選擇32KB L1指令緩存後，節省下來的封裝空間能夠留給Cortex-X1，後者強大的性能足以彌補Cortex-A78緩存的部分缺失。至於爲何Cortex-X1的IPC性能比Cortex-A78增長22%，但1+3+4的組合卻只比4+4多提高了10%的性能，是由於Cortex-X1只有單獨的1顆應戰，被其餘3顆Cortex-A78平均了性能。

同屬超核性能不一

須要注意的是，ARM對Cortex-X1的定義是「可定製」移動平臺，芯片商能夠根據預算和需求向ARM提出要求，而後ARM再根據不一樣的應用場景調整Cortex-X1各個模塊的規格設計。

所以，哪怕高通驍龍、三星Exynos、聯發科天璣的下一代超旗艦SoC都用上了Cortex-X1內核，但它們之間也會因每時鐘週期指令解碼數量、L0-BTB容量、宏操做緩存容量、亂序窗口數量、每時鐘週期指令發射數量和緩存容量等細節參數的不一樣，而呈現出不一樣的性能。都是Cortex-X1核心，並且主頻相同，但在性能層面可能依舊存在必定的差別。

換句話說，捨得花錢，或者能經過SoC結構優化，解決Cortex-X1滿載溫度和功耗偏高問題的芯片性能確定會更強一些，爲了打出Cortex-X1噱頭但沒有對其進行深度挖掘的芯片性能就會差一些。

ARM Cortex-X1架構 自研的終結者

ARM Cortex-X1架構自研的終結者