ARM Cortex-X1架構 自研的終結者

 

 

隨着麒麟9000和三星Exynos 1080的發佈,Android手機芯髒領域正式進入了5nm時代。惋惜,麒麟9000的CPU架構仍然停留在ARM去年發佈的Cortex-A77階段,而Exynos 1080雖然用上了ARM最新發布的Cortex-A78,但出於定位的緣由它並沒能引入AMD在同期發佈的最強音Cortex-X1。緩存

若是不出意外,驍龍87五、Exynos 2100和天璣2000這些新一代5nm旗艦級SoC都會採用Cortex-X1超大核+Cortex-A78大核+Cortex-A55小核的組合。換句話說,2021年,只有搭配了Cortex-X1核心的SoC,纔有資格被稱爲「超旗艦」。架構

Cortex-X1之因此有着如此大的號召力,是由於它還有一個外號——自研的終結者。機器學習

自研的魅力性能

在GeekBench等專業測試軟件中,蘋果iPhone系列手機總能實現對同期旗艦級Android手機的「屠榜」。究其緣由,是蘋果從iPhone 5時期開始就展開了A系列處理器的「自研」之旅,憑藉強大的研發實力和資金優點,ARM原生的Cortex-A系列核心根本就不是對手。ARM全新Cortex-X1核心IP的出現,給予了Android陣營挑戰同期A系列處理器的一線曙光學習

所謂的「自研」,就是購買ARM最高級的指令集受權,而後根據自身須要開發兼容ARM的架構,但能領先ARM公版的Cortex-A架構多少全看芯片商的技術水平。測試

自研遇阻 魔改當道優化

除了蘋果,高通在驍龍600/800時代曾採用過自研的Krait架構,距離最近的驍龍820的核心也隸屬於自研的Kyro。只是,高通發現自研架構的能耗比很難領先同期公版Cortex-A7x架構太多,很是不經濟。所以,從驍龍835開始就採起了BoC戰略,也就是我們常說的「魔改」,基於現有的公版Cortex-A架構進行定製優化。架構設計

華爲從麒麟980開始,也採用了相似的思路,其大核也是基於Cortex-A架構進行了「based」,一樣是一種魔改。須要注意的是,公版Cortex-A架構能夠進行「魔改」的地方並很少,你們基本都是拿緩存部分開刀,因此不管是高通仍是麒麟,其魔改後的內核與公版架構之間的性能差別並不大,關鍵仍是看主頻。設計

三星從Exynos 8890開始也加入到自研大軍,並推出了名爲貓鼬(Mongoose)的架構核心。3d

可是,通過四代自主研發後,三星在2019年末已經決定放棄自研的Mongoose內核,並解散了位於德州奧斯汀的整個研發團隊,將來將全面使用ARM的公版方案。可見,除了蘋果,其餘芯片商的自研之路可謂一路荊棘,費力不討好。

好消息是,ARM這次發佈的「三劍客」中的Cortex-X1,其實就是一種容許芯片商在其上進行高度定製的IP內核,能夠徹底取代辛苦的「自研」之路。

超核降臨 排憂解難

若是Cortex-A78的定位是「大核」,那Cortex-X1就至關於「超大核」,它在架構設計上與Cortex-A78一模一樣,但幾乎在每一個地方都進行了擴展

好比,Cortex-X1的解碼帶寬從Cortex-A78的4路提高到5路,增長了25%;NEON浮點從2條128b提高到了4條128b,至關於浮點性能翻倍;緩存方面,Cortex-X1的L1緩存爲64KB,L2緩存1MB,L3緩存最高可達8MB,是Cortex-A78的兩倍。

根據ARM的官方資料顯示,在主頻相同時(也就是IPC性能),Cortex-X1的峯值性能較Cortex-A77提升了30%,比最新的Cortex-A78也有着22%的性能優點,機器學習能力則是Cortex-A77和A78的兩倍。

按照規劃,芯片商將來能夠選擇1個Cortex-X1「超核」+3個Cortex-A78「大核」+4個Cortex-A55「小核」組成的三叢集DynamIQ集羣,以實現性能和功耗的完美平衡。

惟一惋惜的,就是Cortex-X1內核會佔用更大的封裝面積。

在理論性能方面,4個Cortex-A78核心在搭配4MB L3緩存時,其性能比前代Cortex-A77可提高20%,同時核心面積下降15%;而1個Cortex-X1+3個Cortex-A78核心在搭配8MB L3緩存時,雖然核心面積會增長15%,但峯值性能提高了30%。

看到這裏,你們應該知道ARM爲何將Cortex-A78的L1指令緩存改成32KB或64KB可選項目了吧?選擇32KB L1指令緩存後,節省下來的封裝空間能夠留給Cortex-X1,後者強大的性能足以彌補Cortex-A78緩存的部分缺失。至於爲何Cortex-X1的IPC性能比Cortex-A78增長22%,但1+3+4的組合卻只比4+4多提高了10%的性能,是由於Cortex-X1只有單獨的1顆應戰,被其餘3顆Cortex-A78平均了性能。

同屬超核 性能不一

須要注意的是,ARM對Cortex-X1的定義是「可定製」移動平臺,芯片商能夠根據預算和需求向ARM提出要求,而後ARM再根據不一樣的應用場景調整Cortex-X1各個模塊的規格設計。

所以,哪怕高通驍龍、三星Exynos、聯發科天璣的下一代超旗艦SoC都用上了Cortex-X1內核,但它們之間也會因每時鐘週期指令解碼數量、L0-BTB容量、宏操做緩存容量、亂序窗口數量、每時鐘週期指令發射數量和緩存容量等細節參數的不一樣,而呈現出不一樣的性能。都是Cortex-X1核心,並且主頻相同,但在性能層面可能依舊存在必定的差別。

換句話說,捨得花錢,或者能經過SoC結構優化,解決Cortex-X1滿載溫度和功耗偏高問題的芯片性能確定會更強一些,爲了打出Cortex-X1噱頭但沒有對其進行深度挖掘的芯片性能就會差一些。

相關文章
相關標籤/搜索