AI推理性能最高提高20倍,IBM首款7nm商用處理器POWER10面世 - 知乎

歷時 5 年,製程由 14nm 減至 7nm,更加劇視 AI 推理性能,IBM 最新 POWER10 處理器將在商用領域打出一片天地。

機器之心報道,編輯:蛋醬、小舟、杜偉。緩存

在今年的 Hot Chips 2020 會議上,IBM 正式宣佈了新一代 CPU POWER10。做爲 Power 9 的繼任者,POWER10 的處理效率是前者的三倍,同時又提供了更高的工做負載量和容器密度安全

基於 Power 9 處理器並使用 Nvidia Tesla GPU 做爲加速器的 Summit,就是世界上最快的超級計算機之一。目前看來,繼任者 POWER10 更加值得期待。服務器

POWER10 的設計歷時五年,擁有數百項新型以及正在申請的專利。早在 2015 年,IBM、三星和 IBM 研究聯盟的其餘成員生產了第一批測試芯片。它的獨特之處在於,這是 IBM 的首款商用 7 nm 處理器架構

POWER10 架構師 William Starke 表示,單芯片模塊產品最多不超過 15 個 SMT8 核心,雙芯片模塊產品最多不超過 30 個 SMT8 核心。模塊化

IBM POWER 系列芯片的發展路線圖。

製程由 14nm 縮減至 7nm,更加劇視 AI 推理性能函數

吞吐量和功率效率的提高部分得益於硅製程技術,該技術使得 POWER9 中使用的 14nm GlobalFoundries 製程縮減爲三星的 7nm EUV。製程微縮使得 IBM 能夠添加更多的核心和更多的緩存。性能

設計方法也有重大更改。新的設計更加模塊化,具備新的核心核心微架構和新的 AI 指令。POWER10 還添加了更多的安全硬件。內存受到全內存加密保護,同時也沒有下降速度。測試

此外,POWER10 還爲多租戶(multi-tenant)雲工做負載內置了「嘈雜的鄰居(noisy neighbor)」保護功能。爲了確保雲工做負載的安全性,處理器支持安全的 container。該架構經過其 PowerVM 虛擬機來管理程序和內存池聚合功能,以提高靈活性,經過 PB 級系統內存支持來處理各類工做負載。加密

考慮到 AI 愈來愈重要,IBM 增長了對其餘指令和數據類型的支持。處理器經過新的可擴展指令集支持 Power 的 3.1 版本。POWER10 也意味着 IBM 更加劇視 CPU 中的 AI 推理性能。url

IBM 表示,推理處理中使用的矩陣數學函數可將性能提高 10-20 倍。緩存帶寬上也有改進,以使 SIMD 單元得到數據。

愈來愈多的企業將 AI 部署到實際應用 AI 的運營工做負載中。因此,IBM 仍將支持訓練加速器,例如 GPU 和 FPGA,但 AI 部署基於的推理使用的是訓練建立的模型。

實際上,AI 的推理用途是可以產生商業實效的。IBM 將在 PCIe5.0 版本上經過 OpenCAPI 支持加速器。IBM 也放棄了英偉達的 NVLink 接口,由於 PCIe v5 提供了足夠的帶寬。

POWER10 的推理性能展現。

其餘技術細節

IBM 在 Hot Chips 會議上展現了 POWER10 的大量技術細節。芯片面積爲 600 平方毫米,具備 180 億個晶體管。最多兩個管芯能夠被放入 POWER10 服務器的包中。

每一個芯片具備 15 個活躍的 CPU 核,其中管芯上還有一個用於提高成品率的備用核。此外,每一個 CPU 能夠支持 8 個線程(虛擬 CPU),因此每一個插槽中共計有 120 個線程。

管芯上緩存內存總量爲 150MB 以上。在接口設置上,下一代 PCI Express Gen 5 具備 64 條通路,傳輸速度高達 32GT/s。

IBM POWER10 芯片的技術規格細節。

POWER10 將會有兩個版本。一個版本採用雙管芯封裝,時鐘頻率達到 3.5GHz,而且可以鏈接 4 個插槽。另外一版本爲單芯片插槽,有更高的時鐘頻率,爲 4GHz 或更高,最多可鏈接 16 個插槽。每一個插槽的 PowerAXON 接口都支持超過 TB/s 級的帶寬,而開放式內存接口(OMI)能夠支持相同的帶寬。

POWER10 最重要的創新就是它能在整個 POWER 服務器機架上聚合內存。本地內存經過低延遲、高帶寬的 OMI 進行鏈接,從而提供高達 4TB 的內存以及高帶寬,並且沒有通常高帶寬內存的限制和費用。OMI 還可被用於鏈接存儲類內存(SCM)。

PowerAXON 接口可用於鏈接其餘 16 個 POWER10 插槽,但也能夠經過 OpenCAPI 鏈接到加速器。但它最有趣的用途是內存集羣。本地處理器能夠將其本地內存映射到相鄰的處理器,所以須要更多內存的工做負載能夠用相鄰處理器的內存,而無需將頁面交換到速度較慢的存儲內存中。這種靈活性對於管理大型數據集來講相當重要。2PB 的地址空間使之變爲了可能,並且這種內存共享功能也能夠擴展到企業級系統。

從 CPU 設計到軟件堆棧,POWER10 都展現出了 IBM 一直以來的企業級計算傳統。更重要的是,它如今支持更多的 AI 功能、硬件輔助虛擬環境、更具擴展性的雲部署以及更大的數據集處理,使其與現代企業和雲工做負載更加相關。

與此前的 Power 系列處理器同樣,POWER10 也向 OpenPower 基金會的 250 多個成員開放許可和容許修改,包括谷歌、英偉達、Mellanox、 Tyan 等企業。

參考連接:

https://www.forbes.com/sites/tiriasresearch/2020/08/17/ibm-POWER10-mega-chip-for-hybrid-cloud-is-revealed/?ss=ai#308a85a46d13

https://venturebeat.com/2020/08/16/ibm-unveils-POWER10-processor-for-big-data-analytics-and-ai-workloads/

相關文章
相關標籤/搜索