鯤鵬性能優化十板斧以前言 | 鯤鵬處理器NUMA簡介與性能調優五步法

鯤鵬處理器NUMA簡介

隨着現代社會信息化、智能化的飛速發展,愈來愈多的設備接入互聯網、物聯網、車聯網,從而催生了龐大的計算需求。可是功耗牆問題以功耗和冷卻兩大限制極大的影響了單核算力的發展。爲了知足智能世界快速增加的算力需求,多核架構成爲最重要的演進方向。性能優化

傳統的多核方案採用的是SMP(Symmetric Multi-Processing)技術,即對稱多處理器結構,如圖1-1所示。在對稱多處理器架構下,每一個處理器的地位都是平等的,對內存的使用權限也相同。任何一個程序或進程、線程均可以分配到任何一個處理器上運行,在操做系統的支持下,能夠達到很是好的負載均衡,讓整個系統的性能、吞吐量有較大提高。可是,因爲多個核使用相同的總線訪問內存,隨着核數的增加,總線將成爲瓶頸,制約系統的擴展性和性能。架構

鯤鵬處理器支持NUMA(Non-uniform memory access, 非統一內存訪問)架構,可以很好的解決SMP技術對CPU核數的制約。NUMA架構將多個核結成一個節點(Node),每個節點至關因而一個對稱多處理機(SMP),一塊CPU的節點之間經過On-chip Network通信,不一樣的CPU之間採用Hydra Interface實現高帶寬低時延的片間通信,如圖1-2所示。在NUMA架構下,整個內存空間在物理上是分佈式的,全部這些內存的集合就是整個系統的全局內存。每一個核訪問內存的時間取決於內存相對於處理器的位置,訪問本地內存(本節點內)會更快一些。Linux內核從2.5版本開始支持NUMA架構,如今的操做系統也提供了豐富的工具和接口,幫助咱們完成就近訪問內存的優化和配置。因此,使用鯤鵬處理器所實現的計算機系統,經過適當的性能調優,既可以達成很好的性能,又可以解決SMP架構下的總線瓶頸問題,提供更強的多核擴展能力,以及更好更靈活的計算能力。負載均衡

性能調優五步法

性能優化一般能夠經過以下五個步驟完成。分佈式

在性能調優經驗比較少或者對系統的軟硬件並非很是瞭解時,能夠參考使用五步法的模式逐步展開性能調優的工做。對於有豐富調優經驗的工程師,或者對系統的性能瓶頸已經有深刻洞察的專家,也能夠採用其餘方法或過程展開優化工做。工具

相關文章
相關標籤/搜索