Intel X86 優化指南閱讀筆記--通用優化(前端)

PROCESSOR PERSPECTIVES 以下優化建議,在不同微架構下收益差別較大: 指令譯碼的吞吐量很重要。利用好decoded ICache,Loop Stream Detector和macro-fusion能進一步提高CPU前端性能。 充分利用好4個譯碼器來產生代碼。利用好micro-fusion和macro-fusion,這樣其中3個簡單譯碼器就再被限制爲只能譯碼只含有一條uop的簡
相關文章
相關標籤/搜索