快科技6月25日消息,英特爾軟件工程師Lili Cui近日發(fā)現(xiàn),對GCC編譯器通用x86調(diào)優(yōu)進行一行代碼修改,不僅能提升自家處理器性能,也能讓AMD最新架構顯著受益。
該修改將通用調(diào)優(yōu)表中的分支預測錯誤成本參數(shù),從原有的COSTS_N_INSNS(2)上調(diào)至COSTS_N_INSNS(2)+3,使編譯器在代碼生成時更重視分支預測失敗的性能損失。
![]()
現(xiàn)代CPU普遍采用更深的流水線架構以提升主頻,分支預測錯誤會導致流水線排空,造成數(shù)十個時鐘周期的性能損失,因此適當提高該參數(shù)能優(yōu)化代碼布局策略。
測試數(shù)據(jù)顯示,這項修改在SPEC CPU 2017測試套件中,為英特爾Granite Rapids帶來12.7%的性能提升,AMD Zen 5架構同樣實現(xiàn)12.1%的性能增益。
該測試基于544.nab_r核酸構建器測試用例,這是一款分子動力學模擬相關的計算密集型基準程序,分支預測對其性能影響較為顯著。
需要注意的是,該優(yōu)化僅適用于依賴通用x86/x86_64調(diào)優(yōu)的編譯場景,對于使用-march=native等特定CPU架構優(yōu)化的用戶不產(chǎn)生額外影響。
目前這一改動已正式合并進入GCC Git主線倉庫,將隨明年發(fā)布的GCC 17穩(wěn)定版正式推出,成為新版編譯器的重要性能優(yōu)化之一。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.