快科技6月15日消息,AMD顯卡用戶在Windows系統下試圖同時運行AI推理和大型DX12游戲時,顯卡常因驅動級資源沖突崩潰,錯誤代碼為exit code 2或0xc0000005。這一困擾開發者數年的局面,近日被GitHub用戶Beat-k通過開源項目徹底解決。
該開發者通過GitHub開源項目BEA_ROCm發布補丁方案,在Radeon RX 7900 GRE顯卡上首次實現了DX12游戲與ROCm AI推理的無沖突并發。
同時,他排查出導致崩潰的多層原因,包括Flash Attention KV緩沖區布局解析差異、SDMA引擎隊列沖突、顯存過度分配、AMD AGS庫與Adrenalin驅動沖突,以及驅動遙測模塊對內核調度的破壞。
![]()
需要指出的是,這些Bug存在層級依賴的堵塞效應,必須按順序逐個解決才能暴露下一層問題。
修復方案采用雙層補丁架構。第一層通過環境變量補丁集在ROCm子進程啟動前應用環境變量預置修復。
第二層向llama.cpp提交35行C++補丁,針對gfx1100架構進行Windows ROCm的流同步與Flash Attention門控處理。
實測結果顯示,修復方案通過了10輪《彩虹六號:圍攻》DX12游戲+Ollama 7B模型推理的壓力測試,游戲全程無一崩潰。
AI推理平均延遲12.2秒,顯存占用穩定在9.5GB,DX12負載在6輪游戲中保持飽和。
SDK已開源,上游PR準備就緒,并已通過第三方在gfx1101/Ubuntu平臺完成交叉驗證。
這表示A卡用戶終于可以在游戲的同時自由使用本地AI,也為RDNA 3全系顯卡在Windows平臺上的AI+圖形多任務解鎖了系統級的通用修復路徑。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.