快科技6月15日消息,AMD显卡用户在Windows系统下试图同时运行AI推理和大型DX12游戏时,显卡常因驱动级资源冲突崩溃,错误代码为exit code 2或0xc0000005。这一困扰开发者数年的局面,近日被GitHub用户Beat-k通过开源项目彻底解决。
该开发者通过GitHub开源项目BEA_ROCm发布补丁方案,在Radeon RX 7900 GRE显卡上首次实现了DX12游戏与ROCm AI推理的无冲突并发。
同时,他排查出导致崩溃的多层原因,包括Flash Attention KV缓冲区布局解析差异、SDMA引擎队列冲突、显存过度分配、AMD AGS库与Adrenalin驱动冲突,以及驱动遥测模块对内核调度的破坏。
需要指出的是,这些Bug存在层级依赖的堵塞效应,必须按顺序逐个解决才能暴露下一层问题。
修复方案采用双层补丁架构。第一层通过环境变量补丁集在ROCm子进程启动前应用环境变量预置修复。
第二层向llama.cpp提交35行C++补丁,针对gfx1100架构进行Windows ROCm的流同步与Flash Attention门控处理。
实测结果显示,修复方案通过了10轮《彩虹六号:围攻》DX12游戏+Ollama 7B模型推理的压力测试,游戏全程无一崩溃。
AI推理平均延迟12.2秒,显存占用稳定在9.5GB,DX12负载在6轮游戏中保持饱和。
SDK已开源,上游PR准备就绪,并已通过第三方在gfx1101/Ubuntu平台完成交叉验证。
这表示A卡用户终于可以在游戏的同时自由使用本地AI,也为RDNA 3全系显卡在Windows平台上的AI+图形多任务解锁了系统级的通用修复路径。





