问题:误用Ctrl+z退出程序,结果程序退出了,显存未释放,nvidia-smi仍然可以看到进程。
运行程序报错:pytorch RuntimeError: CUDA error: all CUDA-capable devices are busy or unavailable
sudo kill id无法释放显存:
解决办法:

sudo -9 kill id

解决GPU显存未释放问题

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐