今天运行之前可以正常运行的项目时,发现了以下问题:
在这里插入图片描述
接下来记录解决过程:

  1. 参考:os.environ[“CUDA_VISIBLE_DEVICES”]="2"的问题

    因为代码中设置了选择了具体的GPU的型号,但是有可能没有这个GPU,需要找到对应的GPU,但GPU可以修改为0。但是这个对我来说没有效果。

  2. 接着查看是否可以用cuda

    import torch
    print(torch.cuda.device_count())
    torch.cuda.is_available()
    

    在这里插入图片描述

  3. 查看显卡驱动是否安装成功
    终端输入:

    nvidia-smi
    

    在这里插入图片描述
    如果没有安装过驱动应该是这样的:
    在这里插入图片描述
    需要安装驱动,可以参考我的博客:ubuntu显卡驱动安装
    但是我以前安装过,就尝试其他方法:参考链接

  4. 查看cuda版本

    nvcc -V
    

    在这里插入图片描述发现cudn已安装。

  5. 查看已安装驱动的版本信息

    ls /usr/src | grep nvidia
    

    在这里插入图片描述

  6. 输入以下命令
    根据自己的驱动版本修改:

    sudo apt-get install dkms
    sudo dkms install -m nvidia -v 550.135
    

    完成结果:
    在这里插入图片描述

  7. 尝试nvidia-smi:
    在这里插入图片描述

然后运行代码就没问题了。希望以上信息能帮助到大家。

Logo

一站式 AI 云服务平台

更多推荐