https://www.jianshu.com/p/ab956df5e40c

原始知乎文章:https://zhuanlan.zhihu.com/p/27682206?utm_medium=social&utm_source=wechat_session

几乎是遇到与知乎张三同样的问题

1. 买带水冷的GPU

但是控温效果不好,下图是平时状态。
问题是在进行训练的时候
GPU-util使用率100,
memory-Usage是4000MiB.

风扇百分之49,温度86!!!

2. 调节GPU风扇

我注意到Nvidia自动调节风扇的方式很奇怪: GPU温度达到85度左右的时候, 风扇却只运行在50%的速度. 在网上搜索了很多更改GPU风扇的方法, 尝试很久后终于成功, 下面是具体步骤.

显示显卡状态:
$ watch -n 1 nvidia-smi


 

1 修改/etc/X11/xorg.conf文件

sudo nano /etc/X11/xorg.conf

2 如果不能打开文件xorg.conf
使用终端指令:$ chomd a+w xorg.conf

3 在Section "Device"里面加入 Option "Coolbits" "4"
其实就是加入了这一行
Option          "Coolbits" "4"

Section "Device"
        Identifier      "Device0"
        Driver          "nvidia"
        VendorName      "NVIDIA"
        Option          "Coolbits" "4"
EndSection

4 输入如下指令控制风扇速度:
$ nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUTargetFanSpeed=100"
尽量别写100,风扇会狂转,写个60试一试

加上风扇85之后温度降到了71C!!!

5 恢复到最初的自动控制风扇转速的状态
$ nvidia-settings -a "[gpu:0]/GPUFanControlState=0"

 

Logo

一站式 AI 云服务平台

更多推荐