TensorFlow如何指定GPU训练模型-IT俱乐部

如何指定GPU训练模型

Linux 查看当前服务器 GPU 的占用情况可以使用 nvidia-smi 命令，如下所示：

nvidia-smi

关于 nvidia-smi 命令输出的详细解释，可参考笔者的另外一篇文章：GPU状态监测 nvidia-smi 命令详解。

在此不再赘述，本文主要分享一下在用 TensorFlow 训练模型时如何指定 GPU。

在用 TensorFlow 训练深度学习模型的时候，若无手动指定，默认是选用第0块来训练，而且其他几块 GPU 也会被显示占用。

有时候，我们更希望可以自己指定一块或者多块 GPU 来训练模型，接下来介绍一种常用的也是比较有效的方法：

如果要指定只用第0块 GPU 训练，可以在 python 代码中如下指定：

import os
os.environ['CUDA_VISIBLE_DEVICES']='0'

运行 python 程序后，可发现就只有第0块 GPU 显示被占用，如上图所示。

可以如下：

os.environ['CUDA_VISIBLE_DEVICES']='1,2'

当然，上述这种方法不太方便，每次运行若换用 GPU 训练都需要改代码，可以在运行 python 程序的时候进行指定：

CUDA_VISIBLE_DEVICES=0 python textCnn.py

以上为个人经验，希望能给大家一个参考，也希望大家多多支持IT俱乐部。