「马上学tensorflow2.0」Ubuntu安装tensorflow2.0的CPU或GPU版本

2019-07-25 11:04发布

"

大家好,今天我们学习【马上学tensorflow 2.0】之 Ubuntu系统安装tensorflow2.0的CPU或GPU版本。

我们 马上学三点

  1. 安装Anaconda
  2. 安装CPU版本
  3. 安装GPU版本,包括CUDA和cuDNN

大家可以点击下面的“ 了解更多 ”,或搜索“ 马上学123 ”,观看视频PPT讲义。

安装 Anaconda (python环境)

Anaconda是一个非常强大的python工具, 安装Anaconda后,我们就拥有了python环境和大量包, 功能非常强大,可以节省很多流程,省时省心。

下载地址:

https://www.anaconda.com/distribution/

选择Linux图标, “下载”按钮上点右键复制下载链接

在终端输入下面的命令下载

wget https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh

运行sh命令安装

sh Anaconda3-2019.03-Linux-x86_64.sh

注意:安装快结束的时候,输出会提示“是否配置环境变量”,选择yes。

Do you wish the installer to initialize Anaconda3
by running conda init? [yes|no]
[no] >>>

或者自己配置环境变量:

vim ~/.bashrc

在最后添加下面一行:

export PATH=~/anaconda3/bin:$PATH

保存后,重新打开一个终端, 或者使用命令激活修改后的环境变量:

source ~/.bashrc

方案一:使用命令安装 CUDA和cuDNN

去官网查看安装命令:

\"「马上学tensorflow2.0」Ubuntu安装tensorflow2.0的CPU或GPU版本\"

地址: https://tensorflow.google.cn/install/gpu

安装命令:

# 添加NVIDIA包存储库
# 为apt-key添加HTTPS支持
sudo apt-get install gnupg-curl
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1604/x86_64/nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb
sudo apt-get update

# 安装NVIDIA驱动程序,需要创建/usr/lib/nvidia
sudo mkdir /usr/lib/nvidia
sudo apt-get install --no-install-recommends nvidia-410
# 重启。使用命令 “nvidia-smi”检查GPU驱动是否安装成功

# 安装CUDA 和cuDNN
sudo apt-get install --no-install-recommends \\
cuda-10-0 \\
libcudnn7=7.4.1.5-1+cuda10.0 \\
libcudnn7-dev=7.4.1.5-1+cuda10.0

按照上面的命令, 先安装驱动,重启,

使用命令 “nvidia-smi”检查GPU驱动是否安装成功, 然后安装CUDA 和cuDNN。

通过这些命令安装的CUDA是很简洁的版本, 安装简单,不需要配置环境。

还有一种方法,直接使用conda命令安装 “conda install tensorflow-gpu\" , 它会自己安装CUDA和cuDNN依赖库。 一条命令就可以搞定。 但是conda的版本更新慢,目前还没有2.0的版本。

你也可以查看下文自己下载CUDA文件安装,设置环境变量的版本。

方案二,下载文件后安装CUDA和cuDNN:

安装CUDA

登陆Nvidia官网: https://developer.nvidia.com/cuda-toolkit-archive

选择我们需要的 “CUDA Toolkit 10.0 ”版本, 进入后选择Ubuntu版本,

这里有两种方法:

第一种方案run文件,下载 “runfile (local)”版本

\"「马上学tensorflow2.0」Ubuntu安装tensorflow2.0的CPU或GPU版本\"

查看驱动的版本号: cat /proc/driver/nvidia/version 必须高于 410。

下载完成后,运行: sudo sh cuda_10.0.130_410.48_linux.run

按照提示安装,我的驱动高于410, 所以第一个选择了 no,其它选择 yes。

第二种方案,下载deb文件 (我的安装出现问题,下载的是10.0版本,安装后变成10.1版本):

\"「马上学tensorflow2.0」Ubuntu安装tensorflow2.0的CPU或GPU版本\"

在文件所在目录下, 运行下面的命令安装:

# 解压到 /var/cuda-repo-* 目录下
sudo dpkg -i cuda-repo-ubuntu1604-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-0-local-10.0.130-410.48/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

设置环境变量:

vim ~/.bashrc

末尾添加:

export LD_LIBRARY_PATH=\"$LD_LIBRARY_PATH:/usr/local/cuda/lib64/\"
export LIBRARY_PATH=\"$LIBRARY_PATH:/usr/local/cuda/lib64\"

查看驱动的版本号: cat /proc/driver/nvidia/version

使用 “nvidia-smi” 查看驱动是否安装成功, 使用“watch -n 1 nvidia-smi”实时监控GPU, 每秒刷新一次,这个训练模型时很有用。

使用“nvcc -V” 查看CUDA是否安装成功, 这会显示CUDA的版本号。

安装cuDNN

接下来安装cuDNN, 下载地址: https://developer.nvidia.com/rdp/cudnn-archive

需要在nvidia上注册账号, 使用邮箱注册就可以,登陆账号后才能下载。 然后选择上面要求的 cuDNN 7.4.1,选择对应“cuDNN Library for Linux”版本。

下载完cudnn后,

# 解压文件到默认的cuda文件
tar zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
# 复制头文件、动态文件和软链接到系统CUDA对应目录
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/* /usr/local/cuda/lib64/

查看cudnn是否安装成功, 看它的版本号是否正确,头文件中有记录。

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装 tensorflow-gpu

在windows的“开始”菜单中找到刚刚安装的“Anaconda3 (64-bit)”, 运行“Anaconda Prompt”,打开终端命令窗口。

tensorflow 2.0安装命令:

''' pip install tensorflow-gpu==2.0.0-beta1 -i https://pypi.tuna.tsinghua.edu.cn/simple

'''

\"-i\"从清华的镜像安装,速度会快非常多。

测试 tensorflow 2.0是否安装成功

我们在刚刚的“Anaconda Prompt”命令窗口中, 输入“python”进入python交互模式, 输入下面的两行代码:

import tensorflow as tf
print(tf.__version__)
tf.test.gpu_device_name()
tf.test.is_gpu_available()

对应的输出:

2.0.0-beta1
'/device:GPU:0'
True

没有报错,说明安装成功了。

总结:

Ubuntu系统安装tensorflow2.0的GPU版本, 需要严格按照官方的版本要求安装, 比如我使用deb安装CUDA,变成了10.1版本,这是不支持的, 改成run文件安装就成功了。


这里讲了三点,关键词有哪几个?

问题,你觉得新手一定要安装GPU版本吗?

欢迎回复评论!

马上学,很简单!

"
文章来源: https://www.toutiao.com/group/6710207562781819404/