大家好,今天我们学习【马上学tensorflow 2.0】之 Ubuntu系统安装tensorflow2.0的CPU或GPU版本。
我们 马上学三点 ,
- 安装Anaconda
- 安装CPU版本
- 安装GPU版本,包括CUDA和cuDNN
大家可以点击下面的“ 了解更多 ”,或搜索“ 马上学123 ”,观看视频PPT讲义。
安装 Anaconda (python环境)
Anaconda是一个非常强大的python工具, 安装Anaconda后,我们就拥有了python环境和大量包, 功能非常强大,可以节省很多流程,省时省心。
下载地址:
https://www.anaconda.com/distribution/
选择Linux图标, “下载”按钮上点右键复制下载链接。
在终端输入下面的命令下载
wget https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh
运行sh命令安装:
sh Anaconda3-2019.03-Linux-x86_64.sh
注意:安装快结束的时候,输出会提示“是否配置环境变量”,选择yes。
Do you wish the installer to initialize Anaconda3
by running conda init? [yes|no]
[no] >>>
或者自己配置环境变量:
vim ~/.bashrc
在最后添加下面一行:
export PATH=~/anaconda3/bin:$PATH
保存后,重新打开一个终端, 或者使用命令激活修改后的环境变量:
source ~/.bashrc
方案一:使用命令安装 CUDA和cuDNN
去官网查看安装命令:
地址: https://tensorflow.google.cn/install/gpu
安装命令:
# 添加NVIDIA包存储库
# 为apt-key添加HTTPS支持
sudo apt-get install gnupg-curl
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1604/x86_64/nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb
sudo apt-get update
# 安装NVIDIA驱动程序,需要创建/usr/lib/nvidia
sudo mkdir /usr/lib/nvidia
sudo apt-get install --no-install-recommends nvidia-410
# 重启。使用命令 “nvidia-smi”检查GPU驱动是否安装成功
# 安装CUDA 和cuDNN
sudo apt-get install --no-install-recommends \\
cuda-10-0 \\
libcudnn7=7.4.1.5-1+cuda10.0 \\
libcudnn7-dev=7.4.1.5-1+cuda10.0
按照上面的命令, 先安装驱动,重启,
使用命令 “nvidia-smi”检查GPU驱动是否安装成功, 然后安装CUDA 和cuDNN。
通过这些命令安装的CUDA是很简洁的版本, 安装简单,不需要配置环境。
还有一种方法,直接使用conda命令安装 “conda install tensorflow-gpu\" , 它会自己安装CUDA和cuDNN依赖库。 一条命令就可以搞定。 但是conda的版本更新慢,目前还没有2.0的版本。
你也可以查看下文自己下载CUDA文件安装,设置环境变量的版本。
方案二,下载文件后安装CUDA和cuDNN:
安装CUDA
登陆Nvidia官网: https://developer.nvidia.com/cuda-toolkit-archive
选择我们需要的 “CUDA Toolkit 10.0 ”版本, 进入后选择Ubuntu版本,
这里有两种方法:
第一种方案run文件,下载 “runfile (local)”版本
查看驱动的版本号: cat /proc/driver/nvidia/version 必须高于 410。
下载完成后,运行: sudo sh cuda_10.0.130_410.48_linux.run
按照提示安装,我的驱动高于410, 所以第一个选择了 no,其它选择 yes。
第二种方案,下载deb文件 (我的安装出现问题,下载的是10.0版本,安装后变成10.1版本):
在文件所在目录下, 运行下面的命令安装:
# 解压到 /var/cuda-repo-* 目录下
sudo dpkg -i cuda-repo-ubuntu1604-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-0-local-10.0.130-410.48/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
设置环境变量:
vim ~/.bashrc
末尾添加:
export LD_LIBRARY_PATH=\"$LD_LIBRARY_PATH:/usr/local/cuda/lib64/\"
export LIBRARY_PATH=\"$LIBRARY_PATH:/usr/local/cuda/lib64\"
查看驱动的版本号: cat /proc/driver/nvidia/version
使用 “nvidia-smi” 查看驱动是否安装成功, 使用“watch -n 1 nvidia-smi”实时监控GPU, 每秒刷新一次,这个训练模型时很有用。
使用“nvcc -V” 查看CUDA是否安装成功, 这会显示CUDA的版本号。
安装cuDNN
接下来安装cuDNN, 下载地址: https://developer.nvidia.com/rdp/cudnn-archive
需要在nvidia上注册账号, 使用邮箱注册就可以,登陆账号后才能下载。 然后选择上面要求的 cuDNN 7.4.1,选择对应“cuDNN Library for Linux”版本。
下载完cudnn后,
# 解压文件到默认的cuda文件
tar zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
# 复制头文件、动态文件和软链接到系统CUDA对应目录
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/* /usr/local/cuda/lib64/
查看cudnn是否安装成功, 看它的版本号是否正确,头文件中有记录。
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
安装 tensorflow-gpu
在windows的“开始”菜单中找到刚刚安装的“Anaconda3 (64-bit)”, 运行“Anaconda Prompt”,打开终端命令窗口。
tensorflow 2.0安装命令:
''' pip install tensorflow-gpu==2.0.0-beta1 -i https://pypi.tuna.tsinghua.edu.cn/simple
'''
\"-i\"从清华的镜像安装,速度会快非常多。
测试 tensorflow 2.0是否安装成功
我们在刚刚的“Anaconda Prompt”命令窗口中, 输入“python”进入python交互模式, 输入下面的两行代码:
import tensorflow as tf
print(tf.__version__)
tf.test.gpu_device_name()
tf.test.is_gpu_available()
对应的输出:
2.0.0-beta1
'/device:GPU:0'
True
没有报错,说明安装成功了。
总结:
Ubuntu系统安装tensorflow2.0的GPU版本, 需要严格按照官方的版本要求安装, 比如我使用deb安装CUDA,变成了10.1版本,这是不支持的, 改成run文件安装就成功了。
这里讲了三点,关键词有哪几个?
问题,你觉得新手一定要安装GPU版本吗?
欢迎回复评论!
马上学,很简单!