您当前的位置:首页 > 计算机 > 编程开发 > 人工智能

深度学习环境搭建(deepin20.1 + NVIDIA GTX 1080 + CUDA-10.1 + cudnn-10.1-linux-x64-v7.6.5.32 + tensorflow-2.3.

时间:07-22来源:作者:点击数:

参考链接:

https://www.cdsy.xyz/computer/system/linux/230722/cd44839.html

https://www.cdsy.xyz/computer/system/linux/230722/cd44840.html

一、关于计算机的硬件配置说明

推荐配置(该配置推荐为2018年左右信息,仅做参考)

如果您是高校学生或者高级研究人员,并且实验室或者个人资金充沛,建议您采用如下配置:

  • 主板:X299型号或Z270型号
  • CPU: i7-6950X或i7-7700K 及其以上高级型号
  • 内存:品牌内存,总容量32G以上,根据主板组成4通道或8通道
  • SSD: 品牌固态硬盘,容量256G以上
  • 显卡:NVIDIA GTX TITAN(XP) NVIDIA GTX 1080ti、NVIDIA GTX TITAN、NVIDIA GTX 1080、NVIDIA GTX 1070、NVIDIA GTX 1060 (顺序为优先建议,并且建议同一显卡,可以根据主板插槽数量购买多块,例如X299型号主板最多可以采用×4的显卡)
  • 电源:由主机机容量的确定,一般有显卡总容量后再加200W即可

二、显卡安装

deepin20上的NVIDIA 显卡安装详见其它文章

https://www.cdsy.xyz/computer/system/linux/230722/cd44836.html

三、CUDA10.1安装

1、查看最新或合适的tensorflow版本及其对应的各驱动组件匹配情况(显卡驱动、cuda、cudnn等):

https://tensorflow.google.cn/install/source#install_gpu_support_optional_linux_only

2、在NVIDIA官网查看cuda和显卡驱动版本对应关系(https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html):

(如果做学习研究用,最好提前看好自己所用架构是否能支持所选cuda版本)

3、Cuda下载地址https://developer.nvidia.com/cuda-toolkit-archive)单击左侧Cuda版本,跳转后依次选择操作系统-计算机位数-系统型号-系统版本(选ubuntu版,cuda11可选择debian版)

4、安装,最终参考官网吧,一步一步来安装说明

(不同版本官网说明不同,自行查找)

查看GPU信息:lspci | grep -i nvidia

查看系统信息:uname -m && cat /etc/*release

查看GCC信息:gcc --version

打开终端,在数据盘新建cuda安装文件夹

mkdir /media/xingzhi/BigData/apps/cuda_10.1

进入cuda安装文件所在目录

cd /media/xingzhi/MyFiles/software/nvidia

直接运行下载的.run文件安装即可(该步很重要,需谨慎,否则容易报错)

sudo ./cuda_10.1.105_418.39_linux --silent --toolkit --toolkitpath=/media/xingzhi/BigData/apps/cuda_10.1 --defaultroot=/media/xingzhi/BigData/apps/cuda_10.1 --samples --samplespath=/media/xingzhi/BigData/apps/cuda_10.1

继续

输入accept回车

取消掉Driver的勾选,安装其他的,Install回车,稍等安装结果如下(类似):

建立软连接

sudo ln -s /media/xingzhi/BigData/apps/cuda_10.1 /usr/local

添加环境变量

sudo vim /etc/profile

在配置文件底部加入:

export CUDA_HOME=/usr/local/cuda_10.1

export PATH=/usr/local/cuda_10.1/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda_10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后source环境变量并重启系统

source /etc/profile

reboot

验证是否正确安装。进入实例目录

cd /usr/local/cuda/samples/1_Utilities/deviceQuery

执行:sudo make

sudo ./deviceQuery

到此cuda安装完毕。

四、cudnn下载与安装

1.下载地址官网(https://developer.nvidia.com/rdp/cudnn-download)

需要注册账号后登录,才可以下载(可在网上相应百度网盘下载源,一般要收费)

在此提供本人分享的资源:(链接: https://pan.baidu.com/s/17G5UuOTm3ufM_FiC58fqhw 密码: fjpi)

下载完成后,逐条执行一下命令(解压-复制文件到制定目录):

tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

进行验证,执行cat /usr/local/cuda/include/cudnn.h | grep CUDNN_ -A 2

出现以上结果则表示cudnn安装正确。

如需卸载,删除复制的文件即可,命令如下,命令一定要小心谨慎使用:

sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/lib64/libcudnn*

sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/include/cudnn.h

到此cudnn安装完毕

五、安装tensorflow

1、pypi网站(https://pypi.org/project/tensorflow/2.3.2/#files)下载对应版本的包

2、安装

pip install tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64.whl

六、深度学习验证GPU使用效果(tensorflow版本大于等于2.0)

1、

# import tensorflow as tf

# tf.test.is_gpu_available() # 返回 True

# images = np.random.randn(1, 100, 100, 3)

# filters = np.zeros((1, 3, 3, 3))

# output = tf.nn.conv2d(images, filters, 2, padding='SAME')

2、

nvidia-smi

以上两种方法皆说明tensorflow调用GPU加速计算成功。

谨此以飨读者。祝大家学习快乐。

谢谢。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门