cuda安装命令,cuda安装步骤

  cuda安装命令,cuda安装步骤

  首先确认安装好cuda,cudnn本人电脑:cuda9.0cudnn7.3查看库达版本(nvcc -V也可以)

  cat /usr/local/cuda/version.txt查看加速库版本cat/usr/local/cuda/include/cud nn。h grep cud nn _ MAJOR-A 2注意:如果可以直接使用点安装点安装pycuda==2017。1 .1-I https://pypi.tuna.tsinghua.edu.cn/simple如果出现问题不知如何是好(1、cuda.h问题,还有根权限问题)

  下载安装pypi https://号。金枪鱼。清华。edu。cn/packages/B3/30/9 E1 c 0 a 4c 10 e 90 B4 c 59 ca 7 aa 3c 518 e 96 f 37 aabcac 73 FFE 6b 5d 9658 f 6 ef 843/py cuda-2017。1 .1 .焦油。地面零点

  下载链接

  下载解压,然后在解压目录下:/configure.py - python-exe=/usr/无私的丝袜/python 3-cuda-root=/usr/local/cuda-9.0-cuda RV-lib-dir=/usr/lib/x86 _ 64-Linux-GNU-boost-Inc-dir=/usr/lib-boost-python-libname=boost _ python-py35-boost-thread-libname=boost _ thread-no-use-shipped-boost tython 3 configure。py-cuda-root=/usr/local/cuda安装完成测试:

  从pycuda .编译器导入SourceModulemod=源模块( _ _ global _ _ void multiply _ them(float * dest,float *a,float * b){ const int I=threadidx。x;dest[I]=a[I]* b[I];}“”)multiply _ them=mod。get _ function( multiply _ them )a=numpy。随机的。randn(400分).as类型(numpy。float 32)b=numpy。随机的。randn(400分).as类型(numpy。float 32)dest=numpy。零像(a)乘它们(drv).输出(目标),驱动。在(一)中,drv .在(二)中,block=(400,1,1),grid=(1,1)) print ( dest-a*b)这时可能出现错误:

  命令:nvcc - cu无私的丝袜-arch sm _ 75-I/home/user/anaconda 3/lib/python 3.6/site-packages/pycuda/cuda内核。铜]此时可能原因时你的地面动力装置支持的算力不匹配(本人1660年,尝试sm_70,没有问题)

  尝试指令

  nvcc - cu无私的丝袜-arch sm_70 -I(路径)路径为报错的那块只要不出现同样的错误,应该是通过了然后修改源码/usr/local/lib/python 3.5/dist-packages/py cuda/compiler。巴拉圭

  # arch= sm _ % d % d % context。获取设备().compute _ capability()arch= sm _ 70 将上边的屏蔽,改成下边的直接赋值,前提是sm_后边的数字适合你的电脑再次运行上边的例子如果通过会出现下边

  [0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.]再运行第二个例子;

  进口py cuda。自动初始化导入py cuda。driver as drvimport numpy as NP from time它从py cuda导入default _ timer作为定时器。编译器导入SourceModulemod=源模块( _ _ global _ _ void func(float * a,float *b,size _ t N){ const int I=block idx。x *块尺寸。x threadidx。x;if(I=N){ return;} float temp _ a=a[I];float temp _ b=b[I];a[I]=(temp _ a * 10 ^ 2)*((temp _ b ^ 2)* 10-5)* 5;//a[I]=a[I]b[I];} )func=mod。get _ function( func )def test(N):# N=1024 * 1024 * 90 # float:4M=1024 * 1024 print( N=% d % N)N=NP。int 32(N)a=NP。随机的。随机的.astype(NP。float 32)b=NP。随机的。随机的.astype(NP。float 32)#复制a到aa aa=NP。empty _ like(a)aa[:]=a # GPU run N heads=256N blocks=int((N N heads-1)/N heads)start=timer()func(drv。InOut(a),drv .在(b)中,N,block=(N heads,1,1),grid=( nBlocks,1))run _ time=timer()-start print( GPU运行时间%f秒%运行时间)# cpu运行开始=timer()aa=(aa * 10 ^ 2)*((b ^ 2)* 10-5 run _ time=timer()-开始打印( CPU运行时间%f秒%运行时间)#检查结果r=a - aa print( min(r),max(r))def main():for N in range(1 ^ 10):N=1024 * 1024 *(N * 10)print(-% d- % N)test(N)if _ _ name _ _= _ _ main _ _ :main()这个例子运行可能出现

  [命令:nvcc - cu无私的丝袜-arch sm _ 70-I/usr/local/lib/python 3.5/dist-packages/py cuda/cuda内核。Cu][stderr:gcc:尝试执行cc1plus 时出错:execvp:没有那个文件或目录]此时可能原因(同地面控制中心)地面控制中心和g匹配,换成相同版本即可,改一个就好。

  编译器版本查看(sudo apt-get安装gcc-4.9)

  g -v查看(sudo apt-get安装g -4.9)

  cd /usr/无私的丝袜sudo ln-SF g-4.9g sudo ln-SF g-4.9 x86 _ 64-Linux-GNU-g sudo ln-SF gcc-4.9 gccsudo ln-SF gcov-4.9 gcovsudo ln-SF gcc x86 _ 64-Linux-GNU-gcc再次运行:

  - 1 - N=10485760gpu运行时间0.026409秒中央处理器运行时间0.069521秒-0.0014648438 0.0014648438-2-N=20971520 GPU运行时间0.042998秒中央处理器运行时间0.113894秒-0.0009765625 0.0014648438 - 3 0.267497秒-0.0014648438 0.0014648438-6-N=62914560 GPU运行时间0.132429秒中央处理器运行时间0.316675秒-0.0014648438 0.001953125-7-N=73400320g聚氨酯运行时间0.200182秒中央处理器运行时间0.40至此应该没有问题了。

  参考文献:

  1、https://www.cnblogs.com/demo-deng/p/10470734.html

  2、https://blog.csdn.net/u014365862/article/details/85338619

  3、https://www.linuxidc.com/Linux/2016-08/134546.htm

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: