export CUDA_HOME=/usr/local/cuda CUDA sample 测试 CUDA安装详细参考此两篇博文,亲测好评 https://www.twistedwg.com/2018/06/15/cuda9_cudnn7.html 卸载Nvidia驱动: nvidia-smi -l xxx 监测GPU情况xxx秒后更新 例:创建虚拟环境名称为myenv,python版本为3.6 例:新建一个用户名为lxy 属于lxygroup组 ls -al /etc/sudoers 一些设定: chmod [who] [+ | – | =] [mode] 文件名 #更改权限 chown [选项] 用户或组 文件 #更改文件所属权限 环境背景:CUDA9.0+Pytorch0.4.1+GTX1660TILinux命令集锦备忘(Ubuntu16.04+CUDA9+pytorch0.4.1+GTX1660TI)
命令备忘
CUDA常用
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda9.0/
lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} 或者建立软连接: sudo rm -rf cuda sudo ln -s /usr/local/cuda-9.0 /usr/local/cuda
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
make
sudo ./deviceQuery
https://zhuanlan.zhihu.com/p/58114055GPU及CPU命令
GPU命令
./NVIDIA-Linux-x86_64-xxx.xx.run –uninstall
sudo apt-get remove –purge nvidia-*CPU命令
pytorch测试命令
conda虚拟环境相关命令
磁盘检查命令
用户管理命令
useradd -d /home/lxy lxy #建lxy用户
passwd lxy #设置lxy用户密码
chmod 700 /etc/sudoers
vim /etc/sudoers
在#User privilege specification下添加一行:lxy ALL=(ALL) ALL权限管理命令
4 可读,
2 可写,
1 可执行
0 无权限
参数:
操作对象who可是下述字母中的任一个或者它们的组合:
u 表示“用户(user)”,即文件或目录的所有者。
g 表示“同组(group)用户”,即与文件属主有相同组ID的所有用户。
o 表示“其他(others)用户”。
a 表示“所有(all)用户”。它是系统默认值。
操作符号可以是:
+ 添加某个权限。
– 取消某个权限。
= 赋予给定权限并取消其他所有权限(如果有的话)。
设置mode所表示的权限可用下述字母的任意组合:
r 可读。
w 可写。
x 可执行。
例:sudo chmod 777 filename
例:chown -R username:user_group folder今日采坑
问题经过:pytorch突然奔溃,产生运行时错误,提示device出错,具体如图
排查经过:重新安装CUDA9.0与pytorch0.4.1后依然有错误,于是开始排查CUDA9.0,在编译CUDA9.0的samples后,CUDA运行出错,继续排查发现CUDA9.0的GPU device没上来。
解决方案:卸载CUDA9.0后重装CUDA9.2,重装pytorch后,问题解决。
问题跟进:重启后发现pytorch又一次崩溃,这一次可以排除cuda9.2与pytorch0.4.1的安装问题,继续排查后,发现GPU没上来,nvidia-smi显示GPU off,如图
经查询,运行以下命令,即CUDA的sample,致使GPU on
cd /usr/local/cuda/sample/1_Utilities/deviceQuery
./deviceQuery
可以看出GPU变成了on
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算