在阿里云ECS实例 ecs.gn6i-c4g1.xlarge(搭载NVIDIA T4显卡)上安装CUDA的步骤如下:
1. 确认实例配置
- 显卡型号:NVIDIA T4(支持CUDA)
- 驱动需求:需安装NVIDIA驱动和CUDA Toolkit。
2. 安装NVIDIA驱动
方法一:通过阿里云预装驱动(推荐)
- 该实例通常已预装NVIDIA驱动,验证:
nvidia-smi若显示GPU信息(如T4的驱动版本),跳过驱动安装;若未安装,继续:
方法二:手动安装驱动
- 禁用默认的
nouveau驱动:echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf sudo update-initramfs -u sudo reboot - 安装驱动(以Ubuntu为例):
sudo apt update sudo apt install -y nvidia-driver-535 # 推荐使用535或更高版本 sudo reboot - 验证:
nvidia-smi
3. 安装CUDA Toolkit
-
下载CUDA
访问 NVIDIA CUDA下载页,选择:- Operating System: Linux
- Architecture: x86_64
- Distribution: 按系统选择(如Ubuntu)
- Version: 推荐CUDA 11.8或12.x(兼容T4)
- Installer Type:
runfile (local)
-
执行安装
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run sudo sh cuda_12.2.2_535.104.05_linux.run- 安装时取消勾选驱动(若已安装驱动)。
- 接受协议并默认安装路径。
-
配置环境变量
在~/.bashrc或/etc/profile中添加:export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH生效配置:
source ~/.bashrc -
验证CUDA
nvcc --version
4. 安装cuDNN(可选)
- 从NVIDIA cuDNN页面下载对应CUDA版本的cuDNN。
- 解压并复制文件:
tar -xzvf cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xz sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
5. 测试CUDA
编译并运行CUDA样例:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
若输出Result = PASS,则安装成功。
注意事项
- 驱动兼容性:确保CUDA版本与驱动版本兼容(参考NVIDIA文档)。
- 多用户环境:若为多用户系统,建议将环境变量添加到
/etc/environment。 - 云平台限制:阿里云可能对内核有定制,若遇到问题,可尝试使用阿里云提供的GPU驱动或联系技术支持。
按照以上步骤,您可以在ecs.gn6i-c4g1.xlarge上顺利安装CUDA环境。
云服务器