在Ubuntu 24.04上搭建深度学习环境是完全可行的,以下是详细的步骤指南,涵盖主流工具和常见问题的解决方案:
1. 系统准备
-
更新系统
sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake git wget curl software-properties-common -
安装NVIDIA驱动
- 自动安装推荐版本:
sudo ubuntu-drivers autoinstall - 重启后验证:
nvidia-smi # 查看驱动和GPU状态
- 自动安装推荐版本:
2. CUDA & cuDNN安装
-
CUDA Toolkit 12.x
- 通过官方仓库安装(适配24.04):
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb sudo dpkg -i cuda-keyring_1.1-1_all.deb sudo apt update sudo apt install -y cuda-toolkit-12-4 - 添加环境变量到
~/.bashrc:export PATH=/usr/local/cuda-12.4/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH source ~/.bashrc
- 通过官方仓库安装(适配24.04):
-
cuDNN 8.9+
- 从NVIDIA官网下载.deb包,按指南安装。
3. Python环境管理
推荐使用conda或venv隔离环境:
- Miniconda安装
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh - 创建虚拟环境:
conda create -n dl python=3.10 -y conda activate dl
4. 深度学习框架安装
- PyTorch (支持CUDA 12.x)
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 - TensorFlow 2.x
pip install tensorflow[and-cuda]==2.15 - 验证GPU支持
import torch print(torch.cuda.is_available()) # 应返回True
5. 可选工具
- Docker支持
sudo apt install docker.io sudo usermod -aG docker $USER # 将用户加入docker组 - Jupyter Lab
pip install jupyterlab
常见问题解决
- CUDA版本冲突:确保
nvcc --version与nvidia-smi显示的CUDA版本兼容。 - 权限问题:使用
sudo或配置用户组权限(如docker组)。 - 依赖缺失:通过
apt install安装缺失的库(如libcupti-dev)。
总结
Ubuntu 24.04对深度学习支持良好,关键步骤包括:
- 正确安装NVIDIA驱动和CUDA。
- 使用虚拟环境隔离Python依赖。
- 选择与CUDA 12.x兼容的框架版本。
按此流程操作,30分钟内即可完成环境搭建。遇到问题可查阅各框架官方文档或社区论坛(如Stack Overflow)。
云服务器