奋斗
努力

Ubuntu 24.04.2 LTS安装配置pytorch深度学习环境?

云计算

Ubuntu 24.04.2 LTS 上安装和配置 PyTorch 深度学习环境,主要包括以下步骤:


✅ 一、系统环境准备

1. 更新系统

sudo apt update && sudo apt upgrade -y

2. 安装基础工具

sudo apt install -y python3-pip python3-dev build-essential

推荐使用 python3,Ubuntu 24.04 默认已安装。

3. 安装虚拟环境工具(推荐)

sudo apt install -y python3-venv

创建虚拟环境(避免污染系统 Python 环境):

python3 -m venv pytorch_env
source pytorch_env/bin/activate

激活后,命令行前应出现 (pytorch_env) 提示。


✅ 二、安装 NVIDIA 驱动(如使用 GPU)

1. 检查显卡

lspci | grep -i nvidia

2. 添加官方驱动 PPA(可选)

sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update

3. 安装推荐驱动

ubuntu-drivers devices  # 查看推荐驱动版本
sudo ubuntu-drivers autoinstall

或手动安装(例如):

sudo apt install -y nvidia-driver-550  # 推荐 >= 535

4. 重启系统

sudo reboot

5. 验证驱动

nvidia-smi

应显示 GPU 信息和驱动版本。


✅ 三、安装 CUDA Toolkit(可选,PyTorch 可自带)

PyTorch 官方通常提供 自带 CUDA 的版本,因此 不强制安装系统级 CUDA Toolkit

推荐:直接使用 PyTorch 自带的 CUDA,避免版本冲突。

若需安装 CUDA Toolkit(例如用于其他框架):

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt install -y cuda-toolkit-12-4

注意:Ubuntu 24.04 可兼容 ubuntu2204 的 CUDA repo(NVIDIA 官方支持)。


✅ 四、安装 PyTorch

方法一:使用 pip(推荐)

进入虚拟环境:

source pytorch_env/bin/activate

升级 pip:

pip install --upgrade pip

前往 https://pytorch.org/get-started/locally/ 获取最新命令。

截至 2025 年初,推荐命令如下(支持 CUDA):

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

cu121 表示 CUDA 12.1,适用于大多数现代 GPU(如 RTX 30/40 系列)

CPU 版本(无 GPU):

pip install torch torchvision torchaudio

验证安装

python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"

输出应类似:

2.2.0
True   # 如果 GPU 可用

✅ 五、安装常用深度学习工具(可选)

pip install jupyter notebook matplotlib numpy pandas scikit-learn tqdm

启动 Jupyter Notebook:

jupyter notebook --ip=0.0.0.0 --no-browser --allow-root

✅ 六、常见问题解决

nvidia-smi 找不到命令?

  • 确保已安装驱动并重启。
  • 检查是否在安全启动(Secure Boot)下,可能需禁用或注册密钥。

torch.cuda.is_available() 返回 False

  1. 检查 nvidia-smi 是否正常。
  2. 确认 PyTorch 安装的是 CUDA 版本cu118 / cu121)。
  3. 检查 CUDA 与驱动版本兼容性:
    • 驱动版本 ≥ 535 支持 CUDA 12.x

❌ 权限问题?

  • 避免使用 sudo pip,优先使用虚拟环境。

✅ 七、完整脚本(可选自动化)

#!/bin/bash
# install_pytorch.sh

sudo apt update && sudo apt upgrade -y
sudo apt install -y python3-pip python3-dev build-essential python3-venv

python3 -m venv pytorch_env
source pytorch_env/bin/activate

pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

python -c "import torch; print('PyTorch version:', torch.__version__); print('CUDA available:', torch.cuda.is_available())"

运行:

chmod +x install_pytorch.sh
./install_pytorch.sh

✅ 总结

组件 建议
OS Ubuntu 24.04.2 LTS
Python 使用 venv 虚拟环境
GPU 支持 安装 NVIDIA 驱动(≥535)
PyTorch 使用 pip 安装 CUDA 版本(cu121
CUDA 推荐使用 PyTorch 自带,无需系统安装

如有特定需求(如使用 Conda、Docker、多版本 CUDA),可进一步扩展配置。

需要我提供 Docker 镜像方案Conda 安装方式 吗?

未经允许不得转载:云服务器 » Ubuntu 24.04.2 LTS安装配置pytorch深度学习环境?