奋斗
努力

ubuntu 24.04深度学习环境搭建可以吗?

云计算

在Ubuntu 24.04上搭建深度学习环境是完全可行的,以下是详细的步骤指南,涵盖主流工具和常见问题的解决方案:


1. 系统准备

  • 更新系统

    sudo apt update && sudo apt upgrade -y
    sudo apt install -y build-essential cmake git wget curl software-properties-common
  • 安装NVIDIA驱动

    • 自动安装推荐版本:
      sudo ubuntu-drivers autoinstall
    • 重启后验证:
      nvidia-smi  # 查看驱动和GPU状态

2. CUDA & cuDNN安装

  • CUDA Toolkit 12.x

    • 通过官方仓库安装(适配24.04):
      wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
      sudo dpkg -i cuda-keyring_1.1-1_all.deb
      sudo apt update
      sudo apt install -y cuda-toolkit-12-4
    • 添加环境变量到 ~/.bashrc
      export PATH=/usr/local/cuda-12.4/bin:$PATH
      export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH
      source ~/.bashrc
  • cuDNN 8.9+

    • 从NVIDIA官网下载.deb包,按指南安装。

3. Python环境管理

推荐使用condavenv隔离环境:

  • Miniconda安装
    wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
    bash Miniconda3-latest-Linux-x86_64.sh
  • 创建虚拟环境:
    conda create -n dl python=3.10 -y
    conda activate dl

4. 深度学习框架安装

  • PyTorch (支持CUDA 12.x)
    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
  • TensorFlow 2.x
    pip install tensorflow[and-cuda]==2.15
  • 验证GPU支持
    import torch
    print(torch.cuda.is_available())  # 应返回True

5. 可选工具

  • Docker支持
    sudo apt install docker.io
    sudo usermod -aG docker $USER  # 将用户加入docker组
  • Jupyter Lab
    pip install jupyterlab

常见问题解决

  • CUDA版本冲突:确保nvcc --versionnvidia-smi显示的CUDA版本兼容。
  • 权限问题:使用sudo或配置用户组权限(如docker组)。
  • 依赖缺失:通过apt install安装缺失的库(如libcupti-dev)。

总结

Ubuntu 24.04对深度学习支持良好,关键步骤包括:

  1. 正确安装NVIDIA驱动和CUDA。
  2. 使用虚拟环境隔离Python依赖。
  3. 选择与CUDA 12.x兼容的框架版本。

按此流程操作,30分钟内即可完成环境搭建。遇到问题可查阅各框架官方文档或社区论坛(如Stack Overflow)。

未经允许不得转载:云服务器 » ubuntu 24.04深度学习环境搭建可以吗?