在GPU服务器上安装Ubuntu时,版本选择需综合考虑硬件兼容性、驱动支持、长期维护周期及软件生态。以下是具体建议:
1. 推荐版本
-
Ubuntu 22.04 LTS(Jammy Jellyfish)
- 长期支持:官方维护至2027年,适合生产环境。
- 驱动支持:默认集成较新内核(5.15+)和NVIDIA驱动(可选510+),对Ampere架构(如A100、RTX 30/40系列)支持更好。
- 软件兼容性:CUDA Toolkit、PyTorch/TensorFlow等主流AI框架均提供官方支持。
- 稳定性:LTS版本经过充分测试,适合企业级应用。
-
Ubuntu 20.04 LTS(Focal Fossa)
- 保守选择:若现有软件栈依赖旧版库(如CUDA 11.0-11.4),且硬件为Turing架构(如T4、RTX 20系列)。
- 维护周期:支持至2025年,但后续可能需手动升级内核(如HWE版本)以支持新硬件。
2. 非LTS版本(如23.10)适用场景
- 前沿硬件支持:若服务器搭载最新GPU(如NVIDIA H100),需Linux 6.2+内核或驱动535+,可临时使用非LTS版本,但需注意短期维护周期(9个月)。
3. 关键注意事项
- NVIDIA驱动安装:
- 使用
ubuntu-drivers工具自动安装推荐驱动,或从NVIDIA官网下载.run文件手动安装。 - 确保禁用
nouveau驱动(在/etc/modprobe.d/blacklist.conf中添加blacklist nouveau后执行update-initramfs -u)。
- 使用
- CUDA兼容性:
- 参考NVIDIA CUDA Toolkit文档选择匹配的Ubuntu版本。例如,CUDA 12.x要求GCC 11+,Ubuntu 22.04默认满足。
- 内核升级:
- 若需新版内核(如支持Intel Arc GPU的6.2+),可通过
apt install linux-generic-hwe-22.04升级。
- 若需新版内核(如支持Intel Arc GPU的6.2+),可通过
4. 安装步骤精简版
# Ubuntu 22.04 + NVIDIA驱动示例
sudo apt update
sudo ubuntu-drivers autoinstall # 自动安装推荐驱动
sudo reboot
# 验证驱动
nvidia-smi
5. 避坑指南
- 避免混合源:手动添加PPA可能导致依赖冲突,优先使用官方仓库。
- 云平台镜像:AWS/Azure等提供的Ubuntu镜像可能预装优化驱动,无需手动配置。
总结:Ubuntu 22.04 LTS是当前GPU服务器的最佳平衡选择,兼顾新硬件支持与稳定性。若需特定旧版软件栈,则选择20.04 LTS。非LTS版本仅推荐用于测试环境。
云服务器