深度学习的 GPU 选配

结论：

NVIDIA 的三个产品线：

GeForce 类型：面向个人计算和游戏市场推出的产品线，适用于游戏、图形处理等，并且在深度学习上的表现也非常出色，很多人用来做推理、训练，性价比高。例如目前热门的 4090、3090等型号
Quadro 类型：定位于专业可视化市场的产品线，主要面向专业人士和企业用户，例如，影视制作、建筑可视化、产品设计和科学计算等行业
Tesla 类型：针对高性能计算和人工智能领域推出的产品线，被广泛应用于科学计算、深度学习、大规模数据分析等领域。 A100、A800、V100、T4、P40 等都属于 Tesla 系列的显卡

GPU 关键参数

不同阶段的需求：

GPU 的推荐路径：

个人用户推荐消费级显卡 4090，可根据预算逐渐往下降低配置

企业用户如果需要训练 13B 以上的 LLMs，最低门槛是 A100 或 H100

GPU 的性价比（综合性能除以价格）排名（Performance per Dollar）

二手显卡：预算有限且具备一定硬件知识的情况下可考虑

多卡 GPU：显存大小决定了深度学习的门槛，多卡主要用于训练/推理加速

显卡改装：2080Ti 22G 版，第三方魔改，品质无保障，但性价比确实很不错

其他品牌：无论是 A 卡还是国内的摩尔线程，生态还不够成熟（打游戏可考虑）

算力云平台：初学者优先考虑 Colab 或 Kaggle 上的免费算力，一次性训练或短期测试可以考虑腾讯云/阿里云/火山引擎等国内的付费算力平台（国外的当然也行）

其他扩展资料：

个人笔记