A100 vs V100

发表于2024-07-05更新于2025-09-11

字数总计:189阅读时长:1分钟阅读量: 天津评论数:

A100 vs V100

可爱可倾2024-07-052025-09-11

A100 vs V100

特性	A100	V100
架构	Ampere (GA100)	Volta (GV100)
CUDA核心数量	6,912	5,120
SM数量	108	80
张量核心数量	640	640
张量核心精度支持	FP64, TF32, FP16, BF16, INT8, INT4	FP32, FP16
张量核心性能
显存容量	40GB / 80GB HBM2e	16GB / 32GB HBM2
显存带宽	1555 GB/s	900 GB/s
NVLink带宽	600 GB/s	300 GB/s
PCIe支持	PCIe 4.0	PCIe 3.0
功耗 (TDP)	400W	300W
多实例GPU (MIG)	支持	不支持
稀疏性加速	支持(\(\approx 2 \times V100\))	不支持

架构

A100引入了TensorFloat-32 (TF32) Tensor Core以及结构化稀疏功能：

运行速度比 V100 FP32 FMA 操作快 10 倍(稀疏性快 20 倍)
FP16/FP32 混合精度，A100 Tensor Core 的性能是 V100 的 2.5 倍(稀疏性则提高到 5 倍)

可爱可倾

花开有期，云舒有意

原创 A100 vs V100

打赏作者

感谢你赐予我前进的力量

微信
支付宝

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自可爱可倾！

评论

匿名评论隐私政策

TwikooGiscus

✅ 若未加载出评论区，请刷新页面~

博客快捷键

shift K

关闭快捷键功能

shift A

打开/关闭中控台

shift M

播放/暂停音乐

shift D

深色/浅色显示模式

shift S

站内搜索

shift R

随机访问

shift H

返回首页

shift F

友链鱼塘

shift L

友链页面

shift P

关于本站

shift I

原版/本站右键菜单

数据库加载中