NVIDIA系列

型号 架构 FP32 (TFLOPS) FP16/BF16 (TFLOPS) FP8 (TFLOPS) INT8 (TOPS) 显存容量 发布时间
B300(目前最强AI计算卡) Blackwell Ultra 600T 36P (36,000T) 72P (72,000T) - 2.3TB HBM 2025
H100 Hopper 51 3,958 9,000 - 80GB HBM3 2022
H800(特供版(NVLink带宽限制)) Hopper 51 3,958 9,000 - 80GB HBM3 2023
A100 Ampere 19.5 312/624 - - 40/80GB HBM2e 2020
V100(Ampere架构经典产品,仍在广泛使用) Volta 14 112 - - 32GB HBM2 2017
T4 Turing 8.1 65 - 130 16GB GDDR6 2018
RTX 4090(消费级显卡) Ada Lovelace 83 330 - - 24GB GDDR6X 2022
RTX 3090 Ampere 35.6 142 - - 24GB GDDR6X 2020

HUAWEI 昇腾(Ascend)系列

型号 架构 FP32 (TFLOPS) FP16 (TFLOPS) FP8 (TFLOPS) INT8 (TOPS) 显存容量 发布时间
970 SIMD/SIMT - - 4P (4,000T) - 288GB HBM 2028(Q4)
960 SIMD/SIMT - - 2P (2,000T) - 288GB HBM 2027(Q4)
950DT SIMD/SIMT - - 1P (1,000T) - 144GB HBM 2026(Q4)
950PR SIMD/SIMT - - 1P (1,000T) - 128GB HBM 2026(Q1)
910C(910系列为华为主力产品) SIMD - 800 - - 128GB HBM 2025(Q1)
910 DaVinci - 256 - 512 - 2019
610 - - - - - - -
310 DaVinci - 8 - 16 - 2018

算力对比分析:

  1. B300 vs 昇腾970:B300的FP8算力72P vs 970的4P,英伟达在单芯片算力上仍有明显优势
  2. H100 vs 昇腾910C:H100的FP16算力约4P vs 910C的800T,差距显著
  3. 架构差异:英伟达采用SIMT架构,华为从950开始升级到SIMD/SIMT混合架构

:部分数据为估算值,表中数据仅供参考,性能可能因具体配置、软件优化等因素有所差异,精确数据查询官网

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐