Nvidia B100/B200/GB200 关键技术解读(nvidia quadro p1000)

AIGC动态欢迎阅读

原标题:Nvidia B100/B200/GB200 关键技术解读

关键字:芯片,内存,晶体管,带宽,精度

文章来源:人工智能学家

内容字数:3627字

内容摘要:

对GTC keynote中关于AI基础设施的关键信息整理如下,分三个部分:

芯片

服务器

Superpod

芯片

1. GPU芯片

晶体管数:

B200 GPU的晶体管数量是现有H100的两倍多,但B200封装了2080亿个晶体管(而H100/H200上‍为800亿个‍)。

这意味着B200芯片封装密度比H100进一步提高,对管理散热和功耗也提出了更高的要求。

FP4精度:

引入一种新的计算精度,位宽比FP8进一步降低,B200峰值算力达18P。

FP6精度:

‍‍位宽介于FP4和FP8之间。‍

‍NV高带宽接口(Nvidia High Bandwidth Interface):

‍B200有两个Die,高速连接通道NV-HBI达到10TB/s。两个Die是一个统一的Cuda GPU。NV-HBI会占用一定的芯片面积。‍

内存:

‍B200每个Die有4个24GB的HBM3e stack,合计一个Cuda GPU有192GB内存,内存带宽达8TB/s。相比H200时代六个内存控制器,可以减少内存接口的芯片面积,从而使得计算面积可以更大。‍

GB200:

‍有两个B200(4个GPU D

原文链接:Nvidia B100/B200/GB200 关键技术解读

联系作者

文章来源:人工智能学家

作者微信:AItists

作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构

0
分享到:
没有账号? 忘记密码?