软件风向标

英伟达论文谈下代GPU:浮点性能最低24.2TFlops新闻

栏目

英伟达论文谈下代GPU:浮点性能最低24.2TFlops

3DM整理 2023-06-02 17:46:26

据外媒Wccftech报道,NVIDIA近日发表了一篇神秘的论文,描述了一种关于它打算如何使用GPU小芯片的新技术。该论文提到了“gpu-n”,这是一种可用于具有模块化设计的GPU的小芯片。该小芯片有8576个核心,分布在134个 SM上,比A100 GPU的数量略多。

英伟达论文谈下代GPU:浮点性能最低24.2TFlops

gpu-n的核心频率为1.4GHz,理论fp32(单精度浮点)算力最低24.2 teraflops,比A100 GPU的19.5 teraflops提升了24%。而fp16性能(半精度)最低779 tflops,比A100 GPU提高了两倍以上。此外,L2缓存的容量也比A100 GPU增加了50%。

英伟达论文谈下代GPU:浮点性能最低24.2TFlops

在缓存方面,Nvidia谈到了两种不同的变体,一种用于高性能计算,而第二种则非常适合深度学习。后者有一个额外的小芯片,专门用于额外的960GB甚至1920GB的缓存。另外,该卡还将拥有最高可达233GB的hbm2e显存,显存接口允许带宽为6.3TB/s。

英伟达论文谈下代GPU:浮点性能最低24.2TFlops

通过此次论文的内容与曝光时间推测,这些技术很可能会用于NVIDIA的下代核心架构Hopper。

相关文章

图文推荐

猜你喜欢

  • 英伟

  • 浮点

  • 最低

  • 性能

英伟[共220款]更多>>

浮点[共1款]更多>>

最低[共249款]更多>>

性能[共580款]更多>>