英伟达论文谈下代GPU:浮点性能最低24.2TFlops
2023-06-02 17:46:26
大中小
据外媒Wccftech报道,NVIDIA近日发表了一篇神秘的论文,描述了一种关于它打算如何使用GPU小芯片的新技术。该论文提到了“gpu-n”,这是一种可用于具有模块化设计的GPU的小芯片。该小芯片有8576个核心,分布在134个 SM上,比A100 GPU的数量略多。
gpu-n的核心频率为1.4GHz,理论fp32(单精度浮点)算力最低24.2 teraflops,比A100 GPU的19.5 teraflops提升了24%。而fp16性能(半精度)最低779 tflops,比A100 GPU提高了两倍以上。此外,L2缓存的容量也比A100 GPU增加了50%。
在缓存方面,Nvidia谈到了两种不同的变体,一种用于高性能计算,而第二种则非常适合深度学习。后者有一个额外的小芯片,专门用于额外的960GB甚至1920GB的缓存。另外,该卡还将拥有最高可达233GB的hbm2e显存,显存接口允许带宽为6.3TB/s。
通过此次论文的内容与曝光时间推测,这些技术很可能会用于NVIDIA的下代核心架构Hopper。