AMD发布CDNA架构Instinct MI100加速显卡

小熊在线 有毒的西瓜 | 2020年11月17日
AMD发布CDNA架构Instinct MI100加速显卡 ......

AMD Instinct MI100是其迄今为止性能最高的HPC GPU,FP64双精度浮点性能首次突破10TFlops,并在架构设计上专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。

AMD Instinct MI100集成多达120个计算单元、7680个流处理器,搭配32GB HBM2,带宽高达1.23TB/s,同时支持PCIe 4.0,集成Infinity Fabric x16高速互联通道,峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍),功耗控制在300W。计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

与AMD Instinct MI100发布同时进行的还有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本,它比以往更容易更高效地将NVIDIA CUDA代码库移植到它上面。ROCm 4.0被宣传为 "Exascale时代 "的开源平台,同时支持OpenMP 5.0行业标准及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm进化目的是让开发者更容易部署和移植他们的软件,使其运行在这个开源计算栈上。

标签:AMD

用户名:  密码:  没有注册?
网友评论:(请各位网友遵纪守法并注意语言文明,评论仅供参考不代表本站立场)