苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达

你方唱罢我登场。
一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属英伟达和 AMD 最为亮眼。


英伟达现场拿出了量产版 Blackwell 芯片,还公布了未来三年的产品路线,包括下一代 Rubin AI 平台。AMD 当然也不甘示弱,CEO 苏姿丰亮出了旗下的 CPU、GPU 产品及路线图,包括全新 Zen 5 架构的桌面端 Ryzen 9000系列 CPU、AI PC 芯片、数据中心芯片和 GPU。

全新 Zen 5 架构
锐龙 9000 桌面系列芯片首次亮相
苏姿丰在演讲中着重介绍了基于 Zen 5 架构的全新桌面端 Ryzen CPU,它们经过优化可以通过神经网络处理器来加速 AI 工作负载。下图为下一代高性能 CPU 核心 Zen 5 的各项规格,它不仅是当前 Ryzen 9000 系列处理器的核心,也将成为今年下半年推出的 Turin Epyc 霄龙服务器 CPU 的核心。苏姿丰表示,Zen 5 是 AMD 迄今设计的性能和能效均最高的核心,而且它是从头开始设计的。其中,该核心拥有一个新的并行双管道前端,旨在提高分支预测准确性并减少延迟,并能够在每个时钟周期提供更高的性能。此外,Zen 5 具有更宽的 CPU 引擎指令窗口,可以并行运行更多指令,以实现领先的计算吞吐量和效率。与 Zen 4 相比,Zen 5 的指令带宽增加了一倍,缓存和浮点单元之间的数据带宽增加了一倍,AI 性能增加了一倍,同时具有完整的 AVX 512 吞吐量。苏姿丰现场首次展示了采用 Zen 5 架构的 Ryzen 9 9950X。
Ryzen 9 9950X…
Zen 5…

50TOPS
AMD 最强移动端 NPU 算力
苏姿丰展示了下一代 AI PC 芯片 —— 锐龙 AI 300 系列 APU(第三代)。下图为锐龙 AI 300系列芯片实拍。锐龙 AI 300 系列芯片旨在提供下一代 AI PC 体验,因而要求 NPU、CPU 和 GPU 均要达到最佳。锐龙 AI 300 系列首发提供了两款型号,锐龙 AI 9 HX 370 和锐龙 AI 9 365。下图为锐龙 AI 9 HX 370 的参数规格。锐龙 AI 300 系列采用了 XDNA AI NPU,号称移动端最强 NPU,算力达 50TOPS。AMD 表示,搭载锐龙 AI 300 系列的笔记本将于今年 7 月起陆续上市。
最高 192 核心 384 线程
第五代 EPYC 霄龙问鼎数据中心芯片
苏姿丰现场也展示了第五代「Turin」EPYC 霄龙芯片,它号称全球最强数据中心 CPU。下图为第五代 AMD 霄龙 Turin 芯片的参数规格。目前没有透露太多细节,从基础信息参数来看,Turin 具有 192 个 Zen 5 核心和 384 个线程,采用与 Genoa Epyc 9004s 相同的 SP5 插槽适配。Turin 芯片可能会被命名为 「Epyc 9005s」。可以期待的是,在 IPC 方面,它与 Ryzen Zen 5 芯片相近。相较于 Zen 4 核心,IPC 改进可能在 15% 到 20% 之间。苏姿丰展示了 Turin 芯片的一…
对标英伟达
AMD 的 Instinct GPU 也一年一更
讲完了 CPU,接下来的重头戏就是 Instinct GPU 了,它将是 AMD 未来产品战略的一个重要抓手。苏姿丰表示,「Antares」MI300 系列是 AMD 历史上增长最快的产品,在 HPC 和 AI 工作负载方面的可用性看起来有点像英伟达 GPU,不过其所提供的性能优势以及 HBM 内存容量、带宽优势较为突出。比如在推理工作负载方面,通过对 Llama 3(具有 700 亿参数)进行推理检验性能的结果来看,一台配备 8 个 MI300X GPU 的服务器性能约为一台配备 8 个 H100 GPU 加速器的英伟达 HGX 性能的 1.3 倍。而在 Mistral 7B 模型上,单个 MI300X 的性能则是英伟达 H100 GPU 的…
随后,苏姿丰公布了 2024-2026 年的 Instinct GPU 路线图,今年推出 MI325X,2025 年推出 MI350,2026 年推出 MI400。MI325X 将具有更大的算力规模,并转向 HBM3E 内存。下图为 MI325X 的基础性能规格,内存增加了 2 倍,最高可达 288GB;带宽增加了 30%,达到了 6TB / 秒。下图为 MI325X 的数据传输速度与英伟达 H200(141GB 内存)比较的结果。据悉,MI325X 最快将在今年第四季度推出。不过到那时,英伟达将在该领域中凭借 B100 占据一席之地,并将大规模量产 H200。因此,AMD 感受到了危机,并且迅速行动。
这也是为什么 AMD 提前推出 MI350X 的原因,它采用了全新 CDNA 4 架构、台积电 3 纳米工艺、288 GB 的 HBM3E 内存以及 FP6、FP4 数据类型。MI350X 也将成为 AMD Instinct MI350 系列的第一款产品。在推理性能方面,CDNA 4 架构是 CDNA 3 的 35 倍。MI350 的内存容量将是英伟达 2025 年推出的 B200(Blackwell Ultra 架构)芯片的 1.5 倍,AI 计算能力是后者的 1.2 倍。AMD 这波就是奔着英伟达去的,到时候有好戏看了。

原文链接:https://www.nextplatform.com/2024/06/03/amd-previews-turin-epyc-cpus-expands-instinct-gpu-roadmap/
参考链接:https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达

https://www.gptnb.com/2024/06/05/2024-06-04-auto5_2-J1osRt/

作者

ByteAILab

发布于

2024-06-05

更新于

2025-03-21

许可协议