xAI获得戴尔科技和超微的支持来支持超级计算项目
Elon Musk的初创企业xAI刚刚宣布将依靠戴尔和超微为其巨大的超级计算项目提供服务器机架支持。{ width=50% }
马斯克在他的社交媒体平台X上宣布了这一合作,标志着xAI组装他一再称之为“世界上最大的超级计算机”的目标的一个重要发展。
服务器机架是高性能计算基础设施的重要组成部分,为存储和组织超级计算机操作所需的各种计算组件提供骨架。这些精心设计的机房旨在通过充分利用有限的地板空间来促进最佳效率和气流流通,在超级计算领域至关重要。
服务器机架,例如xAI用于大规模AI模型训练的Grok中使用的机架,是支持这些工作负载所需的巨大计算功率的服务器基础设施的关键组件。这些项目需要数十万个耗电量巨大的AI芯片,而半导体晶圆厂的生产周期不足,以实现所需的规模。
xAI的项目是庞大的;因此,在其规模上,热管理尤其具有挑战性。当前技术并不够快速,而超级计算机-可以进行数千倍快速的计算-会变得如此炎热以致其中的芯片随时间降低性能。这个问题由需要数千个耗电巨大的AI芯片来训练像xAI的Grok这样的更先进的AI模型而进一步恶化。
合作细节:戴尔和超微的角色
根据马斯克的说法,戴尔科技将负责组装xAI超级计算机一半的机架。超微计算机(被马斯克称为“SMC”)将提供剩下一半。超微与诸如Nvidia这样的芯片公司紧密联系,并且在液冷技术方面拥有专业知识,已向路透社确认了这一合作关系。
总部位于旧金山的超微因其在服务器设计方面的创新方法而闻名,特别是其液冷技术。这种技术对于管理高性能计算系统产生的极端热量至关重要,可以实现更高效的运行,有可能延长部件的使用寿命。
在相关发展中,戴尔首席执行官迈克尔·戴尔在X上宣布,公司正在与Nvidia合作建立一个将为xAI的聊天机器人Grok下一个版本提供动力的“AI工厂”。这种合作强调了先进AI模型训练所需的广泛计算资源。
马斯克此前表示,训练Grok 2模型大约需要20,000个Nvidia H100图形处理单元(GPU),而未来版本可能需要多达100,000个这些芯片。据《信息》报道,拟议的超级计算机预计将在2025年秋季运行。
戴尔科技和超微计算机为这个项目带来了丰富的经验和专业知识。戴尔几十年来一直是服务器和数据中心基础设施的信任供应商,为世界上许多最大的云计算平台和超级计算设施提供动力,如得克萨斯州先进计算中心的Frontera超级计算机。
超微已经成为提供高性能、节能服务器解决方案的领先者。他们在液冷和刀片服务器架构方面的创新被云提供商、企业和研究机构广泛应用于AI和高性能计算等要求严格的工作负载。
对AI和超级计算技术的影响
xAI、戴尔科技和超微计算机之间的合作代表着人工智能和超级计算技术发展的一个重要里程碑。随着项目的进展,它很可能突破高性能计算的界限,并为人工智能能力的快速演进做出贡献。
这一合作也凸显了AI行业对专门硬件的日益重要性。随着AI模型变得越来越复杂和数据密集,对高性能计算解决方案的需求预计将持续上升,潜在地在未来几年重塑科技行业的格局。
参见:戴尔、英特尔和剑桥大学部署英国最快的AI超级计算机
想要从行业领袖中了解更多关于人工智能和大数据的信息吗?查看将在阿姆斯特丹、加利福尼亚和伦敦举行的人工智能和大数据博览会。这个全面的活动与其他领先的活动同时举办,包括智能自动化大会、BlockX、数字化转型周和网络安全与云博览会。
探索由TechForge举办的其他即将到来的企业技术活动和网络研讨会。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
xAI获得戴尔科技和超微的支持来支持超级计算项目