明年夏天升级至 30 万块 Nvidia B200 GPU
埃隆・马斯克 (Elon Musk) 位于德克萨斯州的特斯拉超级工厂正在扩建,以容纳一个人工智能超级计算机集群。
此次扩建之所以引人注目,是因为下图用于冷却系统的、正在建造中的超大风扇。
该冷却系统将用于特斯拉超级工厂的超级计算机集群。现有超级工厂的新扩建将容纳 50,000 个 Nvidia GPU 和更多特斯拉 AI 硬件,以训练特斯拉的全自动驾驶功能。
马斯克估计,Gigafactory 超级计算机在部署时将消耗 130 兆瓦的电力,在安装特斯拉专有的 AI 硬件后,预计电力将增长至 500 兆瓦。
下图中,Supermicro的创始人兼首席执行官Charles Liang和马斯克站在服务器机架中间,他们希望“将液体冷却技术引入大型人工智能数据中心”。Liang发帖指出,马斯克采用液体冷却,“可能为我们的地球保护 200 亿棵树”。
人工智能数据中心以其巨大的耗电量而闻名,Supermicro称,与空气冷却相比,直接液体冷却可将冷却基础设施的电力成本降低高达 89%。
马斯克声称,该设施的建设已接近完成,计划在未来几个月内准备好部署。
除了特斯拉的 Gigafactory 超级计算机集群,马斯克还有另一个价值数十亿美元的超级计算机集群 X/xAI目前也正在建设中。
隆·马斯克正在建造的不是一台,而是两台世界上最大的 GPU 驱动的 AI 超级计算机集群。xAI 超级计算机比特斯拉的更出名一些,马斯克已经订购了100,000 台 Nvidia 的 H100 GPU。xAI将使用其超级计算机来训练 GrokAI,这是推特的AI 聊天机器人替代品,可供X Premium订阅用户使用。
xAI 超级计算机预计将在“几个月内”准备就绪,还将由 Supermicro 进行液冷,并已计划于明年夏天升级至 30 万块 Nvidia B200 GPU。
信息来源:ESM China
日期:2024年7月10日