12月5日,美国大孟菲斯商会宣布,马斯克的人工智能初创公司xAI计划将其超级计算机项目Colossus的算力扩大十倍,未来将搭载100万块GPU,以对抗谷歌、OpenAI和Anthropic等竞争对手。Colossus被认为是世界上最大的超级计算机之一,也是建设速度最快的超级计算机项目,马斯克仅用了3个月就完成了该计算机集群的建设。英伟达创始人黄仁勋曾表示,这种规模的数据中心通常需要三年才能建成,称马斯克的成就为“奇迹”。
目前,Colossus运行着由10万多块英伟达GPU组成的集群,这些芯片用于训练xAI的聊天机器人Grok。尽管如此,Grok的用户数量仍少于市场领导者OpenAI的ChatGPT或谷歌的Gemini。马斯克计划中的Colossus扩张预计需要数百亿美元的投资,还需大规模的服务器供电和冷却系统支持。
除了xAI,英伟达、戴尔和超微电脑等公司也将在孟菲斯扩张。今年早些时候,戴尔和超微电脑宣布将为xAI提供服务器机架。xAI今年已融资约110亿美元,大部分资金被用于购买英伟达的GPU芯片。
根据网站LessWrong的数据,全球拥有最多GPU的公司包括谷歌、微软、Meta、亚马逊以及xAI。如果以H100芯片算力来计算,谷歌目前拥有100万至150万块等效H100,明年预计达到350万至420万块;微软拥有75万至90万块等效H100,明年预计达到250万至310万块;Meta拥有55万至65万块等效H100,明年预计达到190万至250万块;亚马逊拥有25万至40万块等效H100,明年预计达到130万至160万块;xAI拥有10万块等效H100,明年预计达到55万至100万块。这意味着,xAI要赶上这些科技巨头还需要付出很大努力。
目前,xAI使用了大约2万块H100训练Grok 2大模型,并计划用10万块H100训练Grok 3大模型。随着英伟达最新一代Blackwell芯片开始大量出货,马斯克宣称将在2025年夏天部署一个有30万块Blackwell芯片的运算集群。一份2024 AI现状报告对Blackwell芯片采购量进行了估算,大型云计算公司正在大规模采购英伟达的GB200系统:微软介于70万到140万块之间,谷歌为40万块,OpenAI也将拥有至少40万块,亚马逊AWS为36万块。
过去一年中,科技公司在争夺人工智能芯片资源方面投入巨大,并积极建设AI基础设施。风投机构Menlo Ventures的数据显示,生成式AI市场的收入预计将在十年内超过1万亿美元,而今年企业在生成式AI上的支出激增500%。
转载请注明来自福锐宝TOP,本文标题:《马斯克超级计算机算力将扩大十倍 对抗AI巨头》