旧金山报道 – 谷歌于本周三正式发布了其第七代张量处理单元(TPU)Ironwood,这款专为AI推理设计的芯片,其大规模部署下的计算能力据称可达全球最快超级计算机的24倍以上,标志着AI算力领域又迎来了一个新的里程碑。这一发布是在Google Cloud Next ’25 大会上进行的,预示着谷歌在AI芯片研发战略上的一次重大转变。
算力突破:42.5 Exaflops的强大性能
Ironwood 的技术规格堪称“超模”。当每个pod扩展至9216块芯片时,它能够提供高达42.5 exaflops的AI算力,远超目前全球最快的超级计算机El Capitan的1.7 exaflops。单块Ironwood芯片的峰值计算能力也达到了4614 TFLOPs。
在单芯片规格上,Ironwood同样表现出色。它配备了192GB的高带宽内存(HBM),是上一代TPU Trillium的六倍。同时,每块芯片的内存带宽达到了7.2 terabits/s,是Trillium的4.5倍。
在数据中心规模不断扩大,供电逐渐成为瓶颈的背景下,Ironwood还大幅提升了计算效率,其每瓦性能是Trillium的两倍,与2018年推出的首款TPU相比,更是高出了近30倍。
“推理时代”:AI发展的新阶段
谷歌副总裁兼机器学习、系统和云AI总经理Amin Vahdat表示:“Ironwood旨在支持生成式AI的下一阶段及其巨大的计算和通信需求。这就是我们所说的『推理时代』,AI代理将主动检索和生成数据,以协作方式提供洞察和答案,而不仅仅是数据。”
谷歌将重心转向推理优化,代表着AI发展历程中的一个重要转折点。近年来,AI实验室一直专注于构建参数规模不断扩大的基础模型。而谷歌的这一举动表明,AI正在进入一个以部署效率和推理能力为核心的新阶段。
对于AI参与的业务而言,模型训练的次数有限,但随着AI技术应用逐渐铺开,推理操作每天都会发生数十亿次。随着模型日趋复杂,这些业务的经济效益与推理成本紧密相关。
谷歌在过去八年里,对AI计算的需求同比增长了10倍,总需求量高达惊人的1亿。如果没有像Ironwood这样的专用架构,任何摩尔定律的进步都无法满足这一增长曲线。
值得注意的是,谷歌在发布中提到了对执行复杂推理任务而非简单模式识别的“思维模型”的关注。这表明,谷歌认为AI的未来不仅在于更大的模型,还在于能够分解问题、进行多步骤推理并模拟类人思维过程的模型。
面向下一代大模型:Gemini 2.5的基石
谷歌将Ironwood定位为其最先进AI模型的基础设施,其优化的大模型自然包括自家的Gemini 2.5,它“原生内置了思维能力”。谷歌还发布了Gemini 2.5 Flash,作为最新旗舰模型的缩小版本,它“可以根据提示的复杂性调整推理深度”,定位于对响应速度敏感的日常应用。
谷歌还展示了其全套多模态生成模型,包括文本转图像、文本转视频以及新发布的文本转音乐功能Lyria。谷歌展示demo介绍了如何将这些工具结合使用,为一场音乐会制作完整的宣传视频。
Ironwood只是谷歌更广泛的AI基础设施战略的一部分,谷歌还宣布推出Cloud WAN,这是一项托管式广域网服务,使企业能够访问Google的全球规模私有网络基础设施。Google还在扩展其面向AI工作负载的软件产品,其中包括由Google DeepMind开发的机器学习运行时Pathways,现在它允许客户在数百个TPU上扩展模型服务。
A2A协议:构建智能体协作生态
除了硬件之外,谷歌还概述了以多智能体系统为中心的AI愿景,发布了一个促进智能体发展的协议——Agent-to-Agent(A2A),旨在促进不同AI智能体之间的安全、标准化通信。
谷歌认为,2025年将是AI方向转型之年,生成式AI的应用形式会从回答单一问题转向通过智能体系统来解决复杂问题。A2A协议允许跨平台、跨框架的智能体实现互操作,为它们提供了共同的“语言”和安全的通信渠道。这一协议可视为智能体的网络层,其目标是简化复杂工作流程中的智能体协作,使专业AI智能体能够协同完成各种复杂度和时长的任务,从而通过协作提升整体能力。
A2A与MCP(模型上下文协议,Model Context Protocol)是互补的:MCP可以为智能体提供工具支持,而A2A则让这些智能体能够进行协作。
结论
谷歌第七代TPU Ironwood的发布,不仅代表着AI算力的一次飞跃,更预示着AI发展进入了一个以推理为核心的新阶段。通过强大的硬件和创新的软件生态,谷歌正在为下一代AI应用奠定坚实的基础,并积极推动智能体协作生态的构建。未来,我们有理由期待AI在解决复杂问题、提供个性化服务等方面发挥更大的作用。
参考文献
- 机器之心. (2025, April 10). 42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉. Retrieved from https://www.jiqizhixin.com/
- Google. (n.d.). Agent-to-Agent (A2A) Protocol. Retrieved from https://google.github.io/A2A/#/
Views: 0