谷歌第七代TPU问世：算力超最强超算24倍！

旧金山报道 – 谷歌于本周三正式发布了其第七代张量处理单元（TPU）Ironwood，这款专为AI推理设计的芯片，其大规模部署下的计算能力据称可达全球最快超级计算机的24倍以上，标志着AI算力领域又迎来了一个新的里程碑。这一发布是在Google Cloud Next ’25 大会上进行的，预示着谷歌在AI芯片研发战略上的一次重大转变。

算力突破：42.5 Exaflops的强大性能

Ironwood 的技术规格堪称“超模”。当每个pod扩展至9216块芯片时，它能够提供高达42.5 exaflops的AI算力，远超目前全球最快的超级计算机El Capitan的1.7 exaflops。单块Ironwood芯片的峰值计算能力也达到了4614 TFLOPs。

在单芯片规格上，Ironwood同样表现出色。它配备了192GB的高带宽内存（HBM），是上一代TPU Trillium的六倍。同时，每块芯片的内存带宽达到了7.2 terabits/s，是Trillium的4.5倍。

在数据中心规模不断扩大，供电逐渐成为瓶颈的背景下，Ironwood还大幅提升了计算效率，其每瓦性能是Trillium的两倍，与2018年推出的首款TPU相比，更是高出了近30倍。

“推理时代”：AI发展的新阶段

谷歌副总裁兼机器学习、系统和云AI总经理Amin Vahdat表示：“Ironwood旨在支持生成式AI的下一阶段及其巨大的计算和通信需求。这就是我们所说的『推理时代』，AI代理将主动检索和生成数据，以协作方式提供洞察和答案，而不仅仅是数据。”

谷歌将重心转向推理优化，代表着AI发展历程中的一个重要转折点。近年来，AI实验室一直专注于构建参数规模不断扩大的基础模型。而谷歌的这一举动表明，AI正在进入一个以部署效率和推理能力为核心的新阶段。

对于AI参与的业务而言，模型训练的次数有限，但随着AI技术应用逐渐铺开，推理操作每天都会发生数十亿次。随着模型日趋复杂，这些业务的经济效益与推理成本紧密相关。

谷歌在过去八年里，对AI计算的需求同比增长了10倍，总需求量高达惊人的1亿。如果没有像Ironwood这样的专用架构，任何摩尔定律的进步都无法满足这一增长曲线。

值得注意的是，谷歌在发布中提到了对执行复杂推理任务而非简单模式识别的“思维模型”的关注。这表明，谷歌认为AI的未来不仅在于更大的模型，还在于能够分解问题、进行多步骤推理并模拟类人思维过程的模型。

面向下一代大模型：Gemini 2.5的基石

谷歌将Ironwood定位为其最先进AI模型的基础设施，其优化的大模型自然包括自家的Gemini 2.5，它“原生内置了思维能力”。谷歌还发布了Gemini 2.5 Flash，作为最新旗舰模型的缩小版本，它“可以根据提示的复杂性调整推理深度”，定位于对响应速度敏感的日常应用。

谷歌还展示了其全套多模态生成模型，包括文本转图像、文本转视频以及新发布的文本转音乐功能Lyria。谷歌展示demo介绍了如何将这些工具结合使用，为一场音乐会制作完整的宣传视频。

Ironwood只是谷歌更广泛的AI基础设施战略的一部分，谷歌还宣布推出Cloud WAN，这是一项托管式广域网服务，使企业能够访问Google的全球规模私有网络基础设施。Google还在扩展其面向AI工作负载的软件产品，其中包括由Google DeepMind开发的机器学习运行时Pathways，现在它允许客户在数百个TPU上扩展模型服务。

A2A协议：构建智能体协作生态

除了硬件之外，谷歌还概述了以多智能体系统为中心的AI愿景，发布了一个促进智能体发展的协议——Agent-to-Agent（A2A），旨在促进不同AI智能体之间的安全、标准化通信。

谷歌认为，2025年将是AI方向转型之年，生成式AI的应用形式会从回答单一问题转向通过智能体系统来解决复杂问题。A2A协议允许跨平台、跨框架的智能体实现互操作，为它们提供了共同的“语言”和安全的通信渠道。这一协议可视为智能体的网络层，其目标是简化复杂工作流程中的智能体协作，使专业AI智能体能够协同完成各种复杂度和时长的任务，从而通过协作提升整体能力。

A2A与MCP（模型上下文协议，Model Context Protocol）是互补的：MCP可以为智能体提供工具支持，而A2A则让这些智能体能够进行协作。

结论

谷歌第七代TPU Ironwood的发布，不仅代表着AI算力的一次飞跃，更预示着AI发展进入了一个以推理为核心的新阶段。通过强大的硬件和创新的软件生态，谷歌正在为下一代AI应用奠定坚实的基础，并积极推动智能体协作生态的构建。未来，我们有理由期待AI在解决复杂问题、提供个性化服务等方面发挥更大的作用。

参考文献

机器之心. (2025, April 10). 42.5 Exaflops：谷歌新TPU性能超越最强超算24倍，智能体协作协议A2A出炉. Retrieved from https://www.jiqizhixin.com/
Google. (n.d.). Agent-to-Agent (A2A) Protocol. Retrieved from https://google.github.io/A2A/#/

>>> Read more <<<

谷歌第七代TPU问世：算力超最强超算24倍！

作者智能小编

相关文章

Gemini 2.5 Flash：应用开发迎来新纪元

好品味赋能产品：第3492期深度解读

OpenAI王炸！O3、O4-mini推理模型颠覆来袭

发表回复取消回复

为您推荐