Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

川普在美国宾州巴特勒的一次演讲中遇刺_20240714川普在美国宾州巴特勒的一次演讲中遇刺_20240714
0

旧金山报道 – 谷歌于本周三正式发布了其第七代张量处理单元(TPU)Ironwood,这款专为AI推理设计的芯片,其大规模部署下的计算能力据称可达全球最快超级计算机的24倍以上,标志着AI算力领域又迎来了一个新的里程碑。这一发布是在Google Cloud Next ’25 大会上进行的,预示着谷歌在AI芯片研发战略上的一次重大转变。

算力突破:42.5 Exaflops的强大性能

Ironwood 的技术规格堪称“超模”。当每个pod扩展至9216块芯片时,它能够提供高达42.5 exaflops的AI算力,远超目前全球最快的超级计算机El Capitan的1.7 exaflops。单块Ironwood芯片的峰值计算能力也达到了4614 TFLOPs。

在单芯片规格上,Ironwood同样表现出色。它配备了192GB的高带宽内存(HBM),是上一代TPU Trillium的六倍。同时,每块芯片的内存带宽达到了7.2 terabits/s,是Trillium的4.5倍。

在数据中心规模不断扩大,供电逐渐成为瓶颈的背景下,Ironwood还大幅提升了计算效率,其每瓦性能是Trillium的两倍,与2018年推出的首款TPU相比,更是高出了近30倍。

“推理时代”:AI发展的新阶段

谷歌副总裁兼机器学习、系统和云AI总经理Amin Vahdat表示:“Ironwood旨在支持生成式AI的下一阶段及其巨大的计算和通信需求。这就是我们所说的『推理时代』,AI代理将主动检索和生成数据,以协作方式提供洞察和答案,而不仅仅是数据。”

谷歌将重心转向推理优化,代表着AI发展历程中的一个重要转折点。近年来,AI实验室一直专注于构建参数规模不断扩大的基础模型。而谷歌的这一举动表明,AI正在进入一个以部署效率和推理能力为核心的新阶段。

对于AI参与的业务而言,模型训练的次数有限,但随着AI技术应用逐渐铺开,推理操作每天都会发生数十亿次。随着模型日趋复杂,这些业务的经济效益与推理成本紧密相关。

谷歌在过去八年里,对AI计算的需求同比增长了10倍,总需求量高达惊人的1亿。如果没有像Ironwood这样的专用架构,任何摩尔定律的进步都无法满足这一增长曲线。

值得注意的是,谷歌在发布中提到了对执行复杂推理任务而非简单模式识别的“思维模型”的关注。这表明,谷歌认为AI的未来不仅在于更大的模型,还在于能够分解问题、进行多步骤推理并模拟类人思维过程的模型。

面向下一代大模型:Gemini 2.5的基石

谷歌将Ironwood定位为其最先进AI模型的基础设施,其优化的大模型自然包括自家的Gemini 2.5,它“原生内置了思维能力”。谷歌还发布了Gemini 2.5 Flash,作为最新旗舰模型的缩小版本,它“可以根据提示的复杂性调整推理深度”,定位于对响应速度敏感的日常应用。

谷歌还展示了其全套多模态生成模型,包括文本转图像、文本转视频以及新发布的文本转音乐功能Lyria。谷歌展示demo介绍了如何将这些工具结合使用,为一场音乐会制作完整的宣传视频。

Ironwood只是谷歌更广泛的AI基础设施战略的一部分,谷歌还宣布推出Cloud WAN,这是一项托管式广域网服务,使企业能够访问Google的全球规模私有网络基础设施。Google还在扩展其面向AI工作负载的软件产品,其中包括由Google DeepMind开发的机器学习运行时Pathways,现在它允许客户在数百个TPU上扩展模型服务。

A2A协议:构建智能体协作生态

除了硬件之外,谷歌还概述了以多智能体系统为中心的AI愿景,发布了一个促进智能体发展的协议——Agent-to-Agent(A2A),旨在促进不同AI智能体之间的安全、标准化通信。

谷歌认为,2025年将是AI方向转型之年,生成式AI的应用形式会从回答单一问题转向通过智能体系统来解决复杂问题。A2A协议允许跨平台、跨框架的智能体实现互操作,为它们提供了共同的“语言”和安全的通信渠道。这一协议可视为智能体的网络层,其目标是简化复杂工作流程中的智能体协作,使专业AI智能体能够协同完成各种复杂度和时长的任务,从而通过协作提升整体能力。

A2A与MCP(模型上下文协议,Model Context Protocol)是互补的:MCP可以为智能体提供工具支持,而A2A则让这些智能体能够进行协作。

结论

谷歌第七代TPU Ironwood的发布,不仅代表着AI算力的一次飞跃,更预示着AI发展进入了一个以推理为核心的新阶段。通过强大的硬件和创新的软件生态,谷歌正在为下一代AI应用奠定坚实的基础,并积极推动智能体协作生态的构建。未来,我们有理由期待AI在解决复杂问题、提供个性化服务等方面发挥更大的作用。

参考文献


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注