Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

上海的陆家嘴
0

加州圣何塞 – 北京时间3月19日,英伟达年度GTC大会在圣何塞SAP中心盛大开幕,CEO黄仁勋以一场精彩的Keynote演讲,向世界展示了英伟达在人工智能领域的最新进展和未来愿景。本次大会不仅是AI技术的盛宴,更预示着AI算力需求将迎来新一轮爆发式增长。

Blackwell Ultra:专为DeepSeek类强推理加速

本次GTC大会最大的亮点莫过于Blackwell架构的全面投产以及Blackwell Ultra的发布计划。黄仁勋表示,Blackwell Ultra将于2025年下半年上市,而下一代AI加速器架构Vera Rubin则预计在2026年推出。

值得注意的是,Blackwell Ultra的推出,与近期DeepSeek R1模型所展现出的强大推理能力密切相关。DeepSeek R1在“测试时扩展”(Test-Time Scaling)方面取得了显著进展,推动了机器智能的全新发展曲线。DeepSeek R1的高效率虽然震撼了世界,让人们重新评估大模型的算力需求,但英伟达对于未来的AI算力需求仍然非常乐观。

黄仁勋在演讲中强调,随着人工智能规模的扩大,推理将成为未来十年最重要的工作负载之一。他用一个“为七位客人优化婚宴餐桌位次”的例子,生动地展示了强推理模型DeepSeek R1与上一代大语言模型Llama在解决复杂问题上的差异。DeepSeek R1虽然消耗了150倍的算力,但其输出的8559个token进行了深度推理,最终给出了真正能被人用得上的结果。

AI算力需求持续膨胀:Token is the new frontier

黄仁勋认为,人工智能已经迎来了一个拐点,推理人工智能以及推理人工智能系统和智能体系统的训练,使得必须完成的计算量大大增加。他用“AI的超级碗”来形容GTC大会的盛况,并表示“唯一的不同在于每个人都是赢家”。

英伟达给出的数据显示,仅在2024年,全球前四的云服务运营商共采购了130万片Hopper架构芯片,预计数据中心的建设投资将很快达到1万亿美元。

黄仁勋进一步提出了两个增长曲线:

  • 软件加速: 人类编写的软件将转变为AI编写的软件,运行在加速AI基础设施上。
  • Token经济: 人们编写的文字提示获得AI生成的token,转变成为AI生成的Token引导出AI生成的结果(即强推理)。

他认为,整个世界将会被重塑,每个企业未来都会有两个工厂,一个是物理的工厂,一个是AI的虚拟工厂。

Dynamo:英伟达的“AI工厂操作系统”

为了满足强推理模型对算力的巨大需求,英伟达推出了“AI工厂的操作系统”——NVIDIA Dynamo。Dynamo是一个“分布式推理服务库”,而且是一个开源解决方案,旨在解决用户需要token但无法提供足够token的问题。据介绍,Dynamo会被用于在大量GPU之间高效编排和协调AI推理请求。目前,微软、Perplexity等公司已宣布开始接入这一系统。

总结与展望

英伟达GTC大会不仅展示了Blackwell Ultra等最新的硬件产品,更揭示了AI算力需求持续膨胀的趋势。随着DeepSeek等强推理模型的崛起,以及AI在各行各业的广泛应用,对算力的需求将迎来新一轮爆发。英伟达正通过硬件和软件的协同创新,构建强大的AI基础设施,助力各行各业实现数字化转型。

参考文献:

未来研究方向:

  • DeepSeek R1等强推理模型的技术细节及应用场景。
  • NVIDIA Dynamo等分布式推理系统的性能评估与优化。
  • AI算力需求增长对数据中心建设和能源消耗的影响。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注