加州圣何塞 – 北京时间3月19日,英伟达年度GTC大会在圣何塞SAP中心盛大开幕,CEO黄仁勋以一场精彩的Keynote演讲,向世界展示了英伟达在人工智能领域的最新进展和未来愿景。本次大会不仅是AI技术的盛宴,更预示着AI算力需求将迎来新一轮爆发式增长。
Blackwell Ultra:专为DeepSeek类强推理加速
本次GTC大会最大的亮点莫过于Blackwell架构的全面投产以及Blackwell Ultra的发布计划。黄仁勋表示,Blackwell Ultra将于2025年下半年上市,而下一代AI加速器架构Vera Rubin则预计在2026年推出。
值得注意的是,Blackwell Ultra的推出,与近期DeepSeek R1模型所展现出的强大推理能力密切相关。DeepSeek R1在“测试时扩展”(Test-Time Scaling)方面取得了显著进展,推动了机器智能的全新发展曲线。DeepSeek R1的高效率虽然震撼了世界,让人们重新评估大模型的算力需求,但英伟达对于未来的AI算力需求仍然非常乐观。
黄仁勋在演讲中强调,随着人工智能规模的扩大,推理将成为未来十年最重要的工作负载之一。他用一个“为七位客人优化婚宴餐桌位次”的例子,生动地展示了强推理模型DeepSeek R1与上一代大语言模型Llama在解决复杂问题上的差异。DeepSeek R1虽然消耗了150倍的算力,但其输出的8559个token进行了深度推理,最终给出了真正能被人用得上的结果。
AI算力需求持续膨胀:Token is the new frontier
黄仁勋认为,人工智能已经迎来了一个拐点,推理人工智能以及推理人工智能系统和智能体系统的训练,使得必须完成的计算量大大增加。他用“AI的超级碗”来形容GTC大会的盛况,并表示“唯一的不同在于每个人都是赢家”。
英伟达给出的数据显示,仅在2024年,全球前四的云服务运营商共采购了130万片Hopper架构芯片,预计数据中心的建设投资将很快达到1万亿美元。
黄仁勋进一步提出了两个增长曲线:
- 软件加速: 人类编写的软件将转变为AI编写的软件,运行在加速AI基础设施上。
- Token经济: 人们编写的文字提示获得AI生成的token,转变成为AI生成的Token引导出AI生成的结果(即强推理)。
他认为,整个世界将会被重塑,每个企业未来都会有两个工厂,一个是物理的工厂,一个是AI的虚拟工厂。
Dynamo:英伟达的“AI工厂操作系统”
为了满足强推理模型对算力的巨大需求,英伟达推出了“AI工厂的操作系统”——NVIDIA Dynamo。Dynamo是一个“分布式推理服务库”,而且是一个开源解决方案,旨在解决用户需要token但无法提供足够token的问题。据介绍,Dynamo会被用于在大量GPU之间高效编排和协调AI推理请求。目前,微软、Perplexity等公司已宣布开始接入这一系统。
总结与展望
英伟达GTC大会不仅展示了Blackwell Ultra等最新的硬件产品,更揭示了AI算力需求持续膨胀的趋势。随着DeepSeek等强推理模型的崛起,以及AI在各行各业的广泛应用,对算力的需求将迎来新一轮爆发。英伟达正通过硬件和软件的协同创新,构建强大的AI基础设施,助力各行各业实现数字化转型。
参考文献:
- 机器之心. 专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍. https://www.jiqizhixin.com/articles/2024-03-19-13
未来研究方向:
- DeepSeek R1等强推理模型的技术细节及应用场景。
- NVIDIA Dynamo等分布式推理系统的性能评估与优化。
- AI算力需求增长对数据中心建设和能源消耗的影响。
Views: 0