2030展望：AI Scaling Law挑战四限，未来可期？

9 月 17, 2024 #机器之心, #算力

根据您提供的信息，我们可以分析以下内容：

电力、芯片制造、数据和延迟：四大限制因素

近年来，人工智能（AI）模型的能力显著提高，其中计算资源的增长对性能提升贡献巨大。人工智能训练规模的快速增长，其速度甚至超过了历史上一些最快的技术扩张。然而，这种增长受到了四大因素的制约：

电源可用性：随着数据中心和计算需求的增加，电力供应成为了一个关键限制因素。报告预计到2030年，数据中心园区将达到1至5GW的电力需求，这将支持1e28至3e29 FLOP的训练运行。
芯片制造能力：人工智能芯片是训练大型AI模型的关键，但目前受到先进封装和高带宽内存生产能力的限制。报告假设台积电5纳米及以下的全部产能都用于GPU生产，这将可能增加一个数量级的潜在计算量，达到1e30至2e31 FLOP。
数据稀缺性：训练大型AI模型需要大量的数据。预计到2030年，可用于训练的token数量将相当于400万亿到20亿亿个，允许6e28至2e32 FLOP的训练运行。
延迟墙：随着模型规模的扩大，训练过程中不可避免的延迟成为一个基本速度限制。报告估计，现代GPU设置上的累积延迟将使训练运行的FLOP上限达到3e30至1e32。

Scaling Law能续到2030年吗？

Epoch AI的报告指出，到2030年之前，人工智能训练规模的快速增长在技术上可能是可行的。以下是报告的主要观点：