大模型质变：关键何在？或：大模型跃迁：量变到质变或：AI大模型：质变临界点

大模型的“质变”：超越算力与规模的瓶颈

引言：OpenAI 新一代模型的性能提升未达预期，引发了业界对大模型“Scaling Law”（规模法则）是否触及瓶颈的广泛讨论。单纯堆砌算力和数据，是否真的能够带来大模型能力的质变？近日，InfoQ《极客有约》栏目邀请多位专家就此展开深入探讨，揭示了大模型“量变引起质变”的关键，远不止于简单的规模扩张。

一、Scaling Law 的现实困境：收益递减的阴影

近年来，大模型的参数规模呈指数级增长，然而，性能提升却并非线性增长。多位专家指出，虽然 Scaling Law 并未完全失效，但收益递减的现象日益明显。百度主任架构师颜林提到，一篇报告预测到2030年，大模型训练计算量将增长万倍，但这需要克服能源供给、GPU产能、数据传输等诸多挑战。

京东算法总监张泽华认为，单纯以逻辑推理能力的提升来判断大模型瓶颈，过于片面。他指出，输入格式的改变就能显著影响模型性能，这表明优化输入设计、训练过程和输出设计，同样至关重要。

中国科学技术大学特任副研究员王皓则强调了高质量数据的稀缺性。他认为，GPT-4 相较于 GPT-3 的改进，很大程度上得益于高质量语料的提升，但随着高质量数据的逐渐枯竭，后续模型的边际收益递减趋势将更加显著。未来的突破点在于发现新的数据和知识领域，而非仅仅依赖现有语料的扩展。

华为新加坡研究所高级工程师郭威从推荐系统的角度出发，指出虽然万亿参数模型展现了潜力，但实际应用中，受限于推理成本和ROI，模型参数规模往往较小。他认为，未来3-5年，推荐系统中大模型参数量可能仍维持在百亿以下，但长期来看，潜力依然巨大。

二、突破瓶颈：高质量数据与精细化调优的双重驱动

专家们一致认为，大模型“量变引起质变”的关键，并非单纯的规模扩张，而是高质量数据的获取和模型的精细化调优。

高质量数据： 这被反复强调为突破瓶颈的关键。张泽华指出，互联网上大量低质量内容的涌入，可能导致知识闭环，限制模型发展。王皓则强调了量化数据质量的重要性，并指出需要找到影响Scaling的核心数据因素，并重新定义合适的指标，尤其在特定领域如推荐系统中。颜林也从实际项目经验出发，强调高质量数据对模型性能的决定性作用，指出在生成式推荐系统中，提取核心特征比延长用户行为序列更重要。
精细化调优： 除了数据，模型的精细化调优也至关重要。张泽华指出，在推荐系统中，单纯依赖生成式模型容易复刻用户既往行为，缺乏新意。结合传统的判别式模型，平衡短期和长期行为，才能使推荐结果更具人性化。这体现了对模型架构、训练方法和应用场景的深入理解，而非单纯追求规模。

三、超越规模：关注实际应用与价值创造

颜林提出了一个关键问题：追求“量变引起质变”的意义是什么？在突破所谓极限的过程中，行业会不会忽视了现有技术的优化和实际价值的发挥？

张泽华的回答具有代表性：在推荐系统中，过分依赖大规模生成式模型，反而可能忽视了传统模型的优势。这强调了大模型应用需要结合实际需求，而非盲目追求规模。大模型发展的最终目标，是拓展人类能力、改善生活，而非单纯追求参数规模的领先。

结论：大模型的“质变”并非简单的规模扩张，而是高质量数据、精细化调优和实际应用价值的综合体现。未来，大模型的发展需要在追求规模的同时，更加注重数据质量、模型优化和实际应用场景的适配，才能真正实现技术突破，并为人类社会带来实际的益处。单纯的“卷大模型”时代或许正在走向终结，“卷应用”的时代才刚刚开始。

参考文献：