GPT-5研发遇阻，巨额投入或打水漂

引言：

人工智能的飞速发展在过去几年里令人瞩目，而大型语言模型（LLM）作为其中的核心驱动力，更是引发了广泛的关注。OpenAI 凭借其 GPT 系列模型，一度引领了行业潮流。然而，随着 GPT-5（代号 Orion）研发的推进，这家明星公司似乎遭遇了前所未有的挑战。据《华尔街日报》最新报道，GPT-5 的研发进度远不如预期，巨额的训练成本如同投入无底洞，而数据瓶颈更是成为了横亘在 OpenAI 面前的一道难以逾越的鸿沟。这不仅引发了人们对 GPT-5 未来命运的担忧，也预示着人工智能发展可能正面临一个关键的转折点。

主体：

研发一年半，进度堪忧：巨额投入难见成效

自 GPT-4 于 2023 年 3 月发布以来，OpenAI 便马不停蹄地投入到了 GPT-5 的研发之中。然而，经过一年半的努力，GPT-5 的进展却令人失望。尽管有消息人士透露，Orion 模型的性能已经超越了 OpenAI 目前的模型，但其提升幅度却远不足以支撑其高昂的研发成本。

据知情人士透露，GPT-5 至少进行了两轮训练，但每一轮训练都暴露出新的问题，未能达到研究人员的预期。更令人震惊的是，每轮训练的成本高达 5 亿美元，耗时数月。如此巨大的投入，却未能换来预期的突破，这无疑给 OpenAI 的未来蒙上了一层阴影。

OpenAI 首席执行官 Sam Altman 此前曾明确表示，2024 年不会发布任何名为 GPT-5 的产品。这或许暗示了 GPT-5 研发的艰难，以及 OpenAI 对其未来前景的谨慎态度。

数据瓶颈：人工智能发展的“化石燃料”正在枯竭

GPT-5 研发受阻的根本原因，在于数据瓶颈的日益凸显。众所周知，人工智能模型的性能高度依赖于其所吸收的数据量。在训练过程中，模型需要被灌入数万亿个 tokens，这需要大量的计算资源和时间。

然而，随着互联网数据的日益饱和，OpenAI 发现，现有的公开互联网数据已经无法满足 GPT-5 的需求。为了提升模型的性能，他们迫切需要更多种类和更高质量的数据。

正如前 OpenAI 科学家 Ilya Sutskever 所言，“我们只有一个互联网”，数据的增长正在放缓，这一推动人工智能飞跃的“化石燃料”正逐渐枯竭。这意味着，仅仅依靠海量数据和更大模型的策略，可能已经无法继续推动人工智能的进步。

“从零开始创造数据”：无奈之举还是另辟蹊径？

为了应对数据不足的问题，OpenAI 采取了一项前所未有的举措：雇人“从零开始创造数据”。具体来说，他们正在雇佣软件工程师和数学家等专业人士，让他们编写新的软件代码或解决数学问题，并向 Orion 解释他们的工作过程。

这种做法的逻辑在于，代码作为软件的语言，能够帮助大模型解决它们没有见过的问题，从而提升其解决复杂问题的能力。此外，OpenAI 还与理论物理学等领域的专家合作，让他们解释如何解决自己领域中的棘手问题。这些内容都有助于提升 Orion 的智能水平。

然而，雇人从头构建数据，无论如何都不是一个高效的过程。GPT-4 的训练数据约为 13 万亿个 token。即使有 1000 个人每天写 5000 个字，生产 10 亿个 token 也需要花费数月的时间。

为了加速训练，OpenAI 也尝试使用所谓的“合成数据”，即由人工智能生成的数据。然而，研究表明，人工智能生成的数据再用于人工智能训练的反馈循环，有时会导致模型出错或生成毫无意义的答案。

尽管 OpenAI 声称，通过使用 o1 生成的数据可以避免这些问题，但这种做法的有效性仍有待验证。

内忧外患：OpenAI 面临多重挑战

除了技术上的挑战，OpenAI 还面临着内部动荡和外部竞争的双重压力。

去年，OpenAI 董事会突然解雇了 Altman，导致一些研究人员开始质疑公司是否能够继续运作。尽管 Altman 很快被重新任命为 CEO，并着手对公司的治理结构进行改革，但这一事件仍然给 OpenAI 的内部稳定带来了冲击。

此外，今年以来，超过 20 位关键高管、研究人员和长期员工离开了 OpenAI，其中包括联合创始人兼首席科学家 Ilya Sutskever 和技术负责人 Mira Murati。这些人才的流失无疑给 OpenAI 的研发带来了负面影响。

与此同时，竞争对手的崛起也对 OpenAI 构成了更大的压力。Anthropic、谷歌等公司纷纷推出新一代模型，试图赶超 OpenAI。这使得 OpenAI 不得不投入更多的资源和精力，以保持其在人工智能领域的领先地位。

更重要的是，每一次训练高达 5 亿美元的成本，使得 OpenAI 面临巨大的财务压力。如果 GPT-5 的研发最终失败，那么 OpenAI 将面临巨大的损失。

资源争夺：新产品开发与 Orion 研发的冲突

随着 Orion 的进展停滞，OpenAI 开始开发其他项目和应用，包括简化版的 GPT-4 和可以生成人工智能视频的 Sora 产品。然而，这导致了不同团队之间争夺有限计算资源的局面，特别是在新产品开发团队和 Orion 研究团队之间，发生了激烈的竞争。

这种资源争夺可能会进一步拖慢 GPT-5 的研发进度，并使得 OpenAI 的未来发展更加扑朔迷离。

人工智能发展是否已接近“瓶颈期”？

GPT-5 的困境或许揭示了一个更大的行业命题：人工智能是否已经接近发展的“瓶颈期”？

业内人士指出，依靠海量数据和更大模型的策略正逐渐失效。随着互联网数据的日益饱和，人工智能的发展可能需要寻找新的突破口。

这或许意味着，人工智能的发展需要从单纯的追求数据量，转向更加注重算法的创新和模型的优化。此外，如何利用有限的数据，训练出更加智能的模型，也成为了摆在人工智能研究人员面前的一个重要课题。

结论：

GPT-5 的研发困境，不仅暴露了 OpenAI 在技术和管理上的挑战，也引发了人们对人工智能未来发展的深思。巨额的投入未能换来预期的突破，数据瓶颈成为了制约人工智能发展的关键因素。

OpenAI 试图通过“从零开始创造数据”来解决数据不足的问题，但这无疑是一项耗时耗力的工程。与此同时，内部动荡和外部竞争也给 OpenAI 的未来发展带来了不确定性。

GPT-5 的未来仍然充满未知，我们无法确定 OpenAI 何时或者是否会推出一个值得称为 GPT-5 的模型。但无论如何，GPT-5 的困境都提醒我们，人工智能的发展并非一帆风顺，它需要更多的创新和探索。

或许，人工智能的未来并不在于无止境地追求更大的模型和更多的数据，而在于如何利用有限的资源，创造出更加智能和高效的算法。

参考文献：

《华尔街日报》报道：https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693
InfoQ 文章：GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”
其他相关学术论文和研究报告（省略，根据实际情况补充）

>>> Read more <<<

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

GPT-5研发遇阻，巨额投入或打水漂

作者智能小编

研发一年半，进度堪忧：巨额投入难见成效

数据瓶颈：人工智能发展的“化石燃料”正在枯竭

“从零开始创造数据”：无奈之举还是另辟蹊径？

内忧外患：OpenAI 面临多重挑战

资源争夺：新产品开发与 Orion 研发的冲突

人工智能发展是否已接近“瓶颈期”？

相关文章

Here are a few options playing with different angles SnapGen Shrinks Text-to-Image Power to Phone Size Pocket-Sized

手机文生图革命！SnapGen小体积实现百分百效果

AI重塑材料化学：2024年度突破盘点

发表回复取消回复

为您推荐

Here are a few options playing with different angles SnapGen Shrinks Text-to-Image Power to Phone Size Pocket-Sized

手机文生图革命！SnapGen小体积实现百分百效果

AI重塑材料化学：2024年度突破盘点

AI赋能汤姆猫，玩具风口再起？

作者智能小编

研发一年半，进度堪忧：巨额投入难见成效

数据瓶颈：人工智能发展的“化石燃料”正在枯竭

“从零开始创造数据”：无奈之举还是另辟蹊径？

内忧外患：OpenAI 面临多重挑战

资源争夺：新产品开发与 Orion 研发的冲突

人工智能发展是否已接近“瓶颈期”？

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复