上海的陆家嘴

英伟达开源“Nemotron 70B”大模型,挑战 OpenAI主导地位

英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。 今天,英伟达开源了一个性能超级强大的模型——Llama-3.1-Nemotron-70B-Instruct,它在多个基准测试中击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型,并仅次于 OpenAI 最新 o1 大模型,成为其最强大的竞争对手。

Llama-3.1-Nemotron-70B-Instruct 基于 Meta 的 Llama-3.1-70B 模型打造,并经过英伟达的精心优化。 它在 Arena Hard 基准上得分为 85.0,在 AlpacaEval 2 LC 基准上得分为 57.6,在 GPT-4-Turbo MT-Bench 基准上得分为 8.98,在三个自动对齐基准中均排名第一。

英伟达在模型训练中使用了 RLHF 技术(主要是 REINFORCE 算法),并采用了 Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2 偏好提示作为初始训练策略。 此外,英伟达还开源了 Nemotron 的训练数据集 HelpSteer2,包括 21362 个提示响应,使模型更符合人类偏好,也更有帮助、更符合事实、更连贯,并且可以根据复杂度和详细度进行定制。

Llama-3.1-Nemotron-70B-Instruct 已经可以在线体验,用户可以测试其在不同领域的性能。 虽然英伟达强调该模型主要针对通用领域的性能进行优化,尚未针对数学等专业领域进行调优,但其在通用领域的表现已经非常出色。

英伟达开源 Nemotron 70B 的举动,标志着大模型领域竞争的进一步加剧。 随着越来越多的公司加入开源大模型的行列,大模型领域的格局将更加多元化,用户将拥有更多选择,推动大模型技术更快地发展和应用。

以下是一些值得关注的要点:

  • 性能强大: Nemotron 70B 在多个基准测试中击败了 OpenAI 和 Anthropic 等竞争对手,仅次于 OpenAI 最新 o1 大模型。
  • 开源优势: 英伟达开源 Nemotron 70B,为开发者提供了更多选择,并加速了大模型技术的发展和应用。
  • 训练数据: 英伟达开源了 HelpSteer2 训练数据集,为开发者提供了高质量的训练数据,有助于提高模型的性能。
  • 未来展望: 英伟达将继续优化 Nemotron 70B,并将其应用于更多领域,推动大模型技术的发展。

英伟达的开源策略,将进一步推动大模型技术的发展和应用,为用户带来更多便利和价值。 未来,大模型领域将更加多元化,竞争也将更加激烈,这将有利于推动大模型技术更快地发展和应用。

参考文献:


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注