开源 AI 标准 1.0 发布:Llama 并非真正开源,AI 开源新纪元开启
人工智能领域迎来了一个里程碑时刻:开放源代码促进会(OSI)发布了“开源 AI 定义”的 1.0 正式版。 这一定义旨在为快速发展的AI 领域提供一个清晰的开源标准,并明确了“开源”在 AI 系统中的具体含义。
长期以来,OSI 一直为开源软件设定行业标准,但 AI 系统包含传统许可未涵盖的元素,例如模型训练数据。 因此,OSI 的新定义强调,要使 AI 系统被视为真正的开源系统,它必须满足以下条件:
- 可访问用于训练 AI 的数据的详细信息: 这些信息应足够详细,以便其他人可以理解和重新创建训练过程。
- 用于构建和运行 AI 的完整代码: 包括处理和过滤数据、训练、验证、测试、支持库、推理代码和模型架构等。
- 训练中的设置和权重: 帮助 AI 产生相应的结果,包括模型参数、权重、优化器状态等。
这一定义直接直击 Meta 推动的 Llama 大模型。 虽然Llama 一直被宣传为最大的开源 AI 模型,但其使用条款中存在限制,例如商业用途受到限制,且不提供对训练数据的访问。因此,根据 OSI 的新定义,Llama 并不符合真正的开源标准。
Meta 对此表示,他们同意 OSI 的许多观点,但不同意设置单一的开源 AI 定义。 他们认为,现有的开源定义无法涵盖 AI 模型的复杂性。然而,无论技术的定义如何,Meta 表示仍将继续与 OSI 和其他行业组织合作,以负责任的方式推动 AI 朝着可访问和免费的方向发展。
OSI 的开源 AI 定义对于 AI 领域的未来发展具有重大意义。 它为开发者、研究人员和企业提供了清晰的标准,有助于促进 AI 技术的开放和共享。
然而,一些人认为,OSI 的定义过于严格,可能会阻碍 AI 技术的创新。 他们认为,应该允许更灵活的开源模式,例如只公开部分代码或数据。
无论如何,OSI 的开源 AI 定义都标志着 AI 领域的一个重要转变。 它将推动 AI 技术朝着更加开放、透明和可访问的方向发展,并为 AI 的未来发展奠定坚实的基础。
参考文献:
- Open Source Initiative – Open Source AI Definition
- LFAI Data Foundation – Embracing the Future of AI with Open Source
Views: 0