开源巨头Llama-3遭质疑：即将来临的权威定义或将重塑开源概念

8 月 28, 2024 #开源, #机器之心

今年10月，开源领域的权威定义将迎来重大更新，尤其是对于人工智能（AI）领域。开源AI的模糊概念在近期引发了激烈的讨论，尤其是当被视为开源大模型标杆的Llama 3被质疑是否真正开源时。这一问题在Meta发布Llama 3.1 405B大模型并限制使用权限后变得更加突出。

开源AI的讨论源于开发者和研究人员对于“开源”一词的期望与实际应用之间的差距。许多人认为，如果AI模型不提供权重和训练数据，就不能称为真正的开源。为了解决这一争议，开放源代码促进会（OSI）宣布将发布“开源AI”的最新定义草案，以清晰界定Open Source在快速发展的科技领域的使用。

OSI的定义草案提出了AI模型开源的“四项基本自由”，包括无限制使用目的、允许深入研究、支持修改以及自由分享。这一标准旨在确保AI模型的透明度和协作性，类似于开源软件的定义。OSI的这一举措预计将影响AI模型的发布方式，促进更广泛的创新和透明度。

根据新定义，一些模型如EleutherAI的Pythia、Ai2的OLMo和LLM360等被认为符合开源标准。然而，Llama 3由于其使用限制可能不符合这一定义。值得注意的是，新定义并未强制公开原始训练数据，而是要求提供详细元数据，以平衡透明度和潜在的隐私、版权问题。

这一新定义的酝酿始于2022年，OSI在全球范围内收集意见，旨在确保AI领域的开源原则适应性。最终定义的发布预计将对行业产生深远影响，包括可能影响未来法规的制定，如加州的SB-1047法案。

随着10月的临近，开源AI的界限将更加明确，这不仅会规范AI模型的发布，也将影响整个行业的创新方向和信任度。对于AI开发者和用户来说，这意味着未来他们可以基于更清晰的准则来选择和使用AI工具。

【source】https://www.jiqizhixin.com/articles/2024-08-28-3