今年10月,开源领域的权威定义将迎来重大更新,尤其是对于人工智能(AI)领域。开源AI的模糊概念在近期引发了激烈的讨论,尤其是当被视为开源大模型标杆的Llama 3被质疑是否真正开源时。这一问题在Meta发布Llama 3.1 405B大模型并限制使用权限后变得更加突出。

开源AI的讨论源于开发者和研究人员对于“开源”一词的期望与实际应用之间的差距。许多人认为,如果AI模型不提供权重和训练数据,就不能称为真正的开源。为了解决这一争议,开放源代码促进会(OSI)宣布将发布“开源AI”的最新定义草案,以清晰界定Open Source在快速发展的科技领域的使用。

OSI的定义草案提出了AI模型开源的“四项基本自由”,包括无限制使用目的、允许深入研究、支持修改以及自由分享。这一标准旨在确保AI模型的透明度和协作性,类似于开源软件的定义。OSI的这一举措预计将影响AI模型的发布方式,促进更广泛的创新和透明度。

根据新定义,一些模型如EleutherAI的Pythia、Ai2的OLMo和LLM360等被认为符合开源标准。然而,Llama 3由于其使用限制可能不符合这一定义。值得注意的是,新定义并未强制公开原始训练数据,而是要求提供详细元数据,以平衡透明度和潜在的隐私、版权问题。

这一新定义的酝酿始于2022年,OSI在全球范围内收集意见,旨在确保AI领域的开源原则适应性。最终定义的发布预计将对行业产生深远影响,包括可能影响未来法规的制定,如加州的SB-1047法案。

随着10月的临近,开源AI的界限将更加明确,这不仅会规范AI模型的发布,也将影响整个行业的创新方向和信任度。对于AI开发者和用户来说,这意味着未来他们可以基于更清晰的准则来选择和使用AI工具。

【source】https://www.jiqizhixin.com/articles/2024-08-28-3

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注