艾伦AI研究所震撼发布：OLMo，开启全开放大语言模型新时代！

作者智能小编

8 月 28, 2024 #OLMo, #每日AI快讯, #艾伦

艾伦AI研究所（AI2，Allen Institute for Artificial Intelligence）近日开源了其全新的大语言模型框架——OLMo，这是一个完全开放的平台，旨在促进学术界和研究者对语言模型的深入探索和创新。OLMo提供了丰富的资源，包括数据、训练代码、模型权重和评估工具，以支持更高效的研究工作。

OLMo的主要特点

大规模预训练数据：OLMo基于AI2的Dolma数据集，该数据集包含3万亿个标记，为模型提供了广泛的语言学习素材。
多样化的模型变体：框架内包含了四种不同规模的模型，每种模型至少经过2万亿token的训练，以满足不同研究需求。
详细的训练资源：除了模型权重，OLMo还提供了训练日志、指标和多个检查点，便于研究者理解模型训练过程和性能。
开放与透明：所有代码和资源均在Apache 2.0许可证下发布，鼓励自由使用、修改和分发，以推动知识共享与创新。

OLMo的模型性能表现

根据发布的研究论文，OLMo-7B模型在零样本评估中展示了出色的表现。在与Falcon-7B、LLaMA-7B等其他大模型的对比中，OLMo-7B在9个核心任务中有2个任务取得最佳成绩，8个任务进入前三。在Paloma评估框架下，OLMo-7B在多个数据源上的困惑度指标也显示出了竞争力，特别是在与代码相关的任务上表现尤为突出。此外，OLMo-7B在额外的6个任务中同样表现出色，与竞品相比具有优势。

OLMo的开源发布，不仅为研究者提供了一个强大的工具，也为AI语言模型的未来发展开辟了新的道路。这一举措有望加速学术界和工业界在语言理解、自然语言生成和其他相关领域的研究进程。

【source】https://ai-bot.cn/olmo-llm/