开源版 OpenAI 再出神作:Mistral 小模型吊打Meta Llama 3,边缘 AI 革命来临
法国 AI 初创公司 Mistral 在其 7B 模型诞生一周年之际,再次推出两款轻量级模型 Ministral 3B 和 Ministral 8B,性能全面超越 Meta 的 Llama 3 8B,成为“世界上最好的边缘模型”。
这两款小模型专为边缘设备打造,拥有高达 128k 上下文,在知识、常识、推理、函数调用、效率等方面均超越了同等规模的模型,为低于 10B 参数模型树立了新标杆。
Ministral 3B 和 8B 的优势:
- 性能卓越: 在指令跟随基准测试中,Ministral 3B 完胜 Llama 3 8B 和 Mistral 7B,在知识、常识、推理等方面表现出色。Ministral 8B 则在大多数基准测试中超越了 Gemma 2 和 Llama 3.1 开源模型,仅在代码能力方面略逊于 Llama 3.1 8B。
- 高效推理: Ministral 8B 配备了滑动窗口注意机制,实现更快、更节能的推理。
- 应用广泛: 它们可以被微调到各种用例中,例如管理复杂的 AI 智能体工作流、创建专门的任务助手等。
- 低成本: Ministral8B 的输入输出价格为百万 token 0.1 美元,Ministral 3B 则为百万 token 0.04 美元,极具性价比。
边缘 AI 革命:
随着 AI 技术的快速发展,边缘 AI 正在成为新的趋势。用户希望在本地设备上进行推理,例如设备上翻译、智能助理、自动机器人等。Mistral 的 Ministral 系列小模型正是为这些场景而生,提供高计算效率、低延迟的解决方案。
Mistral 的争议:
Mistral 在去年以磁力链方式开源了多款媲美 OpenAI 的模型,赢得 AI 社区的认可。但今年,这家公司却陷入了争议,因为它变得不再那么“open”。
- 商业化策略: Mistral 宣布与微软合作,其模型将在 Azure AI 进行托管。同时,Mistral 也开始对一些模型进行收费。
- 开源承诺: Mistral 从官网中移除了致力于开源的承诺,引发了社区的质疑。
未来展望:
Mistral 的 Ministral 系列小模型的出现,标志着边缘 AI 时代的到来。未来,随着 AI 技术的不断发展,我们将会看到更多更强大、更实用的边缘 AI 模型出现,为我们的生活带来更多便利。
参考文献:
- https://x.com/dchaplot/status/1846575384718172448
- https://x.com/GuillaumeLample/status/1846566817650679966
Views: 0