北京 – 人工智能大模型领域的竞争日趋白热化,各家科技巨头纷纷亮剑。近日,百度再次给自家大模型“上强度”,一口气发布了两款重磅产品:文心大模型X1和文心大模型4.5。这两款模型有何不同?又将给AI应用带来哪些变革?
X1:深度思考,多工具调用,化身“嘴炮王者”
文心大模型X1定位为深度思考模型,其核心优势在于更强的理解、规划、反思和进化能力。尤其值得关注的是,X1支持多模态,并具备强大的多工具调用能力。
相较于以往版本,X1更富有个性和观点。有测试显示,X1能够用贴吧的口吻犀利点评小红书、知乎、微博等平台,展现出“敢锐评”的特点。此外,X1的逻辑推理能力也得到显著提升,甚至能够理解脑筋急转弯的“奇葩脑回路”。
X1的最大亮点在于其强大的工具调用能力。用户只需开启“联网搜索”和“调用工具”两个按钮,即可综合利用高级搜索、文档问答、图片理解、AI绘图、代码解释器、百度学术检索、商业信息查询等多种工具。例如,用户上传一张甜品照片,X1便可调用图片理解、联网搜索和代码解释器三个工具,最终生成一份详细的制作工序PDF文档。
4.5:多模态全能,能听歌看电影,还能“懂梗”
如果说X1更侧重深度思考,那么文心大模型4.5则是一款更加全能的多模态基础大模型。它不仅擅长多模态理解,语言能力也更加精进。
文心4.5在理解、生成、逻辑、记忆能力方面均有提升,并在去幻觉、逻辑推理、代码能力上实现了全面提升。它不仅能看懂网络“梗图”,还能识别音视频内容。
测试显示,文心4.5能够准确识别出音乐片段的歌名和相关信息,还能通过分析视频片段挖掘背后的信息。例如,上传电影《闻香识女人》中的舞蹈片段,文心4.5不仅能识别出影片名称和女主饰演者,还能找到背景音乐。
此外,文心4.5在搜索方面也取得了进步。面对网络热梗“馕言文”,它能找到多个参考信源,并进行分析总结,最终给出清晰的解答,并在末尾附上相关视频以供参考。
提前免费!百度加速AI普惠
最关键的是,这两款模型已在文心一言官网、百度搜索、文小言APP等产品上线,并且全部免费!
此前,百度宣布文心一言将于2025年4月1日起全面免费。如今,百度将这一时间点提前了整整半个月,体现了其加速AI普惠的决心。
同时,这两款模型的API价格也已出炉。开发者现可在百度智能云千帆大模型平台上直接调用文心大模型4.5 API,输入价格低至0.004元/千tokens,输出价格低至0.016元/千tokens;文心大模型X1也即将在千帆平台上线,输入价格低至0.002元/千tokens,输出价格低至0.008元/千tokens。
百度之所以能大幅降低文心X1模型的API价格,得益于其通过飞桨和文心联合优化,实现了从压缩、推理、服务部署的全链路极致调优,大幅降低了文心X1的推理成本。
AI竞争进入深水区,技术创新是关键
百度此次发布文心大模型X1和4.5,并宣布提前免费,无疑将进一步加剧国内大模型市场的竞争。在AI竞争进入白热化阶段的当下,技术创新和成本控制将成为各家厂商决胜的关键。
百度通过飞桨和文心的联合优化,实现了模型推理成本的大幅降低,为AI普惠奠定了基础。未来,随着技术的不断进步和应用场景的不断拓展,AI大模型将在更多领域发挥重要作用,为社会发展注入新的动力。
参考资料:
- 机器之心:提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人. https://www.jiqizhixin.com/articles/2024-03-16-15
- 文心一言官网:https://yiyan.baidu.com/
Views: 0