百度发布文心大模型4.5：原生多模态AI新突破

北京 – 百度于近日正式发布了其最新一代大模型——文心大模型4.5，并声称其在多模态理解、文本和逻辑推理等方面取得了显著提升，部分测试表现甚至优于OpenAI的GPT-4.5。这款原生多模态大模型已上线百度智能云千帆大模型平台，面向企业用户和开发者提供API调用服务。

多模态融合，理解能力全面升级

文心大模型4.5的核心亮点在于其强大的多模态融合能力。它能够综合理解文字、图片、音频、视频等多种模态的内容，实现多模态协同优化。这意味着，它不仅能理解文字描述，还能理解图表、梗图、讽刺漫画等复杂内容，并进行准确的分析和解释。

百度方面表示，文心大模型4.5采用了多模态异构专家扩展技术，有效解决了不同模态之间梯度不均衡的问题，从而提升了多模态融合的整体性能。此外，该模型还融入了FlashMask动态注意力掩码技术，优化了注意力机制，使其在处理长文本和多轮交互时更加高效。

技术创新，降低“幻觉”提升准确性

为了提升知识准确性，降低大模型常见的“幻觉”现象，文心大模型4.5采用了基于知识点的大规模数据构建技术。该技术通过知识分级采样、数据压缩与融合、稀缺知识点定向合成等手段，构建高知识密度预训练数据，从而提升模型的学习效率和知识准确性。

此外，该模型还引入了基于自反馈的Post-training技术，融合多种评价方式的自反馈迭代式后训练，进一步提升了强化学习的稳定性和鲁棒性。

应用广泛，赋能多行业场景

文心大模型4.5的应用场景十分广泛，涵盖了教育辅导、内容创作、智能客服、金融等多个领域。

如何使用文心大模型4.5

个人用户可以通过文心一言官网、百度搜索、文小言APP等产品体验文心大模型4.5的功能。企业和开发者则可以通过百度智能云千帆大模型平台调用API。

定价策略

文心大模型4.5的定价为：输入0.004元/千tokens，输出0.016元/千tokens。

挑战与展望

文心大模型4.5的发布，无疑是中国人工智能领域的一项重要进展。其在多模态理解和知识准确性方面的提升，使其在众多应用场景中具备了更强的竞争力。然而，要真正挑战GPT-4.5，文心大模型4.5仍需在模型规模、训练数据、算法优化等方面持续投入。

未来，随着大模型技术的不断发展，我们有理由期待文心大模型在更多领域发挥更大的作用，为中国乃至全球的人工智能发展贡献力量。

参考文献：

AI工具集. (n.d.). 文心大模型4.5 – 百度推出的首个原生多模态大模型. Retrieved from https://www.ai-tool.cn/ai-project/wenxin-4-5.html