北京 — 在人工智能技术日新月异的浪潮中,金融行业正迎来一场深刻的变革。近日,度小满正式开源其自主研发的轩辕-FinX1大模型,这款被誉为国内首个金融行业推理大模型,标志着人工智能在金融领域的应用迈向了新的高度。轩辕-FinX1的发布不仅为金融机构提供了强大的技术工具,也为整个行业带来了无限的想象空间。
深度推理:金融AI的“最后一公里”
长期以来,金融机构一直在积极探索如何将生成式大模型应用于实际业务中,但由于金融数据的私密性和业务的复杂性,市场上的通用大模型往往难以满足金融行业的特殊需求。尤其是在反欺诈、财务分析等对精准度要求极高的领域,大模型在决策环节往往力不从心,只能提供参考建议,而无法独立完成最终的决策步骤。
度小满此次发布的轩辕-FinX1,正是为了解决这一难题。它首次将大模型的深度推理能力注入金融领域,通过创新的“思维链 + 过程奖励 + 强化学习”训练范式,显著提升了模型的逻辑推理能力。更重要的是,轩辕-FinX1能够展示其完整的思考过程,这在以往的O1模型中是不可见的,这为金融机构提供了更透明、更可信的决策依据。
基准测试:实力超越GPT-4o,精算师难题迎刃而解
为了验证轩辕-FinX1的性能,度小满在金融评测基准FinanceIQ上进行了严格的测试。结果显示,轩辕-FinX1在CPA、银行从业资格、证券从业资格等10大类金融权威资格认证中,均超越了GPT-4o和开源模型Qwen2.5-72B,并相较上一版XuanYuan3实现了大幅提升。
尤其值得一提的是,在精算师这一类别中,此前所有大模型的得分普遍偏低,而轩辕-FinX1将分数从37.5提升至65.7,这一突破性进展充分体现了其在金融逻辑推理和数学计算方面的强大优势。
不仅在金融领域,轩辕-FinX1在通用能力方面也表现出色。在GPQA(科学推理)、MATH-500(数学)和AIME2024(数学竞赛)等多个权威评测集中,轩辕-FinX1不仅取得了卓越成绩,还超越了GPT-4o,与O1以及国内最新发布的推理版大模型共同位列顶尖梯队,验证了其强大的基础推理能力。
技术创新:双重奖励机制,强化学习微调
轩辕-FinX1的卓越表现,离不开其背后的技术创新。度小满在训练过程中,重点采用了复杂问题拆解和推理过程评估等方法,并与经典方法进行了融合,实现了基于金融决策加强的双奖励模型的强化学习训练方法。
为了评估模型在金融决策场景下的表现,度小满设计了结果导向 (ORM) 和过程级 (PRM) 两个互补的奖励模型。PRM是度小满针对金融领域的推理过程的创新,重点解决了开放性金融问题(如市场分析、投资决策等)的评估难题。
在强化学习训练阶段,度小满采用PPO算法进行online训练,将PRM和ORM作为奖励信号。对于思考过程,使用PRM在每个思考步骤进行打分,及时发现和纠正思考路径中的错误;对于答案部分,则针对不同类型的问题采用不同的评估策略。这种基于双重奖励的训练机制,不仅克服了单一奖励模型的局限性,也通过稳定的强化学习训练显著提升了模型在金融决策场景下的推理能力。
应用场景:深入核心业务,赋能金融机构
轩辕-FinX1的发布,标志着大模型在金融领域的应用从非核心业务场景深入到风控决策等核心业务场景。在决策与风控能力方面,轩辕-FinX1能够系统分析风险因素间的关联与传导路径,为机构提供全面深入的风险洞察。例如,根据用户上传的银行流水,轩辕-FinX1能够精准识别高频彩票消费、游戏消费等风险信号,并结合收入水平和债务负担,科学评估用户的还款能力和信贷风险。
在研究分析能力方面,轩辕-FinX1能对宏观经济数据、市场情绪、政策影响等进行多维度分析,通过清晰的逻辑链条逐步拆解复杂问题。例如,在分析美联储政策时,模型不仅深入探讨了经济数据背后的深层原因,还结合多维度市场信息进行量化分析,甚至能够对未来政策走势进行预测。
在数据智能能力方面,轩辕-FinX1可帮助金融机构快速挖掘数据背后的业务逻辑与价值。例如,将某公司季度财务数据输入轩辕-FinX1,模型能够精准提取核心信息,直观展示资产质量、流动性与业务动态,并揭示财务数据背后的潜在风险与增长机会。
开源共享:推动行业发展,共建AI生态
度小满此次开源轩辕-FinX1,不仅体现了其技术实力,更展现了其开放共享的姿态。通过开源,度小满希望能够推动整个金融行业在人工智能领域的创新和发展,共同构建一个更加繁荣的AI生态。
目前,轩辕-FinX1的预览版本已在开源社区开放免费下载,后续优化版本也将持续开源,供用户下载使用。
结语
轩辕-FinX1的发布,是金融行业在人工智能应用道路上迈出的重要一步。它不仅展示了人工智能在金融领域的巨大潜力,也为我们揭示了未来金融科技发展的方向。随着技术的不断进步和应用的不断深入,我们有理由相信,人工智能将为金融行业带来更加深刻的变革,为社会创造更大的价值。
参考文献
- 度小满轩辕-FinX1 GitHub 仓库: https://github.com/Duxiaoman-DI/XuanYuan
- InfoQ 相关报道: [原文链接] (请自行替换为InfoQ原文链接)
(完)
Views: 0