财经巨擘联手！Fin-R1金融推理大模型问世

上海，[日期] – 上海财经大学与财跃星辰联合推出首个金融领域R1类推理大模型Fin-R1，引发业界广泛关注。该模型基于Qwen2.5-7B-Instruct架构，凭借70亿参数的轻量化设计，在金融推理场景中展现出强大的实力，旨在为金融决策提供更准确、可解释的依据。

Fin-R1：金融推理的新星

Fin-R1的诞生，旨在解决金融领域数据碎片化、推理复杂等难题。通过在高质量金融推理场景的思维链数据上进行监督微调（SFT）和强化学习（RL）两阶段训练，Fin-R1有效提升了金融复杂推理能力。

在权威评测中，Fin-R1平均得分75.2分，与行业标杆DeepSeek-R1仅差3分，位居榜单第二。这一成绩充分证明了Fin-R1在金融推理领域的巨大潜力。

技术解析：轻量化架构与高质量数据驱动

Fin-R1的技术核心在于其轻量化的模型架构和高质量的数据构建。

模型架构： 基于Qwen2.5-7B-Instruct架构，采用70亿参数设计，在保证模型性能的同时，显著降低了部署成本，更适合在资源受限的环境中使用。
数据构建： Fin-R1通过构建高质量金融推理数据集Fin-R1-Data来解决金融数据碎片化的问题。该数据集包含约6万条面向专业金融推理场景的高质量COT（Chain-of-Thought，思维链）数据。数据集的构建过程包括从多个权威数据源进行领域知识蒸馏筛选，采用“答案+推理”双轮质量打分筛选方法，确保数据的准确性和可靠性。

为了进一步提升模型的推理能力，Fin-R1采用了两阶段训练策略：

第一阶段——推理能力注入： 使用ConvFinQA和FinQA金融数据集对Qwen2.5-7B-Instruct进行监督微调（SFT），帮助模型初步提升金融推理能力。
第二阶段——强化学习优化： 在掌握复杂推理技能后，采用GRPO（Group Relative Policy Optimization）算法作为核心框架，结合格式奖励和准确度奖励进行强化学习。同时引入基于模型的验证器（Model-Based Verifier），采用Qwen2.5-Max进行答案评估，生成更加精确可靠的奖励信号，提升强化学习的效果和稳定性。

多场景应用：赋能金融行业智能化转型

Fin-R1的应用场景广泛，涵盖智能风控、投资决策辅助、量化交易、ESG分析等多个领域。

此外，Fin-R1还具备以下主要功能：

展望未来：金融AI的无限可能

Fin-R1的发布，标志着中国在金融AI领域迈出了重要一步。随着技术的不断发展和应用场景的不断拓展，金融AI将在风险管理、投资决策、客户服务等方面发挥越来越重要的作用，为金融行业的智能化转型注入新的动力。

项目地址：

参考文献：

SUFE-AIFLM-Lab. (2024). Fin-R1: A Financial Reasoning Large Language Model. arXiv preprint arXiv:2503.16252.

（完）

>>> Read more <<<