Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

上海枫泾古镇一角_20240824上海枫泾古镇一角_20240824
0

上海,[日期] – 上海财经大学统计与数据科学学院张立文教授领衔的金融大语言模型课题组(SUFE-AIFLM-Lab),联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院,近日正式发布了首款基于DeepSeek-R1架构的金融领域推理型人工智能大模型:Fin-R1。这款模型以仅70亿参数的轻量化规模,展现出卓越的性能,在同规模模型中脱颖而出,并与参数量高达6710亿的行业标杆DeepSeek-R1的平均分差距仅为3.0%。

Fin-R1的发布,标志着中国高校在金融科技领域的自主创新迈入了一个新的高度。

突破性技术:轻量化模型实现卓越金融推理能力

Fin-R1基于Qwen2.5-7B-Instruct模型开发,其核心突破在于:

  • 高质量金融推理数据集构建: 团队从多个权威数据源提炼并筛选出约6万条面向金融专业场景的高质量COT(Chain-of-Thought)数据集Fin-R1-Data。该数据集涵盖中英文金融垂直领域的多维度专业知识,并根据具体任务内容划分为金融代码、金融专业知识、金融非推理类业务知识和金融推理类业务知识四大模块,有效支撑银行、证券以及信托等多个金融核心业务场景。
  • 两阶段混合框架训练: 团队采用指令微调(SFT)预热和强化学习(RL)训练相结合的两阶段工作框架,实现了金融推理的逻辑闭环,有效提升了模型的金融复杂推理能力和泛化能力。

张立文教授表示:“通用推理模型在落地金融领域时,面临垂直场景适配性不足的挑战。金融推理任务涉及法律条款、经济指标、数理建模等知识,不仅需要跨学科知识融合,更要求可验证的、分步骤的决策逻辑。Fin-R1的研发,正是为了解决这些痛点,为金融领域的智能化升级提供更强大的引擎。”

应用场景广泛:赋能金融行业智能化转型

Fin-R1具备强大的多场景适配能力,可广泛应用于:

  • 金融代码生成与计算: 能够生成用于金融模型、算法和分析任务的计算机编程代码,并进行金融领域的各种定量分析和计算,为金融决策提供科学依据。
  • 金融安全合规: 能够帮助企业建立健全的合规管理体系,防范金融犯罪,确保业务操作符合相关法规要求。
  • 智能风控: 利用AI与大数据技术识别和管理金融风险,提高风控的效率、准确性和实时性。
  • ESG分析: 评估企业在环境、社会、治理方面的表现,衡量其可持续发展能力,为投资决策提供参考。

开源共享:推动金融大模型生态发展

为了促进金融大模型领域的共同发展,上海财经大学决定将Fin-R1开源,并提供相关资源:

课题组核心成员郭鑫表示:“我们希望通过开源Fin-R1,与业界同仁共同探索金融大模型的更多可能性,推动金融行业的智能化转型。”

展望未来:持续深耕金融科技创新

Fin-R1的发布,是上海财经大学在金融科技领域自主创新的重要成果。未来,课题组将继续深耕金融大模型技术,不断提升模型的性能和应用范围,为金融行业的智能化升级贡献更多力量。

项目团队成员:

该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬,以及财跃星辰白祚博士和团队成员陈德智、许晟、李超共同完成。

参考文献:


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注