微调 – 既智新闻

周五. 4 月 11th, 2025

ICLR 2025：参数高效微调新突破！

2025年4月4日

上海，2024年4月3日 – 在人工智能领域，参数高效微调（Parameter-Efficient Fine-Tun…

Deepseek微调不再难！数据集、GPU、教程一站式搞定

2025年4月1日

摘要： Deepseek模型微调是提升其在特定领域表现的关键，但数据准备、算力不足和缺乏专业指导等问题常常困扰开发者。本文报道了…

吴恩达支招：微调模型，决策指南来了！

2025年3月29日

摘要：人工智能专家吴恩达近日再次就大型语言模型（LLM）的优化问题发表看法，强调微调（Fine-tuning）虽然是提升模型在…

Unsloth：开源大模型微调利器问世

2025年2月27日

引言：在人工智能领域，大语言模型（LLM）正以前所未有的速度发展，深刻地改变着我们与技术互动的方式。然而，训练和微调这些庞大的…

Unsloth：开源大模型微调利器问世

2025年2月27日

“`markdown Unsloth：开源大语言模型微调工具，加速AI普及的引擎导语：在人工智能领域，大语言模型…

Unsloth：开源大模型微调利器问世

2025年2月18日

引言：人工智能（AI）的快速发展正在重塑各行各业，而大语言模型（LLM）作为AI领域的核心技术之一，正日益受到关注。然而，LL…

Unsloth：开源大模型微调利器问世

2025年2月18日

引言：人工智能领域的大语言模型（LLM）正以前所未有的速度发展，它们在自然语言处理、机器翻译、文本生成等领域展现出强大的能力。…

ScaleOT：AAAI 2025揭秘大模型隐私微调新突破

2024年12月19日

好的，这是一篇根据您提供的资料，并按照您提出的专业新闻写作要求撰写的文章。标题：ScaleOT：AAAI 2025 论文揭示大…

上海财经、南科大、清华联手，微调LLMs新方法问世！

2024年11月11日

上海财经、南方科技和清华大学联合推出针对LLMs的微调方法MiLoRA 上海，中国 – 上海财经大学、南方科技大学和…

三所高校联手，微调LLMs新方法问世！

2024年11月11日

上海财经、南方科技和清华大学联合推出针对LLMs的微调方法MiLoRA 上海，中国 – 近日，上海财经大学、南方科技…

以图灵机为师：大模型学会“算数”了！

2024年10月19日

以图灵机为师：通过微调训练让大语言模型懂执行计算过程引言大型语言模型（LLM）在自然语言处理领域展现出惊人的能力，甚至在某些…

币安微调TG小游戏 Moonbix 引关注

2024年10月6日

引言币安，全球领先的加密货币交易所，一直致力于为用户提供更丰富、更具吸引力的交易体验。近期，币安计划推出的TG小游戏Moonb…

OpenAI开启GPT-4o微调服务企业可定制专属AI助手

2024年9月23日

IT之家 8 月 21 日消息，OpenAI近日宣布推出全新功能，允许企业客户使用自身数据定制其最强大的 AI 模型 GPT-4…

Meta发布Llama微调指南：小白也能玩转大模型！

2024年8月27日

Meta发布Llama微调指南，助小白轻松上手大模型训练 Meta 近日发布了三篇详细的 Llama 微调指南，旨在帮助用户轻松…

OpenAI开放GPT-4微调功能，企业定制AI助手时代来临！

2024年8月26日

OpenAI 开放 GPT-4 微调功能，企业可轻松打造专属AI 助手 IT之家 8 月 21 日消息，OpenAI 近日宣布开…

OpenAI开放GPT-4o微调功能，企业定制AI助手时代来临！

2024年8月21日

##OpenAI 开放 GPT-4o 微调功能，企业可轻松打造专属 AI 助手 **IT之家 8 月 21 日消息**，Open…

漫威英雄迷挑战微调Flux，独挑大梁全网热传

2024年8月20日

微调Flux席卷全网，外国小哥一人组一队漫威英雄近日，一款名为微调Flux的应用程序在网络上引起了广泛关注，该应用允许用户通过…

10人团队创首例：微调Llama 3.1 405B，角色扮演一秒

2024年8月17日

近日，一个由10名资深科技和人工智能专家组成的明星团队，成功地炼制出了首个微调版本的Llama 3.1模型，该模型拥有405亿个…

AI AI生成机器学习

ML笔记：在大语言模型中，监督微调（SFT）和对齐（PPO、DPO）有什么不同的作用？

2024年8月15日

在大语言模型（LLM）中，监督微调（SFT）和对齐（PPO、DPO）是两种不同的技术手段，它们在模型优化和任务适应上有不同的作用…

AI生成机器学习

ML笔记：alpaca-data-gpt4-chinese数据集是什么？

2024年8月13日

Alpaca-Data-GPT4-Chinese数据集是一个专门为中文语言模型训练而设计的数据集。以下是对该数据集的详细解释和介…

IT 机器学习

ML笔记：什么是组相对策略优化 (GRPO)？

2024年8月11日

什么是组相对策略优化 (GRPO)？ @deepseek_ai Coder v2 是最好的开放代码 LLM，在编码任务中可与 @…

AI生成机器学习

ML笔记：peft库使用qlora微调llm，参数r和lora_alpha的作用和建议的配置值

2024年8月10日

在使用QLoRA算法微调大型语言模型（LLM）时，参数r和lora_alpha起着关键作用。以下是它们的具体作用和建议的配置值：…

AI生成机器学习

ML笔记：使用huggingface 开发的trl库进行大模型微调时，SFTTrainer 怎么配置模型结果保存频次的参数

2024年8月10日

在使用 Hugging Face 开发的 TRL 库进行大模型微调时，可以通过配置 SFTTrainer 的参数来控制模型结果保…

Decoupled Training New Strategy

2024年7月30日

大型语言模型（LLM）的智能水平不断提升，但随之而来的是安全性的挑战。近日，香港中文大学（深圳）数据科学学院的贺品嘉教授团队和腾…

谷歌 Gemini 编辑功能升级：轻松修改回复内容

2024年3月8日

谷歌 Gemini 更新：微调功能让回复修改更便捷北京时间 2 月 28 日消息，谷歌近日宣布更新其大型语言模型 Gemini…

为您推荐

AI 指数报告：斯坦福揭示 2025 年趋势

2025年4月11日

RAG Evolution Four Key Questions Shaping the Future

2025年4月11日

25年后Agent：简单至上，复杂淘汰

2025年4月11日

Alibaba Cloud’s Bailian Launches “Full-Cycle MCP Service” for AI Tool Management

2025年4月11日