阿里千问推出Self-Lengthen：AI写作新突破！

阿里千问推出Self-Lengthen：突破长文本生成瓶颈，开启AI创作新纪元

引言

大型语言模型（LLMs）在文本生成领域取得了显著进展，但生成长文本一直是其面临的挑战。为了克服这一难题，阿里巴巴千问团队推出了创新的迭代训练框架——Self-Lengthen，该框架能够有效提升LLMs生成长文本的能力，并保持内容质量，为文学创作、学术研究、新闻报道等领域带来新的可能性。

Self-Lengthen：突破长文本生成瓶颈

Self-Lengthen 采用了一种独特的生成器-扩展器协同工作机制，生成器负责生成初始的短文本响应，扩展器则将生成器的输出作为输入，将其扩展成长文本。整个过程不断迭代，逐步训练模型处理更长的输出。

Self-Lengthen 的核心优势

Self-Lengthen 的技术原理

Self-Lengthen 的核心技术原理在于生成器和扩展器的协同工作，以及迭代训练过程：

生成器（Generator）和扩展器（Extender）： 生成器负责生成初始的短文本响应，扩展器则将生成器的输出作为输入，将其扩展成长文本。
迭代训练过程： Self-Lengthen通过反复迭代，逐步增加生成器和扩展器处理长文本的能力。每次迭代中，扩展器尝试将生成器的输出扩展得更长，用更长的输出微调生成器，直接生成更长的文本。
指令增广： Self-Lengthen 使用自指导技术扩充和多样化训练指令，更好地引导模型生成长文本。
两阶段扩展方法： Self-Lengthen 采用两阶段扩展方法，第一阶段扩展器扩展生成器输出的前半部分，第二阶段则用第一阶段的扩展结果指导扩展剩余部分，实现整个文本的扩展。
微调模型： Self-Lengthen 用基于扩展得到更长的文本微调生成器和扩展器，便于在未来的迭代中生成更长的文本。
质量控制： Self-Lengthen 基于规则和评估机制确保生成的长文本质量，避免重复、无意义的扩展。

Self-Lengthen 的应用场景

Self-Lengthen 在多个领域拥有广阔的应用前景：