TokenSwift：90分钟狂飙10万Token，文本生成提速！

北京讯 – 在人工智能领域，文本生成速度一直是制约应用发展的瓶颈之一。近日，北京通用人工智能研究院团队推出了一款名为TokenSwift的超长文本生成加速框架，声称能在90分钟内生成10万Token的文本，这一突破性的进展或将彻底改变内容创作、智能客服、学术研究等多个领域的效率格局。

长期以来，传统的自回归模型在生成超长文本时面临着速度慢、效率低的挑战。据了解，使用传统模型生成10万Token的文本往往需要近5个小时，这对于需要快速响应的应用场景来说是难以接受的。此外，如何保证生成文本的质量和多样性，也是一个亟待解决的问题。

TokenSwift的出现，为解决上述难题提供了新的思路。据开发团队介绍，该框架通过多Token生成与Token重用、动态KV缓存更新以及上下文惩罚机制等技术，实现了生成速度的显著提升和生成质量的有效保证。

多Token并行生成与Token复用： TokenSwift借鉴了Medusa等方法，通过引入额外的线性层，使模型在一次前向传播中能同时生成多个草稿Token。系统还会自动检索并复用高频短语，减少模型重新加载的次数，提升整体效率。
动态KV缓存更新策略： TokenSwift采用动态更新策略，在生成过程中将初始KV缓存保留，同时根据Token的重要性对后续缓存进行有序替换。
基于树结构的多候选Token验证： TokenSwift引入了树形注意力机制，构建包含多个候选Token组合的树形结构，采用并行验证的方式，从中随机选择最长且有效的n-gram作为最终输出，确保生成过程无损且多样性得到提升。
上下文惩罚策略： TokenSwift设计了一种上下文惩罚方法，在生成过程中为近期生成的Token施加惩罚，使模型在选择下一Token时更倾向于多样化输出，有效减少重复现象。

TokenSwift的快速文本生成能力，使其在多个领域具有广泛的应用前景：

为了促进TokenSwift的进一步发展和应用，开发团队已将其项目开源，并提供了详细的项目地址：

TokenSwift的出现，无疑为超长文本生成领域注入了新的活力。我们期待在未来看到更多基于TokenSwift的创新应用，为人工智能的发展带来更大的推动力。

参考文献：

bigai-nlco.github.io. (n.d.). TokenSwift. Retrieved from https://bigai-nlco.github.io/TokenSwift/
github.com. (n.d.). bigai-nlco/TokenSwift. Retrieved from https://github.com/bigai-nlco/TokenSwift
huggingface.co. (n.d.). TokenSwift. Retrieved from https://huggingface.co/TokenSwift
arxiv.org. (n.d.). arXiv:2502.18890. Retrieved from https://arxiv.org/pdf/2502.18890

关键词： TokenSwift, 超长文本生成, 人工智能, 文本生成加速, 北京通用人工智能研究院, AI工具

（完）

>>> Read more <<<