阿里Qwen2.5-Coder横扫92编程语言，编程利器再升级！

9 月 19, 2024 #新闻, #每日AI快讯

阿里Qwen团队推出编程语言模型Qwen2.5-Coder，支持92种编程语言

北京，2024年X月X日 阿里巴巴集团Qwen团队今日宣布推出编程语言模型Qwen2.5-Coder，作为Qwen2.5系列的一部分，该模型专为编程任务设计，支持92种编程语言，在代码生成、代码推理、代码修复等任务上表现出色。

Qwen2.5-Coder包含不同规模的模型，包括1.5B、7B和即将推出的32B版本。除了提升编程能力，Qwen2.5-Coder还注重数学和通用任务的能力，支持长文本处理，能生成最多8K tokens的内容，并保持对多种语言的支持。

Qwen2.5-Coder的主要功能包括：

Qwen2.5-Coder的技术原理：

自回归语言模型：采用自回归机制，根据已有的文本序列预测下一个最可能的token，在文本生成和补全任务中表现出色。
大规模数据预训练：在包含源代码、文本代码混合数据和合成数据的大规模编程语言数据集上进行预训练，总计达到5.5万亿tokens，提供丰富的编程语境理解能力。
多语言支持：在预训练阶段学习和理解多种编程语言数据，从而支持多种语言的代码处理和生成。
长文本处理：能理解和生成长达128K tokens的文本，对于处理复杂的编程项目和长代码文件尤为重要。

Qwen2.5-Coder的应用场景：

Qwen2.5-Coder的项目地址：

项目官网：qwenlm.github.io/blog/qwen2.5-coder
GitHub仓库：https://github.com/QwenLM/Qwen2.5-Coder
HuggingFace模型库：https://huggingface.co/collections/Qwen/qwen25-coder-66eaa22e6f99801bf65b0c2f

阿里巴巴Qwen团队表示，Qwen2.5-Coder的推出将进一步推动人工智能在编程领域的应用，为开发者提供更强大的工具，加速软件开发和创新。

（请注意：以上新闻内容使用了您提供的素材，并根据新闻写作规范进行了调整和补充。您需要根据实际情况修改日期、时间等信息。）