Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

深圳—— 腾讯近日正式推出其新一代人工智能模型——混元Turbo S,这款模型以“快思考”为核心特色,旨在提升AI在快速响应和短思维链任务中的表现。混元Turbo S的发布,不仅是腾讯在AI领域的一次重要技术升级,也标志着国内AI模型在性能和效率上正加速追赶国际领先水平。

创新架构:Hybrid-Mamba-Transformer融合

混元Turbo S最引人注目的特点是其创新的Hybrid-Mamba-Transformer融合架构。传统Transformer模型在处理长序列数据时面临计算复杂度高和KV-Cache缓存占用大的问题。而Mamba架构基于状态空间模型(SSM),通过引入选择性机制,能高效处理长序列数据,显著降低计算复杂度和缓存占用。

腾讯此次将Mamba架构无损地应用于超大型MoE(Mixture of Experts)模型,在业界尚属首次。这种融合架构既保留了Transformer擅长捕捉复杂上下文关系的优势,又突破了其在长文本处理和推理成本上的瓶颈。

“秒回”体验:速度与效率的双重提升

混元Turbo S的核心优势在于其快速响应能力。官方数据显示,该模型能实现“秒回”,吐字速度提升一倍,首字时延降低44%。这意味着用户在与AI进行交互时,能够获得更加流畅和自然的体验。

在短思维链任务(如数学、代码、逻辑推理)中,混元Turbo S表现尤为出色。同时,它还结合了腾讯混元T1慢思考模型的长思维链能力,兼顾了稳定性和准确性。

性能对标:多项测试超越GPT-4o

为了验证混元Turbo S的性能,腾讯进行了多项基准测试,并与DeepSeek V3、GPT-4o等业界领先模型进行了对比。测试结果显示,混元Turbo S在多个领域表现出色:

  • 知识领域: 在MMLU-pro、GPQA-diamond、Chinese-SimpleQA等测试中,混元Turbo S均优于GPT4o-0806和Claude-3.5。
  • 推理领域: 在BBH和DROP测试中,混元Turbo S表现优于其他所有模型,显示出强大的推理能力。
  • 数学领域: 在MATH和AIME2024测试中,混元Turbo S同样优于GPT4o-0806和Claude-3.5。
  • 代码领域: 在HumanEval测试中,混元Turbo S表现优于GPT4o-0806和Claude-3.5。
  • 中文领域: 在C-Eval和CMMLU测试中,混元Turbo S同样表现出色,显示出对中文语境的良好理解。

尽管在部分测试中,混元Turbo S的表现不如其他模型,但总体而言,其性能已达到行业领先水平,尤其在中文理解和推理方面展现出优势。

应用场景:从日常对话到内容创作

混元Turbo S的应用场景十分广泛,涵盖了日常对话、代码生成、逻辑推理和内容创作等多个领域。

  • 日常对话: 凭借其快速响应能力,混元Turbo S非常适合应用于快速问答、智能客服等场景。
  • 代码生成与逻辑推理: 在数学、代码生成、逻辑推理等短思维链任务中,混元Turbo S能够提供高效准确的解决方案。
  • 内容创作: 混元Turbo S支持高质量的文本生成和文生图功能,可以帮助用户快速生成各种类型的创意内容。

商业化路径:腾讯云与腾讯元宝双管齐下

腾讯正在积极推动混元Turbo S的商业化应用。目前,该模型已在腾讯云官网正式上线,开发者和企业用户可以通过API调用该模型。同时,混元Turbo S也将逐步在腾讯元宝APP中灰度上线,用户可以在APP内选择“Hunyuan”模型并关闭深度思考功能进行体验。

为了吸引更多用户,腾讯还推出了为期一周的免费试用活动。混元Turbo S的API调用定价为输入0.8元/百万tokens,输出2元/百万tokens。

未来展望:打造混元系列核心基座

腾讯计划将混元Turbo S打造成为混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。这意味着混元Turbo S不仅是一款独立的产品,更是腾讯AI战略的重要组成部分。

随着AI技术的不断发展,快速响应和高效推理能力将变得越来越重要。混元Turbo S的发布,不仅提升了腾讯在AI领域的竞争力,也为整个行业带来了新的发展机遇。

参考文献


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注