北京时间2025年3月25日讯,人工智能领域再掀波澜!国产AI大模型DeepSeek V3于昨夜(3月24日)低调发布更新版本“DeepSeek-V3-0324”,其在代码生成和理解方面的能力进化,引发了国内外AI从业者和爱好者的广泛关注和热烈讨论。众多用户实测结果显示,新版本在特定任务上,例如数学推理和前端开发,已经能够媲美甚至超越Anthropic的Claude 3.5 Sonnet和Claude 3.7 Sonnet,这无疑为开源AI模型阵营注入了一剂强心针。
神秘升级,参数曝光
DeepSeek V3的此次升级显得颇为神秘,官方并未进行大规模宣传,而是以一种近乎“静默”的方式将新模型推向市场。目前,DeepSeek-V3-0324已在Hugging Face平台上线,供开发者下载和部署。
然而,与以往不同的是,DeepSeek官方此次并未公布详细的模型卡,这使得外界对其内部架构和训练细节知之甚少。目前已知的信息仅包括:
- 模型参数规模: 6850亿
- 张量类型: 未知
- 开源协议: 采用更宽松的MIT开源协议
尽管缺乏详细的技术文档,但仅凭6850亿的参数规模,就足以让DeepSeek-V3-0324跻身于全球顶级AI大模型行列。更宽松的MIT开源协议,则意味着开发者可以更加自由地使用、修改和分发该模型,从而加速其在各个领域的应用落地。
代码能力惊艳四座,媲美Claude?
DeepSeek-V3-0324最引人瞩目的,莫过于其在代码生成和理解方面的卓越表现。模型发布后,迅速有大量用户对其进行了测试,结果令人惊喜。
X平台(原Twitter)博主@KuittinenPetri分享了他的测试结果,他表示,DeepSeek-V3-0324在HTML5、CSS和前端代码生成方面表现出色,甚至优于DeepSeek此前的非推理模型。他给DeepSeek-V3-0324下达了创建一个“为AI公司「NexusAI」创建一个外观精美的响应式首页,将所有内容包含在一个HTML5文件”的指令。结果显示,DeepSeek-V3-0324不仅成功生成了包含958行代码的网页,而且还自动生成了网页中所需的图像,包括用户故事和人物头像。更令人称道的是,生成的网页具有良好的交互性和响应式设计,能够完美适配移动设备。
@KuittinenPetri 对此评价道:“DeepSeek-V3-0324是DeepSeek最好的非推理模型,通常更适合创意写作任务,但现在也比 R1 更适合制作 HTML5 + CSS + 前端。DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。”
另一位网友也分享了类似的测试结果,他让DeepSeek-V3-0324创建一个网站,该模型一口气写了800多行代码,中途一次都没有卡顿,生成的网站布局也非常完美。
Hyperbolic 联合创始人兼 CTO Yuchen 则通过“草莓(strawberry)中有多少个r”的测试,发现DeepSeek-V3-0324 已经具备了一些思维链(Chain-of-Thought)模型的特性,能够展示详细的推理步骤。他兴奋地表示:“真正的「Open AI」又赢了。”
性能直逼O1-Pro,性价比优势凸显
除了代码生成能力,DeepSeek-V3-0324在其他方面的表现也备受关注。一位用户将DeepSeek-V3-0324与OpenAI的O1-Pro在生成小球效果方面进行了比较。结果显示,DeepSeek-V3-0324能够达到O1-Pro大约70%的性能。
虽然在性能上略逊一筹,但DeepSeek-V3-0324的优势在于其开源免费以及更低的API价格。据该用户透露,DeepSeek-V3-0324的API价格比O1-Pro便宜至少50倍。在性价比方面,DeepSeek-V3-0324无疑更具吸引力。
该用户表示:“DeepSeek-V3-0324 大约可以实现 o1-pro70% 的性能,但它免费并且 API 价格比后者便宜了至少 50 倍。二者选谁一目了然!”
X平台博主@orange.ai 对 DeepSeek V3、DeepSeek-V3-0324 与 Claude Sonnet 3.7 的海报设计结果进行了比较,同样表示前端代码能力相比上代有了显著增强。
开源生态的崛起,挑战商业闭环?
DeepSeek V3的此次升级,以及DeepSeek-V3-0324所展现出的强大代码能力,再次引发了关于开源AI模型与商业闭环AI模型之间竞争的讨论。
长期以来,OpenAI、Google等公司凭借其强大的资金和技术实力,在AI大模型领域占据主导地位。这些公司通常采用商业闭环模式,即模型不对外开源,用户只能通过API调用来使用模型。
然而,近年来,随着开源AI模型的不断涌现和快速发展,这种格局正在发生改变。Llama、Falcon、BLOOM等开源模型的出现,为开发者提供了更多的选择,也降低了AI技术的使用门槛。
DeepSeek V3的此次升级,无疑是开源AI模型阵营的一次重大胜利。DeepSeek-V3-0324所展现出的强大代码能力,使其在特定任务上能够媲美甚至超越商业闭环模型,这证明了开源AI模型同样可以达到世界一流水平。
更重要的是,DeepSeek-V3-0324采用了更宽松的MIT开源协议,这意味着开发者可以更加自由地使用、修改和分发该模型,从而加速其在各个领域的应用落地。
可以预见,随着开源AI模型的不断发展和完善,它们将在越来越多的领域挑战商业闭环模型,为AI技术的普及和创新注入新的活力。
DeepSeek V3升级背后的思考
DeepSeek V3的此次升级,不仅仅是一次简单的模型迭代,更体现了DeepSeek公司在AI技术发展方向上的思考和探索。
- 注重代码能力: DeepSeek-V3-0324在代码生成和理解方面的卓越表现,表明DeepSeek公司非常重视AI模型在软件开发领域的应用。随着AI技术的不断发展,AI辅助编程将成为一种趋势,能够显著提高软件开发的效率和质量。
- 拥抱开源: DeepSeek-V3-0324采用更宽松的MIT开源协议,表明DeepSeek公司积极拥抱开源生态,希望通过开源的方式吸引更多的开发者参与到模型的改进和应用中来。
- 追求性价比: DeepSeek-V3-0324在性能上略逊于O1-Pro,但其开源免费以及更低的API价格,使其在性价比方面更具优势。这表明DeepSeek公司希望通过提供高性价比的AI模型,降低AI技术的使用门槛,让更多的用户能够享受到AI带来的便利。
未来展望
DeepSeek V3的此次升级,无疑为国产AI大模型的发展注入了新的动力。DeepSeek-V3-0324所展现出的强大代码能力,以及其开源免费的特性,将吸引更多的开发者使用该模型,从而加速其在各个领域的应用落地。
未来,我们期待DeepSeek公司能够继续加大研发投入,不断提升AI模型的性能和功能,为开发者提供更多更好的AI工具。同时,我们也希望更多的中国企业能够加入到开源AI模型的行列中来,共同推动中国AI技术的发展。
参考资料:
- 机器之心:DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
- Hugging Face: DeepSeek-V3-0324
- X (Twitter):
- @KuittinenPetri: https://x.com/KuittinenPetri/status/1904224441384771909
- @YuchenjUW: https://x.com/YuchenjUW/status/1904223627509465116
- @michaelkaoi: https://x.com/michaelkaoi/status/1904178015833297342
- @orange: https://x.com/orange/status/1904306405823467526
- @selcukemiravci: https://x.com/selcukemiravci/status/1904311856313028870
致谢:
感谢所有参与DeepSeek-V3-0324测试并分享结果的网友,他们的贡献为本文提供了宝贵的信息。
声明:
本文所有信息均来源于公开资料,作者力求客观公正,但不对信息的准确性和完整性负责。读者在使用DeepSeek-V3-0324时,请仔细阅读相关文档,并自行承担风险。
Views: 0