北京 – 2024年2月11日 – 面对DeepSeek R1官网API调用高峰期可能出现的卡顿问题,人工智能基础设施公司无问芯穹(Infinigence-AI)今日宣布,其大模型服务平台正式上线“满血版”DeepSeek-R1和DeepSeek-V3 API,并提供免费Token使用,旨在为开发者提供更流畅、更高效的AI开发体验。同时,无问芯穹还强调,其Infini-AI异构云平台将为DeepSeek系列模型提供多元异构自主算力服务,进一步降低AI开发和部署的门槛。
解决卡顿痛点,满血版API免费用
DeepSeek-R1作为国内领先的大模型之一,凭借其强大的语言理解和生成能力,在代码生成、文本创作等领域表现出色。然而,由于官网API访问量巨大,部分开发者在使用过程中可能会遇到卡顿现象,影响开发效率。
无问芯穹此次推出的“满血版”DeepSeek-R1 API,通过优化底层架构和算力资源,有效解决了这一痛点。据官方介绍,该API版本在性能和稳定性方面均有显著提升,能够确保开发者在高峰时段也能流畅使用。更重要的是,无问芯穹此次采取了免费Token的策略,让更多开发者能够零成本体验DeepSeek-R1的强大功能,加速AI应用的创新和落地。
异构算力加持,释放模型潜力
除了提供优化后的API服务,无问芯穹还强调了其Infini-AI异构云平台在支持DeepSeek系列模型方面的独特优势。异构计算是指使用不同类型的处理器(如CPU、GPU、FPGA等)来协同完成计算任务,从而充分利用各种硬件的优势,提高计算效率和性能。
无问芯穹的Infini-AI平台集成了多种异构算力资源,能够根据DeepSeek-R1模型的特点和应用场景,智能调度合适的硬件加速器,从而最大限度地发挥模型的潜力。例如,对于需要大量矩阵运算的任务,平台可以优先使用GPU进行加速;对于需要低延迟响应的任务,平台可以采用FPGA进行优化。
通过异构算力的加持,DeepSeek-R1模型不仅能够运行得更快,还能更好地适应不同的硬件环境,降低部署和维护成本。这对于企业和开发者来说,无疑是一个巨大的福音。
并发服务包模式,保障企业级应用稳定
为了满足企业级用户对稳定性和可靠性的更高要求,无问芯穹还推出了并发服务包模式。该模式允许客户按需购买不同规格的并发服务包(如5、10、50、100并发等),从而确保在生产环境中DeepSeek-R1 API能够稳定运行,避免因并发量过大而导致的服务中断。
此外,Infini-AI平台还支持并发服务包 + 按量并发混合调用模式,能够根据实际流量情况动态调整算力资源,从而更好地应对弹性流量的需求。这种灵活的计费方式,既能保障服务的稳定性,又能降低企业的运营成本。
企业用户可以通过填写表单(https://infinigence.feishu.cn/share/base/form/shrcneXZPoXbmWoYznkadWG01ug)获取超稳定的企业级服务,并根据自身需求选择合适的并发服务包。
DeepSeek R1 + Cursor,开发效率飙升
为了进一步提升开发者的工作效率,无问芯穹还分享了如何将DeepSeek-R1 API接入Cursor代码编辑器的教程。Cursor是一款基于AI的代码编辑器,能够理解开发者的意图,自动生成代码、修复Bug、提供代码建议等。
通过将DeepSeek-R1与Cursor结合使用,开发者可以享受到更加智能化的编程体验。DeepSeek-R1强大的代码生成能力,可以帮助开发者快速构建应用程序;Cursor智能的代码提示和自动补全功能,可以减少开发者的手动输入,提高编码效率。
以下是将DeepSeek-R1 API接入Cursor的简要步骤:
-
准备工作:
- 注册账号:登录无问芯穹大模型服务平台 (https://cloud.infini-ai.com/genstudio?source=9B2W)。
- 获取API密钥:在「模型广场」选择 DeepSeek-R1,点击创建并获取 APIKEY,复制模型名称。
- 安装Cursor:前往 Cursor 官网(https://www.cursor.com/)下载并安装。
-
Cursor 中集成 API 服务:
- 无问芯穹大模型服务平台提供 OpenAI 兼容的 API 服务,可在 Cursor 中通过 OpenAI API Key 选项轻松集成。
- 打开 Cursor 设置,在 Openrouter model 中关闭所有自带模型,确保列表中有上一步复制的模型名称「deepseek-r1」。
- 在设置中选择 Models 页面,找到 OpenAI API Key 模块。
- 填写在无问芯穹大模型服务平台获取的 API Key 密钥,并将 Base URL 配置为
https://cloud.infini-ai.com/maas/v1
- 确保在 Models 页面添加与无问芯穹大模型服务平台相关的模型名称,并勾选。例如:
deepseek-r1
、deepseek-v3
、deepseek-r1-distill-qwen-32b
。
通过以上步骤,开发者就可以在Cursor中使用DeepSeek-R1 API,体验AI驱动的智能编程。
示例:使用DeepSeek R1和Cursor创建一个ComfyUI体验应用
假设开发者想要创建一个 ComfyUI 体验应用,用户可以通过简单的 Web 界面,上传一张人像照片,然后选择不同的风格(例如:卡通风格、油画风格、赛博朋克风格),应用将自动使用 ComfyUI 工作流生成对应风格的图像。Web 应用需要包含:
- 图片上传区域
- 风格选择下拉菜单
- 生成按钮
- 显示生成结果的区域
开发者可以使用Cursor和DeepSeek R1快速生成实现这些功能的代码,极大地缩短开发周期。
打通多芯片适配,国产芯片也能跑满血R1
无问芯穹的另一大亮点在于其对国产芯片的积极支持。据了解,Infini-AI异构云大模型服务平台不仅已正式上线满血版 DeepSeek-R1、DeepSeek-V3,且在逐一打通 DeepSeek-R1 在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七个硬件平台上的便捷部署与推理服务。
这意味着,开发者可以在国产芯片上也能流畅运行DeepSeek-R1模型,无需担心兼容性问题。这对于推动国产AI芯片的应用和发展具有重要意义。
无问芯穹表示,未来将继续加大对国产芯片的支持力度,与更多硬件厂商合作,共同构建繁荣的国产AI生态。
总结与展望
无问芯穹此次推出满血版DeepSeek-R1 API,并提供异构算力加持,是其在人工智能基础设施领域的重要布局。通过解决API卡顿问题、提供免费Token、支持异构计算和国产芯片,无问芯穹旨在降低AI开发门槛,加速AI应用的落地,并推动国产AI生态的发展。
在竞争日益激烈的大模型市场,无问芯穹凭借其独特的技术优势和市场策略,有望在未来取得更大的发展。我们期待无问芯穹能够继续创新,为开发者带来更多优质的产品和服务,共同推动人工智能技术的进步。
关于无问芯穹(Infinigence-AI)
无问芯穹(Infinigence-AI)是一家人工智能基础设施公司,致力于为企业和开发者提供高性能、低成本、易用的AI算力服务。公司拥有领先的异构计算技术和丰富的行业经验,能够为客户提供全方位的AI解决方案。
联系方式
- 官方网站:https://cloud.infini-ai.com/
- 企业级服务咨询:https://infinigence.feishu.cn/share/base/form/shrcneXZPoXbmWoYznkadWG01ug
关键词: DeepSeek-R1, 无问芯穹, 异构算力, API, 大模型, 人工智能, Cursor, 国产芯片, Infini-AI, AI开发
相关链接:
- 无问芯穹大模型服务平台:https://cloud.infini-ai.com/genstudio?source=9B2W
- Cursor官网:https://www.cursor.com/
- 企业级服务咨询表单:https://infinigence.feishu.cn/share/base/form/shrcneXZPoXbmWoYznkadWG01ug
风险提示:
- 本文仅为信息传递,不构成任何投资建议。
- 大模型技术仍在快速发展中,其应用效果可能受到多种因素的影响。
- 请开发者在使用相关API和服务时,仔细阅读官方文档,并遵守相关法律法规。
补充信息:
- 文章中提及的“满血版”DeepSeek-R1 API,指的是在性能和稳定性方面经过优化,能够充分发挥模型能力的API版本。
- 异构算力是指利用不同类型的处理器(如CPU、GPU、FPGA等)协同完成计算任务,从而提高计算效率和性能。
- Cursor是一款基于AI的代码编辑器,能够理解开发者的意图,自动生成代码、修复Bug、提供代码建议等。
- 文章中提及的国产芯片包括壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等。
- 无问芯穹是一家人工智能基础设施公司,致力于为企业和开发者提供高性能、低成本、易用的AI算力服务。
未来展望:
无问芯穹此次发布的满血版DeepSeek-R1 API和异构算力平台,标志着其在AI基础设施领域的进一步发展。未来,无问芯穹有望继续加大对大模型和算力的投入,推出更多创新产品和服务,为AI开发者提供更强大的支持。同时,我们也期待无问芯穹能够与更多合作伙伴携手,共同构建繁荣的AI生态,推动人工智能技术的广泛应用。
媒体联系:
如有媒体采访需求,请联系无问芯穹公关部门。
开发者社区:
欢迎广大开发者加入无问芯穹开发者社区,共同交流学习,分享经验,共同推动AI技术的发展。
Views: 0