Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

90年代申花出租车司机夜晚在车内看文汇报90年代申花出租车司机夜晚在车内看文汇报
0

端侧大模型推理:挑战与机遇并存

引言

2024 年被誉为 AI 应用的元年,大模型不再仅仅停留在实验室,而是加速走向商业化落地。其中,端侧大模型推理,即在手机、PC、智能汽车等边缘设备上运行大模型,成为了关键环节。然而,端侧部署面临着存储与计算资源、功耗、软件生态等多重挑战。商汤科技SensePPL 端侧大模型推理系统,通过深度调优,在计算优化、推理框架、Serving Pipeline 等方面取得了突破,大幅提升了端侧性能,为大模型的商业化落地提供了强力支撑。

端侧大模型推理的现状与挑战

近年来,端侧大模型发展迅速,手机、汽车、PC 等领域纷纷涌现出相关应用。然而,端侧大模型的实际应用仍面临着诸多挑战:

  • 模型体积与计算资源的矛盾: 大模型通常体积庞大,需要大量的存储空间和计算资源,而端侧设备的存储和算力有限,难以满足需求。
  • 功耗限制: 端侧设备的电池容量有限,大模型推理会消耗大量电能,影响设备续航。
  • 软件生态不完善: 端侧大模型的软件生态尚未成熟,缺乏统一的标准和开发工具,导致开发和部署难度较大。

商汤 SensePPL:端侧大模型推理的解决方案

商汤科技基于多年积累的传统 CNN 推理基础设施研发经验,推出了 SensePPL 端侧大模型推理系统,旨在解决端侧大模型部署的难题。SensePPL 的核心优势在于:

  • 深度优化: SensePPL 在计算优化、推理框架、Serving Pipeline 等方面进行了深度调优,有效提升了端侧大模型的推理效率。
  • 业界领先的性能: SensePPL 在首字延迟、Decoding 延迟等关键性能指标上取得了业界领先水平,大幅改善了终端大模型的交互体验。
  • 云边端一体化: SensePPL 提供云边端一体的推理解决方案,支持模型在云端训练,在边缘端部署,并通过云端协同的方式,实现更强大的功能和更灵活的应用。

SensePPL 的应用案例

SensePPL 已成功部署在智能车舱和手机等场景,取得了显著的成果:

  • 智能车舱: SensePPL 赋能智能座舱大模型,提升了车机语音交互的流畅度和准确性,为用户带来更便捷、更智能的驾驶体验。
  • 手机: SensePPL帮助手机厂商在端侧部署大模型,实现更强大的 AI 功能,例如更精准的语音识别、更智能的图像识别等,提升了手机的智能化水平。

未来展望:端侧大模型的无限可能

端侧大模型的未来充满着无限可能,它将为我们带来更加智能、便捷、个性化的生活体验:

  • 更强大的 AI 功能: 端侧大模型将支持更强大的 AI 功能,例如更自然流畅的对话、更精准的图像理解、更智能的个性化推荐等。
  • 更广泛的应用场景: 端侧大模型将拓展到更多应用场景,例如智能家居、智慧医疗、智慧城市等,为各行各业带来变革。
  • 更安全的隐私保护: 端侧大模型能够在本地设备上进行推理,无需将数据上传到云端,有效保护用户隐私。

结论

端侧大模型推理是 AI 技术发展的重要方向,它将为我们带来更智能、更便捷、更安全的未来。商汤科技 SensePPL 端侧大模型推理系统,通过深度优化和创新,为端侧大模型的商业化落地提供了强力支撑,推动了 AI 技术的快速发展和应用。

参考文献

注: 本文参考了演讲实录和相关资料,并进行了整理和补充。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注