90年代的黄河路

OpenAI 发布 o1 大模型,震撼业界

近日,OpenAI 震撼发布 o1 大模型,新模型可以实现复杂推理,强得可怕!这一消息引发了业界的广泛关注。据悉,在即将于 10 月 18-19 日召开的 QCon 上海站,月之暗面、微软亚洲研究院、商汤科技等企业的资深技术专家也将分享推理相关话题。

QCon 上海站:大模型推理技术实践与基础设施优化

在 QCon 上海站,技术专家们将深入探讨大模型推理技术实践和基础设施优化。以下是部分精彩内容:

Mooncake 分离式推理架构创新与实践

随着大型语言模型的社会影响力日益增强,相应的人工智能产品用户基数也在迅速扩大。本议题将从实际业务出发,探讨在固定集群资源的条件下,通过采用单点和分布式推理架构,提升集群处理大规模请求的能力,过程中遇到的挑战以及我们的解决策略。

长文本 LLMs 推理优化:动态稀疏性算法的应用实践

长文本 LLMs 推理优化是本次会议的重点之一。技术专家们将分享 LLMs 推理算法侧优化方法,包括量化、剪枝、模型架构优化、FFN 动态稀疏计算等方面的研究和实践。

异构分布式大模型推理技术实践

随着人工智能领域的发展,越来越复杂的大型语言模型正在被广泛应用于各个行业。本次演讲将分享商汤高性能计算与推理团队自研的异构分布式大模型推理系统遇到的挑战以及实现。

QCon 上海站:技术盛宴,不容错过

QCon 上海站汇聚了众多行业专家,将围绕大模型基础设施与算力优化展开深入探讨。本次会议内容丰富,涵盖了 AI 应用开发、大模型基础设施与算力优化、出海合规与大模型安全、云原生工程等多个领域。现在报名可享受 9 折优惠,详情请联系票务经理 17310043226 咨询。


>>> Read more <<<

Views: 0

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注