2024年9月6日,MiniMax公司举行了视频生成模型video-01的首秀。MiniMax创始人闫俊杰在会上表示,大模型的研发核心是“快”。
“快”是大模型研发的关键
在MiniMax内部,多模态技术已经是一项非常确定的事情。闫俊杰解释说:“在人类社会,大模型的核心意义是做更好的信息处理,而大部分的信息体现在多模态内容里,而非文字上。文字很多时候只是其中精华的一小部分。”
为了实现高用户覆盖度和使用深度,MiniMax选择了输出动态的内容,而非仅仅输出文字内容。闫俊杰说:“用户的渗透率和使用深度是这次创业非常关注的事情。这两点是达成‘Intelligence with Everyone’的核心,也是MiniMax的差异化能力。”
MiniMax的成就与挑战
据统计,MiniMax每日与全球用户进行超30亿次交互,处理超3万亿文本token、2000万张图片和7万小时语音,大模型日处理交互量排名国内AI公司首位。然而,在视频生成赛道,MiniMax的发布并不算早。
闫俊杰表示:“我们在解决一个更难的技术问题:如何能够原生地训练算力比较高的东西。”具体来说,MiniMax团队在算法上降低复杂度、提高压缩率,以适应视频生成模型的需求。
技术创新与商业化
MiniMax在技术上的创新体现在MoE+ Linear Attention的新一代模型技术上。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。
闫俊杰说:“无论是做MoE、Linear attention还是其他的,本质上是让同样的效果模型变得更快,快才意味着同样的算力可以做得更好,这是我们最底层的研发思路。”
在商业化方面,MiniMax采取了两种模式:面向企业的开放平台和自有产品中的广告机制。目前,最重要的不是商业化,而是真正地对技术到达广泛可用的程度。
未来展望
对于国内市场,MiniMax希望打造偏工具类的产品,如海螺AI,不断打磨出新的功能,直到产生强烈的用户粘性。对于海外市场,MiniMax的产品Talkie已经取得了一定的知名度。
面对大模型领域的激烈竞争,闫俊杰表示:“作为一家创业公司,如果我们在竞争中打不赢,那我们就应该被淘汰,其实也没有其他的选择。”他认为,要赢就要更快地看清底层的东西,提升技术,并与用户共创。
目前,国内大模型的使用量显著增长,中国模型在海外市场也越来越具有竞争力。这些积极的变化为MiniMax的未来发展提供了广阔的空间。
Views: 0