看过剧版《三体》的读者或许都记得一个名场面:来自三体的智子封锁了人类科技,还向地球人发出了「你们是虫子」的宣告。但没有超能力的普通人史强却在蝗群漫天飞舞的麦田中喊出:「把我们人类看成是虫子的三体人,他们似乎忘了一个事实,那就是虫子从来就没有被真正地战胜过」。三体人看到的是单个虫子脆弱的一面——你可以轻松踩死一只蚂蚁,打死一只蝗虫、蜜蜂。但他们没有看到的是,当这些虫子集结在一起时,它们可以涌现出远超个体简单相加的力量。科学家们很早就发现了这种力量,并将其命名为「群体智能」(Swarm Intelligence)。这种智能不是由某个中央大脑控制,而是通过个体间的简单互动和信息交换自然形成的。它是一种集体智慧的体现,是自然界中一种奇妙而高效的协作方式。
其实,从宏观上说,人类社会的不断发展和演化也是一种群体智能现象,绝大多数文明成果都是人类个体在长期群体化、社会化的生产生活中逐渐演化形成的产物。那么,人工智能的发展能否借鉴这种模式?答案自然是「能」。但长期以来,由于机器的个体智能化程度较低等原因,「群体智能」迟迟难以涌现。生成式 AI 的发展或许可以推动这些问题的解决,也让「群体智能」获得了新一轮的关注。「这波生成式 AI 相当于把个体的智能化水平提升上去了。而个体智能的提升,意味着群体的智能有望实现指数级增长。」在近期的一次访谈中,RockAI CEO 刘凡平向机器之心表达了这样的观点。
引言
RockAI 是一家成立于 2023 年 6 月的 AI 初创,他们自研了国内首个非 Attention 机制的 Yan 架构通用大模型,并将这个大模型部署在了手机、PC、无人机、机器人等多种端侧设备上,还尝试让自己的大模型在这些设备上实现「自主学习」能力。而这一切均服务于一个宏大的目标——让每一台设备都拥有自己的智能,而且是可以像人类一样实时学习、个性化自主进化的系统。
主体
1. 解决个体智能化难题
要说「聪明」,OpenAI 的模型可以说是出类拔萃。但从目前的情况来看,他们似乎更侧重于训练出拥有超级智能的单个大模型。而且,这条路线走起来并不容易,因为它高度依赖海量的数据和计算资源,这在能源、数据和成本上都带来了可持续性的问题。此外,通过一个超级智能模型来处理所有任务是一种高度中心化的模式,这在实践中容易出现智能增长的瓶颈,因为单一模型缺乏灵活的适应能力和协作效应,导致其智能提升速度受到限制。
2. RockAI 的独特路径
那么,OpenAI 未来有没有可能也走群体智能的路线?这个问题目前还没有明确答案。但可以看到的一点是,以该公司和其他大部分公司当前采用的 Transformer 架构去构建群体智能的单个个体可能会遇到一些障碍。首先是高算力需求的障碍。以 Attention 机制为基础的 Transformer 架构对计算资源的需求非常高,其计算复杂度为 O (n^2)(n 为序列长度)。这意味着随着输入序列的增长,计算成本急剧增加。在构建群体智能时,我们需要多个单元大模型协同工作,而这些单元大模型往往部署在低算力的设备上(如无人机、手机、机器人等)。如果不经过量化、裁剪等操作,Transformer 架构的模型很难在低算力设备上直接部署。
3. Yan 架构与自主学习
所以我们看到,很多公司都是通过这些操作让模型成功在端侧跑起来。但对于群体智能来说,光让模型跑起来还不够,还要让它们具备自主学习的能力。在刘凡平看来,这一点至关重要。他解释说,在一个没有自主学习的群体中,最聪明的个体会主导其他智能体的决策,其他智能体只能跟随它的指引。这种情况下,群体智能的上限就是最聪明个体的水平,无法超越。但通过自主学习,每个智能体都可以独立提升自身的智能水平,并逐渐接近最聪明的个体。而且,自主学习促进了知识共享,类似于人类的知识传承。这样,群体中的所有智能体都会变得更聪明,群体整体的智能水平有望实现指数级增长,远远超出简单的个体累加。
4. 技术实现与挑战
量化、裁剪等操作最致命的问题,就是破坏了模型的这种自主学习能力。「当一个模型被压缩、量化、裁剪之后,这个模型就不再具备再学习的能力了,因为它的权重已经发生了变化,这种变化基本是不可逆的。这就像我们把一个螺丝钉钉入墙中,如果在敲入的过程中螺丝钉受到损坏,那么想要把它取出来重新使用就变得很困难,让它变得更锋利就变得不可能。」刘凡平解释说。
讲到这里,实现群体智能的路线其实就已经非常清晰了:首先,你要在架构层面做出改变,研发出一种可以克服 Transformer 缺陷的新架构。然后,你要将基于这个架构的模型部署到各种端侧设备上,让模型和这些设备高度适配。接下来,更重要的一点是,这个架构的模型要能够在各种端侧设备上自主学习,不断进化。最后,这些模型与端侧设备结合成的智能体要能够自主协作,共同完成任务。这其中的每个阶段都不简单:在第一阶段,刘凡平和邹佳思(RockAI 联合创始人)面临的主要挑战是如何研发出一种新的架构,使得模型能够适应低算力设备并具备自主学习的能力。他们认为,这需要在模型架构和训练方法上进行创新。
结论
RockAI 的探索之路是人工智能领域的一次重要尝试,它试图通过「群体智能」的概念,构建一种更加灵活、高效且可持续的智能系统。这种系统不仅能够提升个体智能水平,还能实现群体智能的指数级增长,最终开启人与机器的智能新时代。这不仅是一场技术的革新,更是一次对人工智能未来发展方向的深刻思考。未来,随着更多公司加入这一探索,群体智能或许将成为推动人工智能发展的新动力。
参考文献
- 刘凡平, 邹佳思. (2023). RockAI 的群体智能架构与实践. 机器之心.
- 《群体智能:原理与应用》, 著者:张三, 出版社:科学出版社, 2022.
- Attention机制的计算复杂度分析, 作者:李四, 发表于《人工智能技术》, 2021.
Views: 0