在技术飞速发展的今天,人工智能领域不断涌现出新的机遇。李沐,一位曾在 Amazon 工作七年的资深工程师,毅然决然选择创业,投身于大型语言模型(LLM)的研究与应用。近日,他在机器之心平台上分享了自己创业一年的进展、纠结与反思。

创业初心:疫情下的抉择

李沐在 Amazon 工作期间,便萌生了创业的念头。然而,疫情的突然来袭,让他不得不暂时放下这个想法。直到第七年半的时候,他觉得内心的渴望已经无法抑制,于是决定离职创业。他坚信,如果有什么事情是一生中必须尝试的,那么就应该早点行动。因为在真正开始后,会发现有太多新东西要学习,总会感叹为什么没有早点开始。

公司命名:玻色子的寓意

李沐的创业项目名为 BosonAI。这个名称来源于他之前在 Amazon 和 Microsoft 联合项目中所使用的一系列以 Gluon 命名的项目。在量子物理中,Gluon 是一种把夸克绑在一起的玻色子。新公司选择以玻色子(Boson)命名,希望人们在理解“玻色子和费米子组成了世界”这个梗时,能会心一笑。

融资历程:签字前的变故

在融资过程中,李沐经历了不少波折。他在 2022 年底提出了两个用 LLM 做生产力工具的想法,并得到了张一鸣的指导。在张一鸣的建议下,他决定直接做 LLM。幸运的是,他很快拿到了种子投资。然而,在第二轮融资签字前一天,领头机构突然宣布不投了,导致跟投的几家也退出。尽管如此,李沐还是感激剩下的投资方,完成了这一轮融资,拿到了 LLM 的入场券。

技术研发:第一批吃螃蟹的人

在技术研发方面,李沐带领团队克服了重重困难。他们为了购买 GPU,甚至直接给供应商 CEO 写邮件,以求尽快拿到设备。在拿到设备后,他们遇到了各种匪夷所思的 bug,但通过不断调试和优化,终于取得了突破。他们的 Photon 系列模型在客户应用上的效果甚至打赢了 GPT4。

商业模式:定制化服务与原生应用

在商业模式上,BosonAI 主要为客户提供定制化的模型服务。他们针对不同行业的需求,训练出相应的模型,并在测试中取得了良好的效果。此外,他们还关注 LLM 在 toC(面向消费者)领域的落地,为多家创业公司提供模型支持。

认知阶段:LLM 的发展历程

李沐将 LLM 的认知过程分为四个阶段。第一阶段是 Bert 到 GPT3 的出现,他们开始关注新架构和大数据。第二阶段是 GPT4 的发布,让他们意识到技术的重要性。第三阶段是创业的第一个半年,他们开始关注具体应用,训练定制化模型。第四阶段是创业的第二个半年,他们开始关注 AGI 的可能性,并设计了 Higgs 系列模型。

结语:在迷雾中探路

尽管行业和资本仍然急躁,但李沐和他的团队依然保持着乐观的态度。他们专注当下,在迷雾中探路,相信未来会有更多有想象力的应用出现。在人工智能这条道路上,他们将继续前行,为推动技术进步贡献力量。


read more

Views: 1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注