iFlytek’s AI Journey Beyond Speech a Two-Year Odysseyin Large Language Models

InfoQ 作者 | 褚杏娟

自 2022 年12 月启动“1+N”大模型技术攻关以来，科大讯飞已在这个领域探索了两年多。作为将大模型融入自身业务的典型，讯飞在大模型探索上是围绕业务“选择性答题”：不是要拿全领域第一名，但业务涉及的方向必须领先。

科大讯飞也取得了不错的成绩：根据真实数据背靠背的测试，讯飞星火 4.0 Turbo 七大核心能力全面超过 GPT-4 Turbo，数学和代码能力超越GPT-4o；首发 11 项基于讯飞星火底座能力的技术和产品应用等。这也体现在了财报上，今年前三季度，科大讯飞实现收入 148.5 亿，同比增长 17.73%；毛利 60.07 亿，同比增长 18.17%。

面对市场的不断变化，科大讯飞必须学会做对的选择。那么，科大讯飞如何选择研发方向？具体都有哪些思考？科大讯飞研究院院长刘聪在近日接受 InfoQ 采访中，从不同的角度讲述了讯飞的发展经验以及自己的思考。

必答题：大模型推理

OpenAI 今年推出了对业界影响重大的三个模型：Sora、GPT-4o 和 o1，分别代表了当前视频生成、语音交互和推理的顶尖技术能力，这些也是国内企业正在竞相追赶的赛道，不过各家各有特长。

对于一个将大模型融入自身业务的典型，Sora 类技术并不符合讯飞当前业务需求，而 GPT-4o和 o1 两个模型的技术路线，对其来说却是意义重大。

GPT-4o 代表的多模交互能力一直是讯飞专注的技术能力之一，多模态交互形式的出现也影响到了之前交互性并不强的领域，而 o1 的重要意义在于更复杂问题的解决上。

“我们初步判断 o1 这条路线有可能改善，虽然它没有公布任何技术细节，但它有可能提升推理过程，使其不再那么依赖大量的数据和精细设定的推理路径。如果实现了这样的改进，将对解决复杂问题大有裨益。”刘聪说道。

语言推理需要将思维链标识得非常细致，这种情况下推理过程非常依赖数据，甚至依赖设定的推理路径，否则成本会很高。过去人工标注的数据很贵，无法覆盖足够多的场景。但 o1 带来的启发是，只要答案存在于数据中，系统就能够自动操作、自发生成推理链，并在广阔的思维空间中寻找合理的解决方案。这意味着系统将采用以结果为导向的奖励机制来自动生成所需的推理链。

“这是我们未来要做的第一件事。”刘聪表示，它的意义不仅仅是自动生成思维链。“o1 甚至还有可能探索出一些与人类传统思维不同的新路径。”

刘聪表示，讯飞在推理方面主要关注两类问题：