黄山的油菜花黄山的油菜花

InfoQ 作者 | 褚杏娟

自 2022 年12 月启动“1+N”大模型技术攻关以来,科大讯飞已在这个领域探索了两年多。作为将大模型融入自身业务的典型,讯飞在大模型探索上是围绕业务“选择性答题”:不是要拿全领域第一名,但业务涉及的方向必须领先。

科大讯飞也取得了不错的成绩:根据真实数据背靠背的测试,讯飞星火 4.0 Turbo 七大核心能力全面超过 GPT-4 Turbo,数学和代码能力超越GPT-4o;首发 11 项基于讯飞星火底座能力的技术和产品应用等。这也体现在了财报上,今年前三季度,科大讯飞实现收入 148.5 亿,同比增长 17.73%;毛利 60.07 亿,同比增长 18.17%。

面对市场的不断变化,科大讯飞必须学会做对的选择。那么,科大讯飞如何选择研发方向?具体都有哪些思考?科大讯飞研究院院长刘聪在近日接受 InfoQ 采访中,从不同的角度讲述了讯飞的发展经验以及自己的思考。

必答题:大模型推理

OpenAI 今年推出了对业界影响重大的三个模型:Sora、GPT-4o 和 o1,分别代表了当前视频生成、语音交互和推理的顶尖技术能力,这些也是国内企业正在竞相追赶的赛道,不过各家各有特长。

对于一个将大模型融入自身业务的典型,Sora 类技术并不符合讯飞当前业务需求,而 GPT-4o和 o1 两个模型的技术路线,对其来说却是意义重大。

GPT-4o 代表的多模交互能力一直是讯飞专注的技术能力之一,多模态交互形式的出现也影响到了之前交互性并不强的领域,而 o1 的重要意义在于更复杂问题的解决上。

“我们初步判断 o1 这条路线有可能改善,虽然它没有公布任何技术细节,但它有可能提升推理过程,使其不再那么依赖大量的数据和精细设定的推理路径。如果实现了这样的改进,将对解决复杂问题大有裨益。”刘聪说道。

语言推理需要将思维链标识得非常细致,这种情况下推理过程非常依赖数据,甚至依赖设定的推理路径,否则成本会很高。过去人工标注的数据很贵,无法覆盖足够多的场景。但 o1 带来的启发是,只要答案存在于数据中,系统就能够自动操作、自发生成推理链,并在广阔的思维空间中寻找合理的解决方案。这意味着系统将采用以结果为导向的奖励机制来自动生成所需的推理链。

“这是我们未来要做的第一件事。”刘聪表示,它的意义不仅仅是自动生成思维链。“o1 甚至还有可能探索出一些与人类传统思维不同的新路径。”

刘聪表示,讯飞在推理方面主要关注两类问题:

  • 一是以数学为基础的推理问题:例如,解决数学题、逻辑推理、代码生成等。
  • 二是以常识为基础的推理问题:例如,理解复杂文本、进行多轮对话、进行知识问答等。

讯飞的优势:语音和多模态

科大讯飞在语音识别、语音合成、自然语言处理等领域拥有深厚的积累,这为其在大模型领域的发展奠定了坚实的基础。

“我们拥有大量的语音数据,这对于训练大模型来说非常重要。此外,我们还拥有丰富的多模态数据,这将帮助我们构建更强大的多模态大模型。”刘聪说道。

未来展望:更强大的推理能力和更广泛的应用

科大讯飞将继续加大对大模型技术的投入,并将其应用于更多领域,例如:

  • 教育领域:个性化学习、智能辅导等。
  • 医疗领域:智能诊断、辅助治疗等。
  • 金融领域:风险控制、智能客服等。
  • 工业领域:智能制造、生产优化等。

科大讯飞希望能够通过大模型技术,推动人工智能技术的应用落地,为社会创造更大的价值。

参考文献

注: 本文根据 InfoQ 文章内容整理,并添加了一些个人理解和分析。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注