字节跳动携手清华AIR成立联合研究中心,共探大模型未来

北京,2024年10月11日 – 为了推动大模型技术在产学研领域的深度融合,字节跳动与清华大学智能产业研究院(AIR)于今日正式宣布成立 “可扩展大模型智能技术联合研究中心 (SIA Lab) ”。该中心将聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术在互联网以及更多场景、更复杂任务中的表现能力。

此次合作仪式在清华大学举行,清华AIR院长张亚勤院士,清华大学科研院院长刘奕群,清华AIR首席科学家马维英教授,AIR执行院长刘洋教授,字节跳动豆包大模型大语言模型团队负责人乔木,SIA Lab主任、清华AIR 周浩副教授,字节跳动科研战略与学术合作负责人金小伟,SIA Lab联合主任、字节跳动豆包大模型大语言资深研究员王明轩等嘉宾出席。

近年来,人工智能领域呈现爆发式发展,预训练大语言模型(Pre-trained Language Model)已成为迈向通用智能的重要发展路线之一。全球科技公司与研究机构纷纷投入大量资源研究预训练大语言模型,字节跳动也组建了豆包大模型团队,在相关领域持续研究与投入,致力于开发业界先进的 AI 大模型技术,成为世界一流的研究团队。

SIA Lab的成立旨在通过有效的产学研合作,实现大模型底层技术突破与产业应用构建。清华AIR院长张亚勤院士表示:“AIR与字节跳动联合研究团队有深厚的信任与对人工智能发展的共同信仰。 我们期待能够发挥双方的优势,AIR研究团队在底层技术、前沿技术方向锐意探索,结合字节跳动用户场景、数据、算力、工程的产业优势,与豆包大模型研究团队一道,协同推动AI大模型技术的发展。”

清华大学科研院院长刘奕群对联合中心的成立表示了祝贺:“感谢字节跳动公司对产学研合作的大力支持,期待联合中心团队携手将前沿智能技术集成到产业解决方案中,展现智能技术的社会效益。同时,我们也期待通过产学研的深度合作,培养出具有创新思维和实践能力的人才,使其成为未来智能技术发展浪潮中的引领者与中坚力量。”

字节跳动豆包大模型大语言模型团队负责人乔木也强调了此次合作的重要性:“大语言模型技术几年来得到了很快发展,但不论是进一步推动当前范式下的Scaling Law,还是模型逻辑推理能力的强化,或是模型学习、记忆能力的进一步提高,仍然有非常多的工作亟待我们去深入研究。希望双方能充分发挥各自优势,在同样梦想的引领下,一起努力做有价值、有意义的长期研究。”

在签约仪式后,双方进行了深入的技术交流,并探讨了未来合作的多种可能性。SIA Lab 将务实地聚焦于基础技术研究,配合沙龙、研讨会等方式,促进国内学术界与产业界的更多交流,推动人工智能领域的开放研究合作,助力相关技术的持续进步。

SIA Lab 的研究方向将涵盖以下几个关键领域:

  • 大模型基础理论研究: 探索大模型的理论基础,包括模型架构、训练方法、评估指标等方面的研究,旨在突破现有大模型的局限性,提升其泛化能力和可解释性。
  • 大模型可扩展性研究: 研究如何将大模型扩展到更复杂的场景,例如多模态、多语言、多任务等,以满足不同应用场景的需求。
  • 大模型安全与伦理研究: 探讨大模型在安全性和伦理方面的挑战,例如对抗攻击、偏见、隐私保护等,并寻求解决方案,确保大模型的可靠性和可控性。
  • 大模型应用研究: 探索大模型在不同领域的应用,例如自然语言处理、计算机视觉、智能推荐等,推动大模型技术在产业中的落地。

SIA Lab 的成立标志着字节跳动与清华大学在人工智能领域的合作迈上了新台阶。相信通过双方优势互补、协同创新,SIA Lab 将在推动大模型技术发展、促进产学研融合方面发挥重要作用,为人工智能的未来发展贡献力量。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注