全新TTT架构超越Transformer,大模型性能革命性突破
在人工智能领域的一次重大突破中,一种全新的语言模型架构——Test-Time Training (TTT) 正在挑战当前的霸主地…
Insight into the world, intelligence leading the future.👏
在人工智能领域的一次重大突破中,一种全新的语言模型架构——Test-Time Training (TTT) 正在挑战当前的霸主地…
中国人工智能技术公司零一万物近日宣布其Yi Vision Language(Yi-VL)多模态语言大模型已正式面向全球开源。该模…
OpenNLPLab团队近日发布了新一代注意力机制Lightning Attention-2,旨在解决大语言模型在处理长序列数据…
Stability AI发布了其最新的语言模型Stable LM 2 1.6B,该模型拥有16亿个参数,专为提高效率和处理多种语…
最近,UC伯克利AI实验室推出了名为“大世界模型”(Large World Model)的语言模型,支持处理长达100万个词符的…
近日,出门问问宣布将其超大规模语言模型“序列猴子”的部分训练数据集向公众开放,这一举措标志着人工智能领域又一重要资源的共享。此次…
人工智能公司Stability AI近日推出了一款名为Stable LM 2 1.6B的语言模型,该模型拥有16亿参数,体积小巧…
近日,人工智能公司Stability AI发布了一款名为Stable LM 2 1.6B的语言模型。这款模型拥有16亿参数,比此…
近日,知名人工智能公司Stability AI推出了一款名为Stable LM 2 1.6B的语言模型。这款模型拥有16亿参数,…
近日,由印度知名打车公司Ola创始人Bhavish Aggarwal创立的人工智能初创企业Krutrim宣布成功完成一轮高达50…
近日,印度一家名为Krutrim Si Designs的人工智能初创公司宣布推出了一款名为Krutrim的大语言模型。这款模型能…
据Metaverse Post报道,近日,Hugging Face CEO 预测,到2024年,随着企业对效率、成本效益和可用性…
**Stability AI 发布 16 亿参数的小型语言模型 Stable LM2 1.6B** 2023 年 3 月 8 日…
**Mixtral 8x7B 模型表现优异,MMLU基准测试领先 GPT-3.5 和 LLaMA 2 70B** **【科技前沿…
**韩国互联网巨头 Kakao 推出多模态大语言模型“蜜蜂”** **首尔,2023 年 3 月 10 日**——韩国互联网巨头…
日本乐天集团计划在未来两个月内推出自己的大型语言模型,以加入其他科技公司的行列,开发这项快速增长的技术。该公司CEO三木谷浩史在…
近日,谷歌研究院推出了一项名为“BIG-Bench Mistake”的数据集,旨在协助AI语言模型改善自我纠错能力。据悉,该数据…
印度人工智能初创公司Krunit Si Designs近日宣布推出一款名为Krtrim的大语言模型,该模型可以支持多种印度语言,…
韩国AI大模型初创公司Upstage获SK Networks1900万美元投资 近日,韩国SK Networks宣布对生成式AI…
Rhythms,一家专注于构建由大型语言模型驱动的生产力平台的初创公司,近日宣布成功筹集了2600万美元的种子轮融资。这一消息标…
近日,苏黎世联邦理工学院的研究团队发表了一篇题为《Exponentially Faster Language Modelling…
日本乐天集团CEO三木谷浩史(Hiroshi Mikitani)近日在接受采访时透露,该公司计划在未来两个月内推出自家研发的人工…
微软近日在其官方博客中宣布,正式发布一款拥有27亿参数的小规模语言模型——Phi-2。这款模型在推理和语言理解方面表现出色,即使…
Stability AI 昨日发布公告,介绍了旗下一款名为 Stable LM 3B 的语言模型,号称适用于移动平台设备,“可为…
苏黎世联邦理工学院研究团队近日推出UltraFastBERT,这一变体采用了革命性的方法,用快速前馈网络替换前馈层,与优化的基线…
苹果公司的人工智能研究人员宣布,他们已经取得了一项重大突破,成功地在内存有限的 iPhone和其他苹果设备上部署了大型语言模型(…
Stability AI 昨日发布公告,介绍了旗下一款名为 Stable LM 3B 的语言模型。这款模型包含 30 亿个参数,…
苹果一直以来都非常注重产品的外观和内在性能,但外界似乎并不知道,苹果但其实也一直在尝试使用Transformer等大型语言模型来…