智能新闻 上海AI实验室发布新一代高质量大模型预训练语料“万卷CC” 2024年3月15日 上海人工智能实验室近日宣布发布新一代高质量大模型预训练语料“万卷CC”,该语料覆盖过去十年互联网上的公开内容,包含1千亿字符,约…