大模型的深渊：一图汇总国内大模型现状

2024-02-28 15:32:05.0 IT智库科技趋势

2月16日，OpenAI推出其首款文生视频大模型Sora。该模型能根据提示词生成长达1分钟的视频，或者扩展生成的视频使其更长，同时视觉质量相当惊艳。Sora不仅对文本理解更深刻，能准确地呈现提示词，而且可在一个生成的视频中创建多个镜头，准确地保留角色和视觉风格。除了支持文本指令输入外，该模型支持生成图像，也支持将现有静止图像变成视频，能对现有视频进行扩展、将两个视频衔接并填充缺失的帧。其3D仿真能力非常突出，无论是制作短视频、动画、电影画面，还是渲染视频游戏，都展示出了令人期待的落地前景。

2月15日，谷歌悄悄推出了名为“Goose”的内部AI大语言模型，以帮助员工更快地编写代码，协助开发新产品，提高工作效率。Goose“在谷歌拥有25年的工程专业知识”，仅供谷歌员工使用，“可以回答有关谷歌特定技术的问题，使用内部技术栈编写代码，并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出，Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。Goose“还计划成为谷歌批准的第一个用于内部变成的通用大语言模型”。

实际上，国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等公司，都在近期推出了生成式AI大招。国内产业玩家近期进展披露不多，但整个2023年，中国公司发布的大模型数量已经超过130个，入局者也是层出不穷。但中国大模型存在3个问题：

1）目前国产大模型中，主要分为三类：一是原创大模型；二是套壳国外的开源大模型；三是拼装大模型，也就是把过去的小模型们拼在一起，变成参数量看起来很大的“大模型”。其中，原创大模型数量很少，大多是套壳。

2）大模型的基础之一是海量算力，且是先进算力，因此大模型也被称为暴力美学。但实际情况是，不少大模型公司并不想在算力上做大规模投入。因为业内流传一句话，中国不少科研机构连A100的电费都付不起。

3）数据和算力都是大模型的基础，在数据方面，中国大模型产业面临和算力同样的问题：是否值得大规模投入？中国大模型以中文数据为主，业内普遍认为中文互联网数据的质量较低。需要专业团队对数据进行清洗、整理。这笔投入对于很多公司，尤其是创业公司来说，看起来并不划算。

中国大模型现状现整理如下：