大模型的深渊:一图汇总国内大模型现状

2月16日,OpenAI推出其首款文生视频大模型Sora。该模型能根据提示词生成长达1分钟的视频,或者扩展生成的视频使其更长,同时视觉质量相当惊艳。Sora不仅对文本理解更深刻,能准确地呈现提示词,而且可在一个生成的视频中创建多个镜头,准确地保留角色和视觉风格。除了支持文本指令输入外,该模型支持生成图像,也支持将现有静止图像变成视频,能对现有视频进行扩展、将两个视频衔接并填充缺失的帧。其3D仿真能力非常突出,无论是制作短视频、动画、电影画面,还是渲染视频游戏,都展示出了令人期待的落地前景。

2月15日,谷歌悄悄推出了名为“Goose”的内部AI大语言模型,以帮助员工更快地编写代码,协助开发新产品,提高工作效率。Goose“在谷歌拥有25年的工程专业知识”,仅供谷歌员工使用,“可以回答有关谷歌特定技术的问题,使用内部技术栈编写代码,并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出,Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。Goose“还计划成为谷歌批准的第一个用于内部变成的通用大语言模型”。

实际上,国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等公司,都在近期推出了生成式AI大招。国内产业玩家近期进展披露不多,但整个2023年,中国公司发布的大模型数量已经超过130个,入局者也是层出不穷。但中国大模型存在3个问题:

1)目前国产大模型中,主要分为三类:一是原创大模型;二是套壳国外的开源大模型;三是拼装大模型,也就是把过去的小模型们拼在一起,变成参数量看起来很大的“大模型”。其中,原创大模型数量很少,大多是套壳。

2)大模型的基础之一是海量算力,且是先进算力,因此大模型也被称为暴力美学。但实际情况是,不少大模型公司并不想在算力上做大规模投入。因为业内流传一句话,中国不少科研机构连A100的电费都付不起。

3)数据和算力都是大模型的基础,在数据方面,中国大模型产业面临和算力同样的问题:是否值得大规模投入?中国大模型以中文数据为主,业内普遍认为中文互联网数据的质量较低。需要专业团队对数据进行清洗、整理。这笔投入对于很多公司,尤其是创业公司来说,看起来并不划算。

中国大模型现状现整理如下: