通用大模型VS垂直大模型

AI大模型,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异正在显性化。

1、通用大模型


通用的AI大模型像ChatGPT,能够处理各种领域和场景的自然语言,但是不一定有深入的专业知识。

通用的AI大模型需要巨大的计算资源和数据量,通用AI大模型已经成为国内外大厂的重点项目,他们有着强大的技术团队和资金支持,而且有着自己的场景和流量优势。比如百度、阿里、腾讯、字节、华为等,在搜索、社交、电商、办公等领域都有着自己的通用AI大模型。创业者很难在这样的竞争中获得先发优势或者差异化优势。

2、垂直大模型


垂直的AI大模型是针对某个特定领域或者场景,更好地满足用户在某个领域或者场景下的需求和期待比如医疗、金融、教育等,它能够利用行业的数据和知识,提供更精准和高效的解决方案。


垂直的AI大模型可以更容易地获取和处理高质量的数据和知识,因为它们只关注某个特定的领域或者场景,而不是涵盖所有的领域和场景。这样的模型可以利用一些开源或者闭源的通用AI大模型作为基础,然后在其上进行指令微调(instruction tuning),来适应自己的目标领域或者场景。它们也可以利用一些私有或者公开的数据和知识,来增强自己的AI大模型的性能和泛化能力。

垂直的AI大模型可以更容易地与用户和行业进行有效的沟通和合作,因为它们更了解用户的需求和场景,也更符合行业的规范和标准。这样的模型可以更好地融入用户的工作流程和生活方式,也可以更好地与行业的其他参与者协同和互补。

不过,垂直大模型往往需要支持私有化部署。由于企业的很多业务数据、物流数据、财务数据等都是非常核心的私域数据,很难把数据拿给别人去训练。