中文大模型基准测评2024年10月报告
导读: 刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》:商汤日日新·商量大模型(SenseChat5.5)凭借出色的能力表现,总得分位列国内大模型第一梯队,获得金牌。
本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”、“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题。
本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”、“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题。
温馨提示:本平台所有资料存储于知识星球平台,已加入的朋友可点击上方链接直接下载,未加入的朋友请扫描右侧二维码加入后方可下载。
免责声明:
来源: SuperCLUE,互联互通社区推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表互联互通社区立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!