模型能力评估

数据来源:https://www.superclueai.com/


GPT4o-mini(总分73分)

细分评分还未出来,整体比GPT4o略弱,比GPT3.5强很多,综合评分73分

GPT-3.5 Turbo(总分64分)

GPT-4 Turbo(总分75分)

GPT-4o(总分81分 最高)

Claude(总分77分)

Gemini(总分68分)

月之暗面(总分72分)

文心一言(总分69分)

通易千问(总分71分)

最后更新于

这有帮助吗?