模型能力评估
GPT4o-mini(总分73分)
细分评分还未出来,整体比GPT4o略弱,比GPT3.5强很多,综合评分73分
GPT-3.5 Turbo(总分64分)

GPT-4 Turbo(总分75分)

GPT-4o(总分81分 最高)

Claude(总分77分)

Gemini(总分68分)

月之暗面(总分72分)

文心一言(总分69分)

通易千问(总分71分)

最后更新于
这有帮助吗?