模型能力评估
GPT4o-mini(总分73分)
GPT-3.5 Turbo(总分64分)

GPT-4 Turbo(总分75分)

GPT-4o(总分81分 最高)

Claude(总分77分)

Gemini(总分68分)

月之暗面(总分72分)

文心一言(总分69分)

通易千问(总分71分)

最后更新于