Gemini最新实验模型登顶lmsys.org大模型排行榜Google刚刚放出了名为 gemini-1.5-pro-exp-0801 的最新版，并在lmsys.org大模型排行榜中击败gpt-4o和claude 3.5，荣登榜首

Gemini最新实验模型登顶lmsys.org大模型排行榜

Google刚刚放出了名为 gemini-1.5-pro-exp-0801 的最新版，并在lmsys.org大模型排行榜中击败gpt-4o和claude 3.5，荣登榜首。

LMSYS Chatbot Arena 是人工智能界最广泛认可的基准之一，它对各种任务的模型进行评估，并给出总体能力分数。在这个排行榜上，GPT-4o 获得了 1286 分，而 Claude-3 则获得了令人称道的 1271 分。之前的 Gemini 1.5 Pro 得分为 1,261 分。

实验版 Gemini 1.5 Pro（命名为 Gemini 1.5 Pro 0801）以 1300 分的骄人成绩超越了最接近的竞争对手。这一重大进步表明，谷歌的最新机型可能拥有比竞争对手更强的综合能力。

值得注意的是，虽然基准可以为人工智能模型的性能提供有价值的见解，但它们并不总能准确地代表其在实际应用中的全部能力或局限性。

目前，已经可以在 Google AI studio 或GCP的 Vertex AI 中试用gemini-1.5-pro-exp-0801。

via: lmsys.org leaderboard

📣 AI新闻频道