Gemini最新实验模型登顶lmsys.org大模型排行榜

Google刚刚放出了名为 gemini-1.5-pro-exp-0801 的最新版,并在lmsys.org大模型排行榜中击败gpt-4o和claude 3.5,荣登榜首。

LMSYS Chatbot Arena 是人工智能界最广泛认可的基准之一,它对各种任务的模型进行评估,并给出总体能力分数。在这个排行榜上,GPT-4o 获得了 1286 分,而 Claude-3 则获得了令人称道的 1271 分。之前的 Gemini 1.5 Pro 得分为 1,261 分。

实验版 Gemini 1.5 Pro(命名为 Gemini 1.5 Pro 0801)以 1300 分的骄人成绩超越了最接近的竞争对手。这一重大进步表明,谷歌的最新机型可能拥有比竞争对手更强的综合能力。

值得注意的是,虽然基准可以为人工智能模型的性能提供有价值的见解,但它们并不总能准确地代表其在实际应用中的全部能力或局限性。

目前,已经可以在 Google AI studio 或GCP的 Vertex AI 中试用gemini-1.5-pro-exp-0801。

via: lmsys.org leaderboard

📣 AI新闻频道
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]