ChatGPT / AI新闻聚合
20:00 · 2024年6月22日 · 周六
Claude 3.5 Sonnet 在 GPQA 测试中达到 67.2% 超越了专业博士的水平
via
XiaoHu.AI学院
(author: 小互)
Telegraph
Claude 3.5 Sonnet 在 GPQA 测试中达到 67.2% 超越了专业博士的水平
Anthropic发布了其最新的Claude 3.5 Sonnet模型,在研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 方面树立了新的行业基准。 在最新的Claude 3.5 Sonnet 的技术评测报告中,Claude 3.5 Sonnet在GPQA测试中的得分为67.2%,超过了领域内专业博士的水平。这是第一次有大语言模型在GPQA测试中突破了65%的得分。 GPQA(Graduate-Level Question Answering)是一个旨在评估…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]