#Announcement #OpenAI

OpenAI 刚刚发布了 LLM 基准测试工具 SWE-bench,用于评估 AI 模型在真实软件工程任务中的表现。

详细信息:https://openai.com/index/introducing-swe-bench-verified/

via AI Copilot - Telegram Channel
 
 
Back to Top