↩️🖼 Meta高管否认Llama 4分数造假 Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言,称其“根本不属实”。他明确指...


科技圈🎗在花频道📮:

Meta新AI模型“Maverick”涉嫌优化“作弊”,引发业内质疑 Meta近日发布的新旗舰AI模型“Maverick”在LM Arena排行榜上名列第二,但研究人员指出,该测试版本与开发者可用的公开版本存在明显差异。 Meta承认,参与测试的是“针对对话优化”的实验性版本。研究者发现,LM Arena上的Maverick回答更冗长,使用大量表情符号,而公开版本则表现平平。此举引发业内对AI公司是否应为排行榜优化模型的争议。过度定制测试版本可能误导开发者,破坏评测公正性。Meta与LM Arena官方目前尚未回应相关质疑。…

Meta高管否认Llama 4分数造假

Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言,称其“根本不属实”。他明确指出,公司并未在测试集上训练模型以抬高分数。

该传言源自社交媒体,声称Meta人为提高了Llama 4 Maverick和Scout模型的基准测试结果。有报告称这些模型在某些任务上表现不佳,以及Meta使用未发布版本在LM Arena获得高分,助长了此猜测。

Meta高管承认,不同云服务商托管的模型质量存在差异,表示模型刚发布,需要几天时间进行调整。公司将继续修复错误并与合作伙伴协作。

TechCrunch

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]