↩️🖼 Meta高管否认Llama 4分数造假 Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言，称其“根本不属实”

↩️🖼 Meta高管否认Llama 4分数造假 Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言，称其“根本不属实”。他明确指...

科技圈🎗在花频道📮:

Meta新AI模型“Maverick”涉嫌优化“作弊”，引发业内质疑 Meta近日发布的新旗舰AI模型“Maverick”在LM Arena排行榜上名列第二，但研究人员指出，该测试版本与开发者可用的公开版本存在明显差异。 Meta承认，参与测试的是“针对对话优化”的实验性版本。研究者发现，LM Arena上的Maverick回答更冗长，使用大量表情符号，而公开版本则表现平平。此举引发业内对AI公司是否应为排行榜优化模型的争议。过度定制测试版本可能误导开发者，破坏评测公正性。Meta与LM Arena官方目前尚未回应相关质疑。…

Meta高管否认Llama 4分数造假

Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言，称其“根本不属实”。他明确指出，公司并未在测试集上训练模型以抬高分数。

该传言源自社交媒体，声称Meta人为提高了Llama 4 Maverick和Scout模型的基准测试结果。有报告称这些模型在某些任务上表现不佳，以及Meta使用未发布版本在LM Arena获得高分，助长了此猜测。

Meta高管承认，不同云服务商托管的模型质量存在差异，表示模型刚发布，需要几天时间进行调整。公司将继续修复错误并与合作伙伴协作。

TechCrunch

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel