↩️ Meta新AI模型“Maverick”涉嫌优化“作弊”,引发业内质疑 Meta近日发布的新旗舰AI模型“Maverick”在LM Arena排行榜上名列第二,但研究人员指出,该测试版...
Meta新AI模型“Maverick”涉嫌优化“作弊”,引发业内质疑
Meta近日发布的新旗舰AI模型“Maverick”在LM Arena排行榜上名列第二,但研究人员指出,该测试版本与开发者可用的公开版本存在明显差异。
Meta承认,参与测试的是“针对对话优化”的实验性版本。研究者发现,LM Arena上的Maverick回答更冗长,使用大量表情符号,而公开版本则表现平平。此举引发业内对AI公司是否应为排行榜优化模型的争议。过度定制测试版本可能误导开发者,破坏评测公正性。Meta与LM Arena官方目前尚未回应相关质疑。
TechCrunch
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
Meta发布新一代AI模型Llama 4 Meta发布最新大语言模型Llama 4,包括Scout和Maverick两个版本。该多模态系统能处理并整合文本、视频、图像和音频等多种数据类型,Meta称其为"迄今最先进的模型"和"多模态领域同类最佳"。 Llama 4 Scout拥有17B活跃参数和16个专家系统,支持业界领先的1000万token上下文窗口;而Maverick版本配备128个专家系统,在图像理解能力上表现卓越。两款模型将采用开源方式发布,性能分别超越Gemini 2.0和GPT-4o等竞品。…
Meta新AI模型“Maverick”涉嫌优化“作弊”,引发业内质疑
Meta近日发布的新旗舰AI模型“Maverick”在LM Arena排行榜上名列第二,但研究人员指出,该测试版本与开发者可用的公开版本存在明显差异。
Meta承认,参与测试的是“针对对话优化”的实验性版本。研究者发现,LM Arena上的Maverick回答更冗长,使用大量表情符号,而公开版本则表现平平。此举引发业内对AI公司是否应为排行榜优化模型的争议。过度定制测试版本可能误导开发者,破坏评测公正性。Meta与LM Arena官方目前尚未回应相关质疑。
TechCrunch
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel