据Meta内部测试显示Llama 4在数学推理(GSM8K基准)和代码生成(HumanEval)准确率较Llama 3提升37%。这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100 GPU集群,能源消耗较Llama 3训练增加2.3倍。行业观察人士指出,若再度延期,Meta将错过6月开发者大会的关键展示窗口。而竞争对手Anthropic的Claude 4和谷歌Gemini 2.0已分别计划在Q3发布重大更新。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1490646.htm
手机版:https://m.cnbeta.com.tw/view/1490646.htm
cnBeta.COM
Meta新一代AI大模型Llama 4发布在即 此前两度延期 - AI 人工智能 - cnBeta.COM
据媒体周五报道,Meta有望在本月发布的新一代开源大语言模型Llama4。此前这款大语言模型的发布已至少经历两次延期,目前仍存在再度推迟可能。这距离前代模型Llama3的发布已过去近一年,凸显出Meta在AI军备竞赛中面临的技术挑战。
via cnBeta.COM中文业界资讯站 - Telegram Channel