🚀 月之暗面发布万亿参数开源模型 Kimi K2,多项测试超越 GPT-4.1
北京月之暗面科技有限公司近日发布了其最新的混合专家模型 Kimi K2,该模型拥有惊人的 1 万亿总参数和 320 亿激活参数。在多项基准测试中,Kimi K2 表现出色,部分领域甚至超越了 OpenAI 的 GPT-4.1。
具体测试结果显示:
* 软件工程测试 (SWE-bench Verified): Kimi K2 的正确率达到 65.8%,优于大多数开源模型,并可与私有模型相媲美。
* 编程测试 (LiveCodeBench): Kimi K2 正确率为 53.7%,显著高于 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%。
* 数学推理测试 (MATH-500): Kimi K2 得分为 97.4%,超过了 GPT-4.1 的 92.4%。
月之暗面表示,与 OpenAI 相比,Kimi K2 的开发成本更低,且运行速度更快、价格更具竞争力。
(科技情报)
via 茶馆 - Telegram Channel
北京月之暗面科技有限公司近日发布了其最新的混合专家模型 Kimi K2,该模型拥有惊人的 1 万亿总参数和 320 亿激活参数。在多项基准测试中,Kimi K2 表现出色,部分领域甚至超越了 OpenAI 的 GPT-4.1。
具体测试结果显示:
* 软件工程测试 (SWE-bench Verified): Kimi K2 的正确率达到 65.8%,优于大多数开源模型,并可与私有模型相媲美。
* 编程测试 (LiveCodeBench): Kimi K2 正确率为 53.7%,显著高于 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%。
* 数学推理测试 (MATH-500): Kimi K2 得分为 97.4%,超过了 GPT-4.1 的 92.4%。
月之暗面表示,与 OpenAI 相比,Kimi K2 的开发成本更低,且运行速度更快、价格更具竞争力。
(科技情报)
via 茶馆 - Telegram Channel