中国MiniMax公司发布人工智能推理模型
中国初创公司 MiniMax 发布了一款新AI推理模型,并宣称该模型超越了DeepSeek。该公司本周早些时候发布了MiniMax-M1模型,称M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外最领先的模型。MiniMax表示,M1支持目前业内最高的 100 万上下文的输入,是DeepSeek-R1的八倍。更大的输入token上限(也称为上下文窗口)使模型能够处理更长、更复杂的信息。与此同时,MiniMax表示,M1在用8万token深度推理的时候,只需要使用DeepSeek-R1约30%的算力。MiniMax表示,整个强化学习阶段用到512块英伟达H800芯片三周的时间,租赁成本为53.74万美元。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
中国初创公司 MiniMax 发布了一款新AI推理模型,并宣称该模型超越了DeepSeek。该公司本周早些时候发布了MiniMax-M1模型,称M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外最领先的模型。MiniMax表示,M1支持目前业内最高的 100 万上下文的输入,是DeepSeek-R1的八倍。更大的输入token上限(也称为上下文窗口)使模型能够处理更长、更复杂的信息。与此同时,MiniMax表示,M1在用8万token深度推理的时候,只需要使用DeepSeek-R1约30%的算力。MiniMax表示,整个强化学习阶段用到512块英伟达H800芯片三周的时间,租赁成本为53.74万美元。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel