根据 DeepSeek 的微信公告,更新后的 R1 版本采用宽松的 MIT 许可证,这意味着它可以用于商业用途,这是一个“小”升级。Hugging Face 代码库不包含该模型的描述,只有配置文件和权重,即指导模型行为的内部组件。升级版 R1 的参数量高达 6850 亿,规模相当庞大,如果不进行修改,该模型很可能无法在消费级硬件上运行。今年早些时候,DeepSeek发布 R1 模型后声名鹊起,其模型与 OpenAI 的模型形成了鲜明对比。但这家初创公司也引发了美国一些监管机构的关注,他们认为 DeepSeek 的技术构成了国家安全风险。相关文章:DeepSeek R1模型已完成小版本试升级 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1502960.htm
手机版:https://m.cnbeta.com.tw/view/1502960.htm
cnBeta.COM
DeepSeek更新其R1推理AI模型 并在Hugging Face上发布
中国AI初创公司DeepSeek于周三上午通过微信宣布,其在开发者平台HuggingFace上发布了其R1推理AI模型的更新版本。
via cnBeta.COM中文业界资讯站 - Telegram Channel