官宣V3.1后DeepSeek最新透露:是针对即将发布的下一代国产芯片设计!
8月21日,DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里说,UE8M0FP8是针对即将发布的下一代国产芯片设计。
据DeepSeek官方公众号21日消息,DeepSeek-V3.1正式发布。本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
价格调整方面,DeepSeek表示将于北京时间2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行如下调整:执行新版价格表(如下图所示,详见定价页面);取消夜间时段优惠。
在9月6日前,所有API服务仍按原价格政策计费,可继续享受当前优惠。
每日经济新闻综合公开消息
via cnBeta.COM - 中文业界资讯站 (author: 稿源:每日经济新闻)
8月21日,DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里说,UE8M0FP8是针对即将发布的下一代国产芯片设计。
据DeepSeek官方公众号21日消息,DeepSeek-V3.1正式发布。本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
价格调整方面,DeepSeek表示将于北京时间2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行如下调整:执行新版价格表(如下图所示,详见定价页面);取消夜间时段优惠。
在9月6日前,所有API服务仍按原价格政策计费,可继续享受当前优惠。
每日经济新闻综合公开消息
via cnBeta.COM - 中文业界资讯站 (author: 稿源:每日经济新闻)