万亿参数大杀器!DeepSeek V4 细节曝光:100 万上下文 + 原生多模态

随着发布预期的临近,国产 AI 领军者 DeepSeek V4 的更多技术细节浮出水面。据知名爆料方 Legit 披露,DeepSeek 已开始对其代号为「sealion-lite(海狮轻量版)」的 V4 预览版本进行闭门内测,相关参与方均签署了严苛的保密协议。

相较于现有的 V3 模型,DeepSeek V4 将实现跨代际的跨越。新模型不仅原生具备多模态处理能力,更将上下文窗口直接拉升至 100 万 token。这意味着它能一次性“吞下”数本书籍或超长代码库,并进行深度逻辑推理。早期的测试反馈显示,V4 在生成复杂 SVG 矢量图形等高难度任务上效果惊艳,性能显著优于目前网页端及 App 端的在线模型。

AIbase 了解到,DeepSeek V4 预计将是一款万亿参数级别的巨型基础模型。正是由于模型规模的指数级增长导致训练周期拉长,其发布时间较原计划有所延后。值得关注的是,DeepSeek 在发布前打破了行业惯例,并未向英伟达、AMD 等美系芯片商提供预览,而是选择提前数周向包括华为在内的中国芯片供应商开放访问权限,以确保模型在国产算力平台上完成深度适配与优化。

与此同时,DeepSeek 的 GitHub 仓库近期也出现了密集更新。虽然多为工程师节后的例行代码整理,但也包含了大量与 API 集成相关的企业级解决方案。随着“下周发布”的传闻愈演愈烈,全球开发者都在屏息以待,看这家以“高性价比、高性能”著称的中国公司,将如何通过 DeepSeek V4 再次冲击全球 AI 竞争格局。

概要:

🚀 参数规模飞跃:DeepSeek V4 定位万亿参数级模型,支持百万级长文本输入,原生多模态能力将带来更强的逻辑与创作表现。
🇨🇳 国产算力优先:公司转而优先适配华为等中国芯片供应商,旨在降低对外部供应链依赖,并针对国产硬件进行深度性能调优。
🗓️ 发布进入倒计时:轻量版内测已低调开启,外媒预测最快将于下周官宣,这一动作已引发全球 AI 社区及资本市场的高度警觉。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]