万亿参数大杀器！DeepSeek V4 细节曝光：100 万上下文 + 原生多模态随着发布预期的临近，国产 AI 领军者 DeepSeek V4 的更多技术细节浮出水面

万亿参数大杀器！DeepSeek V4 细节曝光：100 万上下文 + 原生多模态

随着发布预期的临近，国产 AI 领军者 DeepSeek V4 的更多技术细节浮出水面。据知名爆料方 Legit 披露，DeepSeek 已开始对其代号为「sealion-lite（海狮轻量版）」的 V4 预览版本进行闭门内测，相关参与方均签署了严苛的保密协议。

相较于现有的 V3 模型，DeepSeek V4 将实现跨代际的跨越。新模型不仅原生具备多模态处理能力，更将上下文窗口直接拉升至 100 万 token。这意味着它能一次性“吞下”数本书籍或超长代码库，并进行深度逻辑推理。早期的测试反馈显示，V4 在生成复杂 SVG 矢量图形等高难度任务上效果惊艳，性能显著优于目前网页端及 App 端的在线模型。

AIbase 了解到，DeepSeek V4 预计将是一款万亿参数级别的巨型基础模型。正是由于模型规模的指数级增长导致训练周期拉长，其发布时间较原计划有所延后。值得关注的是，DeepSeek 在发布前打破了行业惯例，并未向英伟达、AMD 等美系芯片商提供预览，而是选择提前数周向包括华为在内的中国芯片供应商开放访问权限，以确保模型在国产算力平台上完成深度适配与优化。

与此同时，DeepSeek 的 GitHub 仓库近期也出现了密集更新。虽然多为工程师节后的例行代码整理，但也包含了大量与 API 集成相关的企业级解决方案。随着“下周发布”的传闻愈演愈烈，全球开发者都在屏息以待，看这家以“高性价比、高性能”著称的中国公司，将如何通过 DeepSeek V4 再次冲击全球 AI 竞争格局。

概要：

● 🚀 参数规模飞跃：DeepSeek V4 定位万亿参数级模型，支持百万级长文本输入，原生多模态能力将带来更强的逻辑与创作表现。
● 🇨🇳 国产算力优先：公司转而优先适配华为等中国芯片供应商，旨在降低对外部供应链依赖，并针对国产硬件进行深度性能调优。
● 🗓️ 发布进入倒计时：轻量版内测已低调开启，外媒预测最快将于下周官宣，这一动作已引发全球 AI 社区及资本市场的高度警觉。

via AI新闻资讯 (author: AI Base)