DeepSeek V4 预览版发布 - DeepSeek

🚀 DeepSeek-V4 预览版正式上线并开源！欢迎来到具有成本效益的 1M 上下文长度时代。

🔹 DeepSeek-V4-Pro： 1.6T 总参数 / 49B 激活参数。性能可与世界顶级闭源模型媲美。 🔹 DeepSeek-V4-Flash： 284B 总参数 / 13B 激活参数。您快速、高效、经济的选择。

立即通过专家模式 / 即时模式在 chat.deepseek.com 体验。API 已更新，今日可用！

📄 技术报告：https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

🤗 开源权重：https://huggingface.co/collections/deepseek-ai/deepseek-v4

DeepSeek-V4-Pro

🔹 增强的智能体能力： 在智能体编码基准测试中取得开源 SOTA。 🔹 丰富的世界知识： 领先于所有当前开源模型，仅次于 Gemini-3.1-Pro。 🔹 世界级推理能力： 在数学/STEM/编码方面击败所有当前开源模型，可与顶级闭源模型媲美。

DeepSeek-V4-Flash

🔹 推理能力接近 V4-Pro。 🔹 在简单智能体任务上的表现与 V4-Pro 相当。 🔹 参数规模更小，响应速度更快，API 定价极具成本效益。

结构创新与超高上下文效率

🔹 新型注意力机制： Token 级压缩 + DSA（DeepSeek 稀疏注意力）。 🔹 极致效率： 世界领先的长上下文能力，大幅降低计算和内存成本。 🔹 1M 标准： 1M 上下文现在是所有 DeepSeek 官方服务的默认配置。

智能体能力的专门优化

🔹 DeepSeek-V4 与 Claude Code、OpenClaw 和 OpenCode 等领先 AI 智能体无缝集成。 🔹 已经在 DeepSeek 内部驱动我们的智能体编码工作。

下图展示了由 DeepSeek-V4-Pro 生成的示例 PDF。

API 今日可用！

🔹 保持 base_url 不变，只需将模型更新为 deepseek-v4-pro 或 deepseek-v4-flash。 🔹 支持 OpenAI ChatCompletions 和 Anthropic API。 🔹 两个模型都支持 1M 上下文和双模式（思考 / 非思考）：https://api-docs.deepseek.com/guides/thinking_mode

⚠️ 注意：deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日 15:59（UTC 时间）后完全退役并无法访问。（目前分别路由到 deepseek-v4-flash 非思考/思考模式）

🔹 在最近的关注中，快速提醒一下：请仅依赖我们的官方账号获取 DeepSeek 新闻。其他渠道的声明不代表我们的观点。 🔹 感谢您的持续信任。我们将继续坚持长期主义，稳步迈向 AGI 的最终目标。