🚀 DeepSeek-V4 预览版正式上线并开源!欢迎来到具有成本效益的 1M 上下文长度时代。
🔹 DeepSeek-V4-Pro: 1.6T 总参数 / 49B 激活参数。性能可与世界顶级闭源模型媲美。 🔹 DeepSeek-V4-Flash: 284B 总参数 / 13B 激活参数。您快速、高效、经济的选择。
立即通过专家模式 / 即时模式在 chat.deepseek.com 体验。API 已更新,今日可用!
📄 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
🤗 开源权重:https://huggingface.co/collections/deepseek-ai/deepseek-v4
DeepSeek-V4-Pro
🔹 增强的智能体能力: 在智能体编码基准测试中取得开源 SOTA。 🔹 丰富的世界知识: 领先于所有当前开源模型,仅次于 Gemini-3.1-Pro。 🔹 世界级推理能力: 在数学/STEM/编码方面击败所有当前开源模型,可与顶级闭源模型媲美。
DeepSeek-V4-Flash
🔹 推理能力接近 V4-Pro。 🔹 在简单智能体任务上的表现与 V4-Pro 相当。 🔹 参数规模更小,响应速度更快,API 定价极具成本效益。
结构创新与超高上下文效率
🔹 新型注意力机制: Token 级压缩 + DSA(DeepSeek 稀疏注意力)。 🔹 极致效率: 世界领先的长上下文能力,大幅降低计算和内存成本。 🔹 1M 标准: 1M 上下文现在是所有 DeepSeek 官方服务的默认配置。
智能体能力的专门优化
🔹 DeepSeek-V4 与 Claude Code、OpenClaw 和 OpenCode 等领先 AI 智能体无缝集成。 🔹 已经在 DeepSeek 内部驱动我们的智能体编码工作。
下图展示了由 DeepSeek-V4-Pro 生成的示例 PDF。
API 今日可用!
🔹 保持 base_url 不变,只需将模型更新为 deepseek-v4-pro 或 deepseek-v4-flash。 🔹 支持 OpenAI ChatCompletions 和 Anthropic API。 🔹 两个模型都支持 1M 上下文和双模式(思考 / 非思考):https://api-docs.deepseek.com/guides/thinking_mode
⚠️ 注意:deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日 15:59(UTC 时间)后完全退役并无法访问。(目前分别路由到 deepseek-v4-flash 非思考/思考模式)
🔹 在最近的关注中,快速提醒一下:请仅依赖我们的官方账号获取 DeepSeek 新闻。其他渠道的声明不代表我们的观点。 🔹 感谢您的持续信任。我们将继续坚持长期主义,稳步迈向 AGI 的最终目标。