DeepSeek-V4 来了:1.6T 参数、百万上下文

AI快讯8小时前更新 LHNav
5 0 0

等了大半年,春节没等到,清明没等到,结果人家挑了个普通周五的上午,悄没声儿地把 DeepSeekV4 放出来了。

没有预热直播,没有 roadmap 大饼,甚至发布前都没回应过外界”是不是跳票了””是不是被 Claude 蒸馏搞定了”的传言。就四个字:率道而行。

1

建议阅读公众号原文(更好体验)

两个版本,一个顶配一个走量

V4 这次一口气上了两个型号:

Pro 对标的是闭源顶级,Flash 主打性价比——同样的百万上下文,更小的参数量,调用价格更便宜。

有意思的是,两个版本都同时支持非思考模式思考模式,思考模式下还能用 reasoning_effort 调强度,分 high 和 max 两档。官方原话:复杂 Agent 场景,直接上 max。

模型调用与参数调整方法请参考 API 文档:

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode


性能到底怎么样?

官方给了三条核心判断:

Agent 能力大幅提升。 Agentic Coding 评测中,V4-Pro 已经是当前开源最强。内部测评说得更直白——员工写代码的体验已经优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。当然,跟 Opus 4.6 开思考比还是有差距,人家也没吹过头。

更关键的是,V4 已经成了 DeepSeek 内部员工日常用的 Agentic Coding 模型,Claude 在公司内部已经被换掉了。

世界知识储备拉满。 测评里大幅领先其他开源模型,只比 Gemini-Pro-3.1 稍弱一点。

推理性能世界第一梯队。 数学、STEM、竞赛级代码,V4-Pro 超过所有已公开评测的开源模型,比肩顶级闭源。

Flash 版本在简单 Agent 任务上跟 Pro 差不多,但高难度任务还是有差距。有意思的是,在”绝望的父亲”这个经典红绿色盲遗传学推理场景里,V4 也没能一轮就抓到关键点——看来再强的模型,有时候也会漏掉常识。


百万上下文,从”王牌”变成了”水电煤”

一年前,100 万上下文还是 Gemini 独家的杀手锏,其他闭源模型最多 128K 或 200K,开源这边几乎没人碰得起这个量级。

现在 DeepSeek 直接把百万上下文变成了标配,所有官方服务默认支持,而且开源。

怎么做到的?发布稿里写了答案——

V4 搞了一套全新的注意力机制,在 token 维度做压缩,再结合 DSA 稀疏注意力一起用。结果就是计算量和显存需求大幅降低。具体来说,跟 V3 比,推理 FLOPs 降了 73%,KV 缓存减少了 90%。

回头看半年前的 V3.2-Exp,当时引入了 DSA 但跑分跟 V3.1-Terminus 差不多,大家觉得就是个中间过渡版本。现在才明白,那是在给 V4 打地基。


Agent 专项优化

V4 对 Claude Code、OpenClaw、OpenCode、CodeBuddy 这些主流 Agent 产品做了适配优化,代码任务和文档生成任务都有明显提升。发布稿甚至还附了一张 V4-Pro 在某个 Agent 框架下自动生成的 PPT 内页。


API 怎么用?

两个版本同步上线,支持 OpenAI ChatCompletions 接口和 Anthropic 接口两套。

用法很简单:

  • base_url 不变
  • model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash

不过有个重要提醒:旧模型名要下架了deepseek-chat 和 deepseek-reasoner 会在三个月后(2026 年 7 月 24 日)停用。目前这两个名字分别指向 V4-Flash 的非思考和思考模式。个人开发者改个参数就行,但对接了生产环境的公司,这三个月内得完成迁移。


国产算力,尘埃落定

大家一直关心的”到底用没用国产芯片”,答案来了——下半年批量上华为算力。

昇腾 CANN 已经安排直播首发 DeepSeek-V4 在昇腾平台的运行。寒武纪那边也完成了 vLLM 推理框架对两个版本的 Day 0 适配,代码直接开源到 GitHub。

从训练到推理,国产算力的拼图正在收紧。


一句话总结发布

发布稿最后,DeepSeek 引了荀子《非十二子》里的一句话:

「不诱于誉,不恐于诽,率道而行,端然正己。」

不被赞誉诱惑,不被非议吓退,按自己的路走,做好自己的事。

这话放在今天特别应景——半年多的传言、猜测、催更,他们一句话没回。然后在一个周五上午,开源链接、技术报告、官网更新、App 上线、API 同步,一次性全给了。

不讲故事,只给东西。


资源汇总

  • 开源地址:https://huggingface.co/collections/deepseek-ai/deepseek-v4
  • 魔搭镜像:https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
  • 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

你觉得 V4 这次够不够格叫”开源新王”?评论区聊聊 👇

🎯 往期推荐👇

© 版权声明

相关文章

暂无评论

none
暂无评论...