-
心智观察所:掀开DeepSeek-V4的技术账本
不过,报告也坦诚地呈现了差距所在。在SimpleQA等知识密集型任务上,V4-Pro-Max的57.9%仍然落后于Gemini-3.1-Pro的75.6%;在长上下文检索(MRCR)上,V4-Pro也落后于Claude Opus 4.6(如下图)。这些差距的存在反而增加了报告的可信度。
V4在后训练阶段做了一个颇具魄力的方法论切换:完全放弃了传统的混合强化学习阶段,转而采用在策略蒸馏(On-Policy Distillation,简称OPD)作为整合多领域能力的核心手段。
具体做法是,先为数学、代码、Agent、指令遵循等各个垂直领域独立训练专家模型,每个专家都经过SFT加强化学习的完整流程,在各自领域达到最优水平。然后,用十余个专家作为教师模型,通过逆KL散度的全词表蒸馏,把所有专家的能力统一灌注到一个学生模型中。
相比传统的多任务混合RL,OPD的优势在于梯度方差更低、训练更稳定,且避免了不同领域的奖励信号相互干扰。这个方法论的深层含义可能比表面看到的更大:未来的顶级通用模型,或许不再是一锅炖出来的,而是先分头修炼再合体的产物。
CUDA之外的第二条路
心智观察所还发现,MegaMoE内核已在英伟达 GPU和华为昇腾NPU两个平台上完成验证。这一表述并非随意带过,它代表着DeepSeek在底层算力上主动构建双轨适配能力的战略选择。在英伟达GPU出口管制持续收紧的背景下,对昇腾生态的深度适配具有明确的风险对冲意义。
在CUDA生态的适配层面,DeepSeek选择了一条颇有远见的技术路线。他们引入了自研的领域特定语言TileLang来开发核心算子。TileLang的设计哲学是在开发效率和运行性能之间找到平衡,同时通过在IR层面生成设备内核和宿主启动器,在一定程度上解耦了算子实现与具体硬件后端。这意味着同一套算子逻辑可以相对容易地迁移到不同的计算平台上。
更深层的信号在于,DeepSeek正在系统性地降低对英伟达专有软件栈的依赖。以DeepGEMM替代cuBLAS进行矩阵乘法,以TileLang构建自主可控的算子开发管线,以精细的通信计算重叠设计降低对特定互连带宽的硬性需求。这套组合拳为未来向国产算力平台的大规模迁移做了扎实的软件侧准备。
当然,我们也要看到,目前的大规模训练验证仍以英伟达架构为主,真正向昇腾或寒武纪的全面迁移在工程层面仍有相当的挑战。但方向是明确的,基础是在打的。在芯片受限的大背景下,软件层面的自主可控能力建设,可能比很多人想象的更加重要。
结语
DeepSeek选择在这个时间点发布V4,背后有清晰的技术逻辑和竞争逻辑。
从技术积累看,V4并非凭空而来。CSA和HCA的核心压缩思路在V3系列的MLA机制中已有铺垫,mHC来自已有外部论文验证的研究成果,Muon优化器也在学术界得到了充分讨论。V4的工作在于将这些独立验证的创新整合进一个统一框架,并完成百万token规模的工程化落地。这种系统集成能力本身就是极高的技术壁垒。
从竞争格局看,2026年中的闭源阵营已经相当拥挤:GPT-5.4在推理任务上表现强劲,Gemini-3.1-Pro在知识密度上领先,Claude Opus 4.6在长上下文检索和复杂指令遵循上占优。V4的突破在于,它以开源形式、更低的推理成本,在编程竞技、Agent任务、企业级应用等多个关键维度上实现了与闭源巨头的对齐甚至超越。这种性价比优势对商业部署决策的影响,远比单一榜单排名更具实际意义。
还有一个容易被忽略的维度:V4的百万token上下文能力,本质上是在为下一阶段的测试时扩展(test-time scaling)铺路。当推理链条可以延伸到数十万甚至上百万token时,模型在单次推理中能完成的任务复杂度将发生质变。这或许才是DeepSeek真正在下的那盘大棋。
这份技术报告有一条清晰的主线贯穿所有技术决策:在参数规模竞赛逐渐饱和的今天,效率才是决定下一代AI格局的核心变量。
DeepSeek-V4并非在所有维度上都做到了最优,这一点报告本身也坦然承认。但它用一套开源、高效、可落地的方案,把百万token级别的上下文处理从昂贵的闭源特权变成了人人可用的基础设施。它代表的不仅是一个模型的进步,更是整个开源AI生态向效率优先范式转型的信号。
对于开发者、企业用户和整个AI行业来说,这个信号很明确:谁能用更少的算力做更多的事,谁就能在下一轮竞争中占据先机。效率正在成为新的规模。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
标签 心智观察所- 原标题:掀开DeepSeek-V4的技术账本 本文仅代表作者个人观点。
- 责任编辑: 周天 
-
颜宁院士:说这话的人多崇洋媚外啊
2026-04-27 08:10 -
我国成功发射一颗巴基斯坦卫星
2026-04-25 22:07 巴铁 -
2名巴基斯坦航天员已进入中国航天员科研训练中心
2026-04-24 16:19 航空航天 -
首次,我国科学家手搓“类球状闪电”!
2026-04-16 21:50 科技前沿 -
轻舟试验飞船已在轨完成多项关键技术验证
2026-04-15 17:08 航空航天 -
中国团队重要突破!将为芯片技术自主可控提供关键材料
2026-04-09 11:20 科技前沿 -
打破国外垄断,又一国产设备“弯道超车”
2026-04-09 09:05 -
我国科学家重要突破:两种全新常压镍基超导材料问世
2026-04-09 06:31 科技前沿 -
“人类从另一侧凝望”,阿尔忒弥斯2号发布月球“地落”照
2026-04-08 11:39 航空航天 -
美“阿耳忒弥斯2号”打破人类距离地球最远飞行纪录
2026-04-07 06:50 航空航天 -
全球首次实现!我国钠离子电池取得重大突破
2026-04-06 22:05 科技前沿 -
阿尔忒弥斯宇航员的太空首日:把厕所修好了
2026-04-03 08:50 航空航天 -
沙特能源企业家:发达国家是问题制造者,中国则推广技术
2026-03-30 17:46 能源战略 -
首次实现!中国攻克液氢燃料航空涡轮动力关键技术
2026-03-30 08:46 中国精造 -
重器越天堑!世界最大直径高铁盾构机“领航号”成功“上岸”
2026-03-29 18:09 中国精造 -
肿瘤治疗利器!我国首次实现医用级阿尔法同位素居里级量产
2026-03-28 15:12 科技前沿 -
我国成功发射四维高景二号05、06星
2026-03-26 08:58 航空航天 -
十破世界纪录!新型薄膜光伏领域获重要突破
2026-03-25 15:06 科技前沿 -
2025年度“中国科学十大进展”发布
2026-03-25 11:06 科技前沿 -
亚洲AI,已形成三个梯队
2026-03-24 18:24 博鳌论坛
相关推荐 -
“不认中国临床数据,行不通的” 评论 7
“下一个要退的是哈萨克斯坦?” 评论 42
航油告急,全球慌神!中国科学家提出解决方案 评论 192
“挡不住!中国车兵临美墨边境,美国车企夜不能寐” 评论 117
美国向联合国开条件:要我的,就不能要中国的 评论 235最新闻 Hot-
英国唱反调:不认中国临床数据,行不通的
-
“日本站错队了,应该联中抗美”
-
“若罪名成立,终身不得参政”
-
“下一个要退的是哈萨克斯坦?”
-
又一非洲国家拒绝美国
-
不到一年,她撂挑子不干了
-
日企又演上了,“买太多中国货救急,不安”
-
特朗普发了张图,威胁伊朗“放聪明点”
-
竞争不过又丢脸到别国,“无力阻止中企中标欧盟资助项目”
-
新西兰要立“慰安妇”雕像,被日本拦下
-
航油告急,全球慌神!中国科学家提出解决方案
-
英王调侃特朗普:早在1814年,我们就曾尝试对白宫搞“房产改造”
-
“尬出天际”,特朗普当着英国国王面开和梅拉尼娅的夫妻玩笑
-
欧盟又内讧,最高贸易官员不干了
-
申请全被否,不让斯洛伐克总理飞去莫斯科
-
美共和党高层罕见唱反调:1.5万亿,说说看怎么花?
-

观察员
上海市互联网违法与不良信息举报中心