-
潘攻愚:从四个角度全面驳斥美方对DeepSeek的质疑和污蔑
二、DeepSeek隐藏了总成本(TCO)参数?
Semianalysis和Anthropic对DeepSeek总成本的推断,还涉及到除了GPU采购之外的因素,诸如优化架构、处理数据、支付员工薪资等等,而这恰恰是我们最不太需要花费心思去反驳的。
通常意义上,H100的云租赁成本不包括电力成本,在数据中心实际托管的IT设备的成本与占地面积、园区环境和政策支持密切相关。
从未到中国进行过实地调研的Semianalysis,依据美国行情判断DeepSeek的API服务成本也是欠妥当的。
美国本土的云服务和大模型部署合作也相当复杂。与OpenAI自己的API相比,更多客户选择了微软进行公共和私有实例的推理,微软当年非常聪明地用自己的云服务积分置换对OpenAI的“天使轮投资”;而亚马逊喜欢把他们的SageMaker平台说成是客户在云上创建、训练和部署模型的好工具,但自己却用英伟达的Nemo云原生框架代替Sagemaker,来开发他们的模型。
相比Semianalysis对DeepSeek R1模型通过MLA(Multi-head Latent Attention)优化KV Cache机制的分析,他们对DeepSeek托管、运维和员工薪资的分析更像是一种臆测。
三、DeepSeek赢在了营销?
相比缺乏扎实一手调研和推论依据的成本估算,更让人匪夷所思的是,无论是Semianalysis还是Dario Amodei都用了不少的篇幅阐述了DeepSeek的“营销”手段,包括但不限于R1模型在实战中会首先向用户展示推理的思路框架,以及DeepSeek R1故意把发布时间踩点特朗普就职典礼等等。Semianalysis总裁Dylan Patel在近日的视频节目中,更是指出DeepSeek的营销胜在一个“快”上,比如说半年多以前急于推出成熟度欠奉的V2模型,意在炒作。
无利不起早的海外大厂已经用实际行动反击了这种“营销”说:从1月25日到2月1日,AMD的MI300X GPU、英伟达NIM微服务、英特尔Gaudi 2D Al加速器,均纷纷表示支持和接入DeepSeek V3/RI/Janus模型。如果DeepSeek没有展示出足够的技术实力,这些大厂为何要配合DeepSeek“营销”呢?
Semianalysis可能忽视了一个事实:2022年年底OpenAI急于推出的ChatGPT就是走了先占坑位然后再调试的路线,谷歌的Bard(现在已经改名Gemini)晚了一步被OpenAI抢了先手,就在于其创始团队担忧这种聊天机器人会抢夺搜索引擎市场从而影响谷歌营收,毕竟对谷歌来说,依靠搜索引擎导入的广告收入占了大头。
这一次,OpenAI在压力之下推出了全新的免费o3-mini(有趣的是,o3也在模仿R1展示推理思维链),可见“创新者困境”的魔咒和营销无关,这是一种涌浪式的推陈出新竞争法,指责DeepSeek以快取胜是毫无道理的。
从另一个层面上看,为什么OpenAI以及Anthropic的同推理模型不展示具体的推理思路呢?展示推理链路真的是一种营销吗?
OpenAI和Anthropic冠冕堂皇的理由是优化用户体验界面,避免信息过载。但这个问题其实触及到这几家公司深层次顾虑,一方面是模型的内部工作机制(如微调策略、特定任务的优化方法)可能会让竞争对手进行逆向工程,而且保持黑盒化的推理过程也避免了外界过分渲染这些工具的黑历史——从一开始,ChatGPT就很有争议性地不断爬取《纽约时报》、《华尔街日报》等公众媒体和数据资源进行语料训练,其合规性经营一再遭受质疑,并一度走到法律诉讼层面。
由此可见,OpenAI、谷歌和Anthropic这些本来通过营销起家的AI模型公司无法效仿DeepSeek所谓的“营销大法”,非不为而实不能。
结语:模型蒸馏是DeepSeek给全人类的美好馈赠
Semianalysis总裁Dylan Patel和Anthropic 的CEO Dario Amodei对DeepSeek评述还有一个共性,就是认为R1远不如V3有趣,其主要论据是R1很可能用了模型蒸馏。
在保证模型性能与效率的同时,推动AI技术的普惠化,将其变为水和电一样的公共产品,模型数据蒸馏和用户知识蒸馏是一种必然之路,它不仅优化了资源利用,加速模型向本地部署和端侧推理迁移,对构建可持续、高效的AI生态具有重要意义。
OpenAI团队创立就是对谷歌AI商业化路线的一种逆反,奥尔特曼和马斯克当时秉承了一种为全人类寻找AGI途径的愿景才取了“OpenAI”这个名字,如今OpenAI变成“CloseAI”其实已经偏离了初心。
Dario Amodei抨击DeepSeek搞蒸馏有侵犯知识产权风险。但如前所述,这几家美国大厂都是吃到了数据时代红利,在《纽约时报》反应过来要搞法律诉讼之前先把语料数据“窃取”了过去,吃下去怎么可能再吐出来?
曾几何时,艰深晦涩的AI技术曾是学院派们的禁脔。英伟达的CUDA软件开发者系统平台,当初让先驱者们有机会在商业市场中一试身手。很快,AI的重心从斯坦福大学、多伦多大学和加州理工等转移到了初创公司中。
辛顿和李飞飞加入了谷歌,吴恩达去了百度,奥尔特曼和他闹宫斗的苏茨克维等等一起创办了OpenAI,他们一起把AI带向了公众视野。
一切的AI生产要素的流动,其实是一种人才、软硬件技术以及资本市场的变相“蒸馏”。本来就是脱胎自OpenAI的Anthropic也是用户知识蒸馏的最大受益者。
前一段时间李飞飞团队“50美元”复刻DeepSeek-R1,此举恰恰蕴藏着梁文峰们的美好愿景——推动知识与信息的平权,AI应成为造福全人类的公共产品。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
- 原标题:从四个角度全面驳斥美方对DeepSeek的质疑和污蔑 本文仅代表作者个人观点。
- 责任编辑: 李昊 
-
我国成功发射卫星互联网低轨卫星
2025-02-11 19:20 航空航天 -
蹭热度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
中国半导体产业要长远发展,这个问题必须解决好
2025-02-10 13:57 心智观察所 -
“中国物理学研究领先世界,美国机构被挤出前十”
2025-02-09 09:14 科技前沿 -
撬开日本海关的口:日本半导体设备对华依赖度有多高?
2025-02-06 08:06 心智观察所 -
中国平台,集中上线
2025-02-04 21:12 -
“人造太阳”再创纪录,是中国式科研方法论又一次胜利
2025-02-04 13:05 心智观察所 -
“大洋一号”功勋船舶将升级改造
2025-02-02 15:35 -
“霸榜全球140个市场”,拉新最多的是…
2025-02-01 22:06 观察者头条 -
突破70多年来的传统认知!他们发现距地球16万公里的“太空合声”
2025-02-01 16:53 天文 -
中国光子毫米波雷达技术取得突破性进展
2025-01-31 22:54 科技前沿 -
果然,台当局又跳了出来
2025-01-31 22:01 台湾 -
英伟达平台上线DeepSeek
2025-01-31 18:18 -
阿斯麦CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科学家又发现“超级地球”
2025-01-29 19:03 -
DeepSeek超越ChatGPT,登顶美国区免费APP榜单
2025-01-27 09:02 观网财经-科创 -
理解DeepSeek的中国式创新,要先回顾深度学习的历史
2025-01-27 08:03 心智观察所 -
探索宇宙线起源之谜再添“观天”利器
2025-01-21 20:09 天文 -
最大载重1.9吨,国产大型无人机首次实现量产交付
2025-01-20 22:12 中国精造 -
我国成功发射云遥一号37~40星等5颗卫星
2025-01-20 21:59 航空航天
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 56
日本开发稀土担心中国干扰?日防相放话 评论 127
“美欧抢矿,遭殃的却是他们” 评论 13
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 72
时代变了,“欧洲人迫切想要中国技术” 评论 205最新闻 Hot-
呵呵,“‘民主国家’看不上中国技术”?
-
普京访印:美国都在买,印度凭啥不能买?
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
“华德858”轮触礁断裂
-
机密通话曝光!“美国恐将背叛,你要小心”
-
“云冈石窟大佛冻得流鼻涕”,官方:将暂时封闭、处置渗水
-
“高市早苗更加不安了”
-
高善文离职后,又有分析师集体出走国投证券
-
台军又出意外,这次是炮弹砸了民宅
-
“中产、富裕阶层也去1元店”,特朗普还嘴硬
-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-

观察员
上海市互联网违法与不良信息举报中心