-
“如果DeepSeek靠蒸馏为啥要怕?”“不,中国是迭代者”
-
杨蓉yangrong@guancha.cn
在他看来,中国确实尚未在科学突破方面超越美国,如率先推出mRNA疫苗、ChatGPT、iPhone等,“但中国所做的是,通过其强大的制造实力,在这些创新的基础上进行迭代,使其产品更好、更快、更便宜,而这一过程正通过DeepSeek-R1展现在我们眼前”。
戴维·林本月早些时候接受新加坡《海峡时报》采访时也表示,中美在AI发展上“已经处于并驾齐驱的状态”。他坦言:“如果你在三个月前问我,我还会说我们稳稳领先,但形势变得非常迅速。”
他6日在听证会上进一步强调,DeepSeek公开表示其目标是努力实现通用人工智能(AGI),这一愿景表明了中国“在AI领域的雄心壮志”。AGI是指具备像人类一样的智能水平,能够理解、学习、适应、推理,并在不同领域自主执行任务的AI系统,通常也被视为AI发展的终极形态。
戴维·林指出,如今这场AI技术竞赛实质上是全球科技主导权之争。“这是一个关于争夺先发优势的问题,第一个实现AGI的人将在全球经济、政治及能源供应链方面带来深远的下游影响。”
戴维·林在听证会上发言
今年1月,DeepSeek发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国OpenAI开发的GPT-o1的性能。这一进展破解了全球AI产业长期以来“堆算力”的路径依赖,其影响波及资本市场。OpenAI随后公开指控DeepSeek通过“蒸馏”技术“违规复制”其产品功能。
所谓蒸馏的理论核心,就是让一个庞大且复杂的预训练AI模型充当“教师”,来训练一个较小的“学生模型”,后者从“教师模型”学习知识,以获得类似性能,但计算成本更低。不少专家表示,蒸馏在AI业内是一种常见的做法,但若涉及直接复制闭源专有模型的输出结构或参数,可能构成侵权。
前百度全球传播主管、前AI条线记者托尼·彭(Tony Peng,音)日前在其专栏梳理,“蒸馏”的具体操作方法有很多:如“监督微调”(SFT),即直接使用“教师模型”生成的输出数据来训练“学生模型”;或是“模型评分”,即让“教师模型”充当“评委”,对模型输出进行评分,并训练“学生模型”更倾向于高分回答;又或是利用“教师模型”为复杂问题生成的多步骤推理链,让“学生模型”模仿这种长链式思维(CoT)的过程。
根据DeepSeek自己发布的技术文档,其R1模型在第一阶段使用了早期模型R1-Zero的输出作为冷启动数据集,由人工标注员优化后进行训练,并在第二阶段继续通过强化学习(RL)进行优化。R1-Zero模型则完全依赖RL,未使用“微调数据集”(fine-tuning datasets)。
此外,DeepSeek去年12月发布的V3模型是使用对R1的“知识蒸馏”等提升了训练效率。技术文档称,DeepSeek-R1作为高级推理模型,其CoT能力被蒸馏到V3,从而提升V3的推理能力。
考虑到OpenAI尚未提供具体证据,其首席执行官奥尔特曼上周又称“没有计划”起诉DeepSeek,目前舆论猜测纷纷。与此同时,也有许多声音指出,OpenAI提出这一指控本身就颇为“虚伪和讽刺”。
“要知道,ChatGPT在训练过程中也使用了《福布斯》或《纽约时报》的内容,这同样违反了它们的服务条款。”康奈尔大学高级访问讲师、曾在谷歌、领英等科技公司从事AI研究的卢茨·芬格(Lutz Finger)说。
硅谷内部也有人提出反思。金沙江创业投资(GSR Ventures)合伙人、长期居住在硅谷的新加坡风险投资人戴维·尹(David Yin,音)对《海峡时报》表示,许多硅谷的AI应用公司陷入思维定势、缺乏创新,导致其盲目扩张,而不是提高效率。
“(在硅谷)当有人想给你数千亿美元时,你所想的就是雇更多人、买更多算力,建造自己的‘核电站’”。他说,“也许中国的参与者不擅长‘从零到一’的创新,但一旦他们掌握了一项技术,就会把它优化到极致,从一做到十、一百。”
本文系观察者网独家稿件,未经授权,不得转载。
标签 AI- 责任编辑: 杨蓉 
-
他又染指军事:美国将在下一场战争中惨败,除非…
2025-02-07 21:58 -
“特朗普自残,更多人会信中国了”
2025-02-07 20:01 中美关系 -
-
中方已向美方提出严正交涉
2025-02-07 18:02 中美关系 -
“噩梦已开始,女儿问我是不是诈骗…”
2025-02-07 18:01 中美关系 -
-
-
喊停又喊停,特朗普“上任N把火”处处碰壁
2025-02-07 17:46 应对特朗普冲击波 -
中印尼续签双边本币互换协议,规模为4000亿元人民币
2025-02-07 16:56 人民币国际化 -
习近平会见韩国国会议长禹元植
2025-02-07 16:31 -
中国正对苹果公司开展反垄断调查?外交部回应
2025-02-07 16:20 -
美航空专家急了:不卖中国,他回头自己造了就丸辣!
2025-02-07 16:05 中美关系 -
外交部:对巴拿马不再续签“一带一路”谅解备忘录深表遗憾
2025-02-07 16:05 -
又一起……美国阿拉斯加一飞机失联
2025-02-07 15:41 航空安全 -
马斯克挥刀,砍到伊万卡蛋糕了…
2025-02-07 14:34 -
“DeepSeek粉碎西方遏华幻想,中国正鲸吞世界”
2025-02-07 14:01 中美关系 -
不降反增!8年折腾了个寂寞…
2025-02-07 12:11 应对特朗普冲击波 -
“中美贸易摩擦,我们欧洲恐成大输家”
2025-02-07 11:32 欧洲乱局 -
他扬言:将审查中国是否遵守
2025-02-07 11:07 应对特朗普冲击波 -
联合国人权理事会:美国无法“退出”
2025-02-07 10:59 应对特朗普冲击波
相关推荐 -
-
美议员放话:要帮秘鲁从中国拿回钱凯港 评论 162
“经济狂怒”逼伊朗就范?美媒翻旧账:已多次翻车 评论 96
“与中国打交道,装腔作势的政治作秀没用” 评论 95
“摸着中国石头过河”,苏林此访能学到啥? 评论 109
“芯片又不是浓缩铀,卖给中国怎么了?” 评论 151最新闻 Hot-
意大利一伙武装劫匪抢劫银行后,从地板洞口逃离
-
传热提升80%!中国突破芯片“热墙”,或摆脱进口依赖
-
停火生效后,以色列仍继续向黎巴嫩南部开炮
-
7成美国农民买不到足够肥料了...
-
供应捉襟见肘,美国推迟交付输欧武器
-
“一层层剥开,全被中国控制,咱们找菲律宾”
-
拜登之子亨特藏身加州躲2000万债,画作曾卖50万美元如今无人问津
-
福特CEO:不像中国人那样强壮,就很难活下去
-
特朗普:如果协议达成,我可能会去伊斯兰堡
-
斯坦福报告:美国这个优势,中国要抹平了
-
奢侈品巨头:不能再把中国当垃圾桶
-
金建希拒与尹锡悦对视?律师回应:她用余光看,回看守所还哭了
-
首次,我国科学家手搓“类球状闪电”!
-
黎巴嫩“打脸”以美:我们不知道
-
中方捐赠58吨医疗物资,伊方:诚挚感谢
-
美议员自嘲:10年后,咱们就没啥技术让中国“偷”了
-

观察员
上海市互联网违法与不良信息举报中心