-
DeepSeek-R1模型震惊硅谷,美媒:制裁反而促进中国创新
最后更新: 2025-01-27 15:17:04【文/观察者网 陈思佳】这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果引发全球科技行业高度关注,西方媒体也发文感叹“中国AI模型震惊硅谷”。
最新消息显示,DeepSeek已经登顶了中国和美国的苹果App Store应用商店,排名第一,将ChatGPT一举超越。对于一款中国大模型来说,能够在美国力压ChatGPT,是绝无仅有的历史性一刻。
据美国《华尔街日报》当地时间1月26日报道,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,从业者纷纷称赞深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美国试图通过制裁限制中国的AI发展,但资源的限制反而激发了中国科研人员的创造力。
深度求索在1月20日发布了DeepSeek-R1模型,该公司表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。
为促进技术社区的充分交流与创新协作,深度求索还公开了DeepSeek-R1训练技术。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比较 DeepSeek微信公众号
一些第三方测试结果也显示,DeepSeek-R1的表现足以匹敌美国顶尖AI模型。美国加州大学伯克利分校研究人员设立的聊天机器人竞技场(Chatbot Arena)平台上,DeepSeek-R1和去年12月发布的DeepSeek-V3的性能表现均位列前十。
不仅如此,DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。美媒指出,H800的算力要弱于英伟达H100等芯片,美国限制对华出口此类高性能芯片。
《华尔街日报》提到,作为对比,美国AI企业、Claude模型开发商Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)去年曾透露,该公司构建模型的成本约为1亿至10亿美元。
与其他一些顶尖大模型不同,DeepSeek-R1没有使用传统的监督微调(SFT)方法,而是专注于强化学习(RL),这意味着该模型跳过了使用人工标准数据训练的“模仿”环节。
英伟达高级研究科学家范麟熙(Jim Fan)称赞DeepSeek取得了突破,他在社交平台X上发文称,DeepSeek-R1完全由强化学习驱动,“这让人想起了AlphaZero,从零开始学习围棋、将棋和国际象棋,而不是先模仿人类大师的动作。这是论文中最重要的收获。”
DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一。”
旧金山AI硬件公司Positron的联合创始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在讨论DeepSeek的开源模型,“这太酷了。”
一些美国企业也开始在工作中使用DeepSeek。硅谷一家创业公司的联合创始人安东尼·普奥(Anthony Poo)告诉《华尔街日报》,他们原先使用Claude模型预测财务回报,但现在已转向DeepSeek,两者性能相似,使用DeepSeek的成本仅为Claude的四分之一。
普奥说:“OpenAI的模型有着极佳的性能,但我们不想为我们不需要的能力付费。”
截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT。而就在昨天早上,DeepSeek还没有挤进榜单前五,显示出过去24小时发酵速度之快。在国区苹果App Store免费榜,DeepSeek也已登顶。
DeepSeek已在苹果App Store国区和美区免费榜登顶
近年来,美国在芯片等领域对中国实施出口限制,试图打压中国在AI等领域的发展,但深度求索依然能构建出匹敌美国顶尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美国的限制未能阻止DeepSeek的进步,“这凸显了一个深刻的教训:资源限制反而能激发创造力。”
数字新闻杂志The Wire China发文称,DeepSeek-R1的发布将迫使怀疑论者重新评估中国的技术发展。深度求索对开源承诺的坚持也与OpenAI的专有策略形成鲜明对比,深度求索允许全球企业和开发者共同开发和改进技术,OpenAI则限制对其系统的访问以维护竞争优势。
该杂志指出,美国决策者应该反思,通过设置障碍来确保领先地位的方法是否还行得通。美国的出口管制促使中国加速实现技术的自给自足,中美在芯片等领域的技术差距正逐渐缩小,美国的制裁虽然具有破坏性,却可能反过来助推中国的创新能力。
文章写道,美国的出口管制不仅削弱了美国科技公司的收入,也导致全球半导体供应链变得愈发“支离破碎”,“美国越是专注于遏制对手而不解决自身的缺陷,就越有可能加速其领先地位的丧失。”
本文系观察者网独家稿件,未经授权,不得转载。
标签 人工智能- 责任编辑: 陈思佳 
-
加拿大媒体炮轰:我们都快被特朗普蛐蛐死了,你人呢?
2025-01-27 14:51 应对特朗普冲击波 -
-
“我永远不会反华,美国收买不了我”
2025-01-27 14:11 中国外交 -
“伊朗还盯着呢!怎么能把他们安保撤了?”
2025-01-27 12:17 应对特朗普冲击波 -
他又挑拨!越南总理表态
2025-01-27 11:49 南海局势 -
济州航空空难初步调查报告公布:撞机4分钟前黑匣子停止记录
2025-01-27 11:46 三八线之南 -
丹麦被贴脸开大:笑死,多搞几条狗,你也好意思…
2025-01-27 11:08 应对特朗普冲击波 -
“美中如果有更多的双赢元素,那就太好了”
2025-01-27 10:50 中美关系 -
芝加哥、亚特兰大、洛杉矶……美国开始非法移民大抓捕
2025-01-27 10:31 美国政治 -
军机遣返移民被拒后,特朗普加税25%!哥伦比亚硬刚
2025-01-27 10:11 应对特朗普冲击波 -
中萨(摩亚)政府签署互免签证协定
2025-01-27 10:01 -
巴勒斯坦、约旦、埃及全都反对!哈马斯回怼
2025-01-27 08:43 巴以恩仇录 -
白宫:黎以停火协议延长至2月18日
2025-01-27 08:20 -
官宣!卢卡申科胜选
2025-01-27 08:00 -
马斯克提议:将“英吉利海峡”更名为“乔治·华盛顿海峡”
2025-01-27 07:43 应对特朗普冲击波 -
美新任防长与以总理通话:美国将与以色列站在一起
2025-01-27 07:33 巴以恩仇录 -
伊朗“加沙”重型无人机首次亮相
2025-01-27 07:05 伊朗局势 -
拉脱维亚与瑞典的一条水下光缆遭到损坏
2025-01-27 07:05 欧洲乱局 -
卢卡申科将赢得白俄大选:出口民调87.6%
2025-01-27 07:05 -
李强同外国专家举行新春座谈会
2025-01-27 07:05
相关推荐 -
东南亚多国表态,“缅甸措辞最严,坚定站队中方” 评论 28
呵呵,“‘民主国家’看不上中国技术”? 评论 276
普京访印:美国都在买,印度凭啥不能买? 评论 84
日本开发稀土担心中国干扰?日防相放话 评论 136
“美欧抢矿,遭殃的却是他们” 评论 16最新闻 Hot-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
呵呵,“‘民主国家’看不上中国技术”?
-
普京访印:美国都在买,印度凭啥不能买?
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
“华德858”轮触礁断裂
-
机密通话曝光!“美国恐将背叛,你要小心”
-
“云冈石窟大佛冻得流鼻涕”,官方:将暂时封闭、处置渗水
-
“高市早苗更加不安了”
-
高善文离职后,又有分析师集体出走国投证券
-
台军又出意外,这次是炮弹砸了民宅
-
“中产、富裕阶层也去1元店”,特朗普还嘴硬
-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-

观察员

上海市互联网违法与不良信息举报中心