-
DeepSeek“偷偷”发布新版本,最新测评来了
-
张广凯13764468101
(文/张广凯 编辑/吕栋)
昨晚,DeepSeek 以非常低调的方式,带来了最新版本的大模型 V3-0324。
没有官方新闻稿,没有技术报告,甚至在Hugging Face上传的最初文件中,连README文档都是空的,看上去,这只是V3模型的一次版本升级。
不过由于DeepSeek自带的极高话题性,这次版本升级还是引发了大量讨论和测评,并且果然没有令人失望——很多专业人士都指出,V3-0324模型在编程能力上有了显著提升。
在大模型编程能力测试Aider LLM中,V3-0324的多语言基准测试得分为55%,相较于此前版本不到50%的水平有明显进步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以编程见长的Claude 3.7 sonnet。
考虑到V3-0324并非推理模型,能够在编程能力上接近R1,算得上是自身短板的精准补强。
另一位博主Xeophon自建的测试集上,V3-0324在综合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通义的qwq-32b则都是推理模型。
知名的大模型竞技场Chatbot Arena也已经开始将V3-0324纳入测试,但还具体成绩还要等待几天时间。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1则排在第6位。
随着今年以来OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升级,再加上Grok、Claude和Gemini等模型的持续迭代,外界对于DeepSeek何时能够再次升级也有了更高期待。
此前路透社消息称,DeepSeek下一代推理模型R2可能会比预期的5月更早发布。
考虑到DeepSeek R1是以V3作为基础模型训练而来,此次V3-0324的亮相,或许也意味着R2愈发临近了。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 张广凯 
-
腾讯等巨头携手入股智元机器人
2025-03-25 13:29 观网财经-科创 -
消息称京东入局具身智能赛道
2025-03-25 13:28 观网财经-科创 -
原华为副总裁担任智元机器人董事长兼CEO
2025-03-25 12:36 观网财经-科创 -
蔡崇信:企业家信心明显增强,阿里巴巴将重启招聘
2025-03-25 11:05 观网财经-互联网 -
上海发布2025重点产业布局图
2025-03-25 10:31 观网财经-宏观 -
“让机器服务于人,而不是人为机器服务”
2025-03-25 09:29 观网财经-科创 -
茶咖日报|茉莉奶白被曝喝出完整塑料袋,官方回应:已闭店
2025-03-24 21:00 观网财经-消费 -
讯飞星火之后,蚂蚁用国产芯片训练出2900亿参数大模型
2025-03-24 18:42 观网财经-科创 -
京东外卖上线40天,日订单首破百万
2025-03-24 18:12 观网财经-互联网 -
宣布斥资15亿布局香港后,京东要把家电价格打到全港最低
2025-03-24 18:12 观网财经-互联网 -
2元一根的妙可蓝多奶酪,去年又挣了1.13亿
2025-03-24 17:34 观网财经-消费 -
途虎养车全网首发德国马牌ExtremeContact XC7全新轮胎产品线
2025-03-24 17:26 -
控量挺价成效待考,舍得酒业2024年净利骤降80%
2025-03-24 17:25 观网财经-消费 -
教培跑路频发,美团这招行不行?
2025-03-24 17:24 观网财经-消费 -
2024年中国财政政策执行情况报告发布
2025-03-24 16:23 -
TCL实业卢春水:掌握上游技术,才是全球竞争的核心驱动力
2025-03-24 15:30 观网财经-科创 -
五大芯片巨头来华参会,高通三星高管到访小米汽车工厂
2025-03-24 11:44 观网财经-科创 -
中科院专家:RISC-V开辟中国芯片自主新赛道,还需攻克“三座大山”
2025-03-23 16:07 观网财经-科创 -
丝芙兰迷失在中国,全球CEO紧急“救火”
2025-03-23 09:39 观网财经-消费 -
华为杨超斌:已有超80家伙伴基于昇腾打造大模型一体机
2025-03-22 21:40 观网财经-科创
相关推荐 -
-
欧洲不吃香了,“投资流向中国” 评论 19
英国想当“AI超级大国”,结果卡在这儿了... 评论 76
见欧洲政客“醒了”,北约秘书长赶紧灌“迷魂汤” 评论 97
打不过中欧,日企放弃开发了 评论 128最新闻 Hot-
“我只是在中国读博,回澳大利亚就被骂是间谍”
-
英国想当“AI超级大国”,结果卡在这儿了...
-
“俄美议员将举行会谈”,首先要谈的是这个
-
美乌领导人会晤前夕,基辅遭俄空袭导致大面积停暖停电
-
“西方某些势力借机从台湾的资金与技术中牟利”,拉夫罗夫点名美国
-
见欧洲政客“醒了”,北约秘书长赶紧灌“迷魂汤”
-
中立国也掺和?“瑞士仅三分之一士兵装备齐全,必须增加军费”
-
打不过中欧,日企放弃开发了
-
暴雪袭击美国东北部,1500架次航班被取消
-
“以色列完全无视国际法,全力支持索马里主权”
-
“这个南太岛国,成为中美矿产竞争新焦点”
-
美媒也坐不住了:“斩杀线”存在,且仍在被抬高
-
特朗普急了:明年关键问题是物价,关乎美国成败
-
尼日利亚人懵了:为什么要轰炸这里?
-
他自顾不暇还搞事,“对高市言论印象深刻”
-
央行重磅报告:9省份辖内无“红区”银行
-

观察员

上海市互联网违法与不良信息举报中心