-
DeepSeek“偷偷”发布新版本,最新测评来了
-
张广凯13764468101
(文/张广凯 编辑/吕栋)
昨晚,DeepSeek 以非常低调的方式,带来了最新版本的大模型 V3-0324。
没有官方新闻稿,没有技术报告,甚至在Hugging Face上传的最初文件中,连README文档都是空的,看上去,这只是V3模型的一次版本升级。
不过由于DeepSeek自带的极高话题性,这次版本升级还是引发了大量讨论和测评,并且果然没有令人失望——很多专业人士都指出,V3-0324模型在编程能力上有了显著提升。
在大模型编程能力测试Aider LLM中,V3-0324的多语言基准测试得分为55%,相较于此前版本不到50%的水平有明显进步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以编程见长的Claude 3.7 sonnet。
考虑到V3-0324并非推理模型,能够在编程能力上接近R1,算得上是自身短板的精准补强。
另一位博主Xeophon自建的测试集上,V3-0324在综合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通义的qwq-32b则都是推理模型。
知名的大模型竞技场Chatbot Arena也已经开始将V3-0324纳入测试,但还具体成绩还要等待几天时间。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1则排在第6位。
随着今年以来OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升级,再加上Grok、Claude和Gemini等模型的持续迭代,外界对于DeepSeek何时能够再次升级也有了更高期待。
此前路透社消息称,DeepSeek下一代推理模型R2可能会比预期的5月更早发布。
考虑到DeepSeek R1是以V3作为基础模型训练而来,此次V3-0324的亮相,或许也意味着R2愈发临近了。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 张广凯 
-
腾讯等巨头携手入股智元机器人
2025-03-25 13:29 观网财经-科创 -
消息称京东入局具身智能赛道
2025-03-25 13:28 观网财经-科创 -
原华为副总裁担任智元机器人董事长兼CEO
2025-03-25 12:36 观网财经-科创 -
蔡崇信:企业家信心明显增强,阿里巴巴将重启招聘
2025-03-25 11:05 观网财经-互联网 -
上海发布2025重点产业布局图
2025-03-25 10:31 观网财经-宏观 -
“让机器服务于人,而不是人为机器服务”
2025-03-25 09:29 观网财经-科创 -
茶咖日报|茉莉奶白被曝喝出完整塑料袋,官方回应:已闭店
2025-03-24 21:00 观网财经-消费 -
讯飞星火之后,蚂蚁用国产芯片训练出2900亿参数大模型
2025-03-24 18:42 观网财经-科创 -
京东外卖上线40天,日订单首破百万
2025-03-24 18:12 观网财经-互联网 -
宣布斥资15亿布局香港后,京东要把家电价格打到全港最低
2025-03-24 18:12 观网财经-互联网 -
2元一根的妙可蓝多奶酪,去年又挣了1.13亿
2025-03-24 17:34 观网财经-消费 -
途虎养车全网首发德国马牌ExtremeContact XC7全新轮胎产品线
2025-03-24 17:26 -
控量挺价成效待考,舍得酒业2024年净利骤降80%
2025-03-24 17:25 观网财经-消费 -
教培跑路频发,美团这招行不行?
2025-03-24 17:24 观网财经-消费 -
2024年中国财政政策执行情况报告发布
2025-03-24 16:23 -
TCL实业卢春水:掌握上游技术,才是全球竞争的核心驱动力
2025-03-24 15:30 观网财经-科创 -
五大芯片巨头来华参会,高通三星高管到访小米汽车工厂
2025-03-24 11:44 观网财经-科创 -
中科院专家:RISC-V开辟中国芯片自主新赛道,还需攻克“三座大山”
2025-03-23 16:07 观网财经-科创 -
丝芙兰迷失在中国,全球CEO紧急“救火”
2025-03-23 09:39 观网财经-消费 -
华为杨超斌:已有超80家伙伴基于昇腾打造大模型一体机
2025-03-22 21:40 观网财经-科创
相关推荐 -
-
“轻松的一天”,随行高管们非常期待… 评论 15
东南亚多国表态,“缅甸措辞最严,坚定站队中方” 评论 131
呵呵,“‘民主国家’看不上中国技术”? 评论 313
普京访印:美国都在买,印度凭啥不能买? 评论 90
日本开发稀土担心中国干扰?日防相放话 评论 138最新闻 Hot-
“轻松的一天”,随行高管们非常期待…
-
“特朗普对高市早苗措辞非常严厉,甚至还说了……”
-
扎心了!美新版国安战略,辣评欧洲
-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
打造美版深圳!他给特朗普画饼,被曝“近乎科幻”
-
无视美国,莫迪宣布:印俄已同意…
-
“二次打击”还没解释清,美军袭击又致4死
-
欧盟,“罚酒三杯”?
-
呵呵,“‘民主国家’看不上中国技术”?
-
普京访印:美国都在买,印度凭啥不能买?
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
“华德858”轮触礁断裂
-
机密通话曝光!“美国恐将背叛,你要小心”
-

观察员
上海市互联网违法与不良信息举报中心