-
DeepSeek“偷偷”发布新版本,最新测评来了
-
张广凯13764468101
(文/张广凯 编辑/吕栋)
昨晚,DeepSeek 以非常低调的方式,带来了最新版本的大模型 V3-0324。
没有官方新闻稿,没有技术报告,甚至在Hugging Face上传的最初文件中,连README文档都是空的,看上去,这只是V3模型的一次版本升级。
不过由于DeepSeek自带的极高话题性,这次版本升级还是引发了大量讨论和测评,并且果然没有令人失望——很多专业人士都指出,V3-0324模型在编程能力上有了显著提升。
在大模型编程能力测试Aider LLM中,V3-0324的多语言基准测试得分为55%,相较于此前版本不到50%的水平有明显进步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以编程见长的Claude 3.7 sonnet。
考虑到V3-0324并非推理模型,能够在编程能力上接近R1,算得上是自身短板的精准补强。
另一位博主Xeophon自建的测试集上,V3-0324在综合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通义的qwq-32b则都是推理模型。
知名的大模型竞技场Chatbot Arena也已经开始将V3-0324纳入测试,但还具体成绩还要等待几天时间。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1则排在第6位。
随着今年以来OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升级,再加上Grok、Claude和Gemini等模型的持续迭代,外界对于DeepSeek何时能够再次升级也有了更高期待。
此前路透社消息称,DeepSeek下一代推理模型R2可能会比预期的5月更早发布。
考虑到DeepSeek R1是以V3作为基础模型训练而来,此次V3-0324的亮相,或许也意味着R2愈发临近了。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 张广凯 
-
腾讯等巨头携手入股智元机器人
2025-03-25 13:29 观网财经-科创 -
消息称京东入局具身智能赛道
2025-03-25 13:28 观网财经-科创 -
原华为副总裁担任智元机器人董事长兼CEO
2025-03-25 12:36 观网财经-科创 -
蔡崇信:企业家信心明显增强,阿里巴巴将重启招聘
2025-03-25 11:05 观网财经-互联网 -
上海发布2025重点产业布局图
2025-03-25 10:31 观网财经-宏观 -
“让机器服务于人,而不是人为机器服务”
2025-03-25 09:29 观网财经-科创 -
茶咖日报|茉莉奶白被曝喝出完整塑料袋,官方回应:已闭店
2025-03-24 21:00 观网财经-消费 -
讯飞星火之后,蚂蚁用国产芯片训练出2900亿参数大模型
2025-03-24 18:42 观网财经-科创 -
京东外卖上线40天,日订单首破百万
2025-03-24 18:12 观网财经-互联网 -
宣布斥资15亿布局香港后,京东要把家电价格打到全港最低
2025-03-24 18:12 观网财经-互联网 -
2元一根的妙可蓝多奶酪,去年又挣了1.13亿
2025-03-24 17:34 观网财经-消费 -
途虎养车全网首发德国马牌ExtremeContact XC7全新轮胎产品线
2025-03-24 17:26 -
控量挺价成效待考,舍得酒业2024年净利骤降80%
2025-03-24 17:25 观网财经-消费 -
教培跑路频发,美团这招行不行?
2025-03-24 17:24 观网财经-消费 -
2024年中国财政政策执行情况报告发布
2025-03-24 16:23 -
TCL实业卢春水:掌握上游技术,才是全球竞争的核心驱动力
2025-03-24 15:30 观网财经-科创 -
五大芯片巨头来华参会,高通三星高管到访小米汽车工厂
2025-03-24 11:44 观网财经-科创 -
中科院专家:RISC-V开辟中国芯片自主新赛道,还需攻克“三座大山”
2025-03-23 16:07 观网财经-科创 -
丝芙兰迷失在中国,全球CEO紧急“救火”
2025-03-23 09:39 观网财经-消费 -
华为杨超斌:已有超80家伙伴基于昇腾打造大模型一体机
2025-03-22 21:40 观网财经-科创
相关推荐 -
-
美国可以靠AI打破中国稀土主导权?“极不现实” 评论 40
俩人要对伊朗使坏,涉及中国 评论 87
“Ni hao,我们现在都是中国人了” 评论 94
鲁比奥:不与中国对话,是失职 评论 107
欧洲“长舒了一口气”,其实鲁比奥是换汤不换药 评论 38最新闻 Hot-
美国可以靠AI打破中国稀土主导权?“极不现实”
-
希拉里回应:太可怕了,但…
-
俩人要对伊朗使坏,涉及中国
-
“对于中国游戏未来的20年,我充满信心”
-
英法德等称俄用“箭毒蛙毒素”毒死纳瓦利内,俄方:无稽之谈
-
“福特找白宫:拉中企来美国合资造车吧”
-
“Ni hao,我们现在都是中国人了”
-
欧洲“长舒了一口气”,其实鲁比奥是换汤不换药
-
又戴高帽,“中国一个电话就能搞定”
-
有人不爽了:绥靖!特朗普上赶着为中国效力
-
秘鲁拒绝美国忽悠:主权绝未受中资威胁
-
鲁比奥:不与中国对话,是失职
-
“美国总是要求乌克兰作出让步,而不是俄罗斯”
-
“一次又一次,欧洲领导人视而不见,但这次不一样”
-
卡拉斯接过了这顶帽子,表情微妙
-
爱泼斯坦烂账上还有这位西方“人权先生”
-

观察员
上海市互联网违法与不良信息举报中心