-
DeepSeek-V3.2-Exp官宣发布,性能更强,API价格腰斩
最后更新: 2025-09-29 18:35:55
9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。
DeepSeek在官方微信号介绍表示,该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。
目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。
最新核心技术突破:DeepSeek Sparse Attention(DSA)
DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
为了严谨地评估引入稀疏注意力带来的影响,DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。有效性得到了初步验证。
API成本将腰斩
随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源,相关论文也已同步公开。
作为一款实验性版本,DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比,DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口,且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。
此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 陈济深 
-
“大就是好”,但技术男阿里云并不执著“上头条”
2025-09-29 17:41 产经 价值研究院 -
中国家电协会:杜绝无序低价竞争,坚决不搞低于成本价倾销
2025-09-29 17:34 观网财经-消费 -
养生壶爆炸致一岁孩子烫伤,小熊电器回应
2025-09-29 17:13 观网财经-消费 -
天猫超市全面启动双11:打通近场闪购,推进“最快4小时达”
2025-09-29 12:38 观网财经-互联网 -
曹冬接任京东健康CEO
2025-09-29 12:02 观网财经-健康 -
王健林“限高”已取消
2025-09-29 09:12 -
“空间智能将像云计算一样,成为人类与物理世界交互的标配”
2025-09-29 08:43 观网财经-互联网 -
拼多多在香港推行免费送货上门
2025-09-28 20:03 观网财经-互联网 -
粽子也要出海?五芳斋寻求港股上市,A股市值已缩水三成
2025-09-28 19:14 观网财经-消费 -
小红书正式发布“小红卡”:入驻门店统一打9折,仍在探索期
2025-09-28 18:07 观网财经-互联网 -
超越迪士尼和万代,泡泡玛特玩具收入跃居全球第二
2025-09-28 18:03 观网财经-消费 -
万辰集团在港交所IPO,量贩零食两巨头谁先“抢滩”H股?
2025-09-28 17:40 产经 IPO/创投 -
王健林被限高,知情人士这么说
2025-09-28 15:47 观网财经-房产 -
一斤蟹半斤绳?大闸蟹产业打响“去水分”之战
2025-09-28 15:16 观网财经-消费 -
重大突破!突破1万公里!
2025-09-28 14:46 能源战略 -
四川一网红直播驾驶轻型直升机坠机身亡
2025-09-28 12:14 产经 热点关注 -
开源鸿蒙迎大版本更新,余承东发声
2025-09-27 20:51 观网财经-科创 -
首届“新浪新闻·热浪之夜”收官:跨界思想交锋,共赴热爱与未来
2025-09-27 15:56 -
太初元碁参与超节点智算应用“北京方案”,全国产技术加速“人工智能+”落地
2025-09-27 11:07 观网财经-科创 -
从硬件到生态的战略升维:中科曙光引领构建“人工智能+”算力基石
2025-09-27 11:05 观网财经-科创
相关推荐 -
强拆巴拿马华人纪念碑,原来她蓄谋已久? 评论 1
拖太久!“内塔尼亚胡不断搞破坏”,美国没耐心了 评论 17
岛内热议解放军“突袭式”演习,台当局还在嘴硬 评论 58
美报告承认:检查了92台中国起重机,安全得很 评论 106
专家解读:开局即开打,在台岛“生死线”关门打狗 评论 125最新闻 Hot-
拖太久!“内塔尼亚胡不断搞破坏”,美国没耐心了
-
强拆巴拿马华人纪念碑,原来她蓄谋已久?
-
将是5年多来首次,泽连斯基与普京能否通话?
-
财务“救命稻草”?英伟达购入英特尔50亿美元股份
-
泽连斯基:目前只有15年,希望有50年的…
-
岛内热议解放军“突袭式”演习,台当局还在嘴硬
-
欧媒幻想:新一轮登月竞赛,德国人有没有可能先登月?
-
美报告承认:检查了92台中国起重机,安全得很
-
德国又焦虑上了:兹事体大,中国…
-
“中国电网是AI的重要助力,而英国60年了都没升级”
-
专家解读:开局即开打,在台岛“生死线”关门打狗
-
“非常软弱,太软弱了,得站起来”
-
中方严厉表态,巴拿马总统发声:野蛮行径不可原谅
-
我驻巴拿马使馆:极度震惊、强烈愤慨和坚决反对
-
和泽连斯基会面前,特朗普给普京打了个电话,细节曝光
-
“伊朗正与美欧、以色列打一场全面战争”
-

观察员
上海市互联网违法与不良信息举报中心