-
DeepSeek-V3.2-Exp官宣发布,性能更强,API价格腰斩
最后更新: 2025-09-29 18:35:55
9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。
DeepSeek在官方微信号介绍表示,该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。
目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。
最新核心技术突破:DeepSeek Sparse Attention(DSA)
DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
为了严谨地评估引入稀疏注意力带来的影响,DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。有效性得到了初步验证。
API成本将腰斩
随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源,相关论文也已同步公开。
作为一款实验性版本,DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比,DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口,且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。
此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 陈济深 
-
“大就是好”,但技术男阿里云并不执著“上头条”
2025-09-29 17:41 产经 价值研究院 -
中国家电协会:杜绝无序低价竞争,坚决不搞低于成本价倾销
2025-09-29 17:34 观网财经-消费 -
养生壶爆炸致一岁孩子烫伤,小熊电器回应
2025-09-29 17:13 观网财经-消费 -
天猫超市全面启动双11:打通近场闪购,推进“最快4小时达”
2025-09-29 12:38 观网财经-互联网 -
曹冬接任京东健康CEO
2025-09-29 12:02 观网财经-健康 -
王健林“限高”已取消
2025-09-29 09:12 -
“空间智能将像云计算一样,成为人类与物理世界交互的标配”
2025-09-29 08:43 观网财经-互联网 -
拼多多在香港推行免费送货上门
2025-09-28 20:03 观网财经-互联网 -
粽子也要出海?五芳斋寻求港股上市,A股市值已缩水三成
2025-09-28 19:14 观网财经-消费 -
小红书正式发布“小红卡”:入驻门店统一打9折,仍在探索期
2025-09-28 18:07 观网财经-互联网 -
超越迪士尼和万代,泡泡玛特玩具收入跃居全球第二
2025-09-28 18:03 观网财经-消费 -
万辰集团在港交所IPO,量贩零食两巨头谁先“抢滩”H股?
2025-09-28 17:40 产经 IPO/创投 -
王健林被限高,知情人士这么说
2025-09-28 15:47 观网财经-房产 -
一斤蟹半斤绳?大闸蟹产业打响“去水分”之战
2025-09-28 15:16 观网财经-消费 -
重大突破!突破1万公里!
2025-09-28 14:46 能源战略 -
四川一网红直播驾驶轻型直升机坠机身亡
2025-09-28 12:14 产经 热点关注 -
开源鸿蒙迎大版本更新,余承东发声
2025-09-27 20:51 观网财经-科创 -
首届“新浪新闻·热浪之夜”收官:跨界思想交锋,共赴热爱与未来
2025-09-27 15:56 -
太初元碁参与超节点智算应用“北京方案”,全国产技术加速“人工智能+”落地
2025-09-27 11:07 观网财经-科创 -
从硬件到生态的战略升维:中科曙光引领构建“人工智能+”算力基石
2025-09-27 11:05 观网财经-科创
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 1
日本开发稀土担心中国干扰?日防相放话 评论 96
“美欧抢矿,遭殃的却是他们” 评论 10
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 68
时代变了,“欧洲人迫切想要中国技术” 评论 202最新闻 Hot-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-
“特朗普高兴太早咯,中国把枪放进枪套,但枪还在手上”
-
又出狂言,“加墨不能成为中国出口中心…”
-
“美欧抢矿,遭殃的却是他们”
-
“今年就当广告时间,等英国接任后我们再回归”
-
美国又开炮欧盟:你们在“霸凌”美国军工!
-
“不要惊醒‘美洲豹’”
-
土耳其急了:别碰能源设施!
-
时代变了,“欧洲人迫切想要中国技术”
-
“原来特朗普对中国做这么多”,某些美国鹰派急眼了
-
17年来最低,“好感急剧恶化”
-
韩国入境系统标示“中国台湾”,民进党当局破防
-
“在美欧闻了一鼻子尾气,才反应过来:中国早没这味了”
-
中企在非遭800亿美元天价索赔,BBC老毛病又犯了
-
俄乌冲突后普京首次来访,印“外交钢丝”还能走多久?
-

观察员
上海市互联网违法与不良信息举报中心