-
智谱发布GLM-4.6,联手寒武纪,摩尔线程推出模型芯片一体解决方案
9月30日,国产大模型“六小龙”之一的智谱发布GLM-4.6新模型。
作为GLM系列最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面能力有所提升。
官方信息显示,此次升级表现在公开基准与真实编程任务中,GLM-4.6代码能力对齐Claude Sonnet 4;上下文窗口由128K提升至200K,适应更长的代码和智能体任务;新模型提升推理能力,并支持在推理过程中调用工具;搜索方面增强模型的工具调用和搜索智能体。
另外,“模芯联动”是此次新模型发布的重点,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这也是行业首次在国产芯片上投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,降低推理成本,为国产芯片在大模型本地化运行上探索可行路径。
FP8是8位浮点数(Floating-Point 8)数据类型,动态范围广、精度损失小;Int4是4 位整数(Integer 4)数据类型,压缩比极高,内存占用最少,适配低算力硬件但精度损失相对明显。此次尝试的“FP8+Int4 混合” 模式,并非简单将两种格式叠加,而是根据大模型的“模块功能差异”,针对性分配量化格式,让该省内存的地方用Int4压到极致,该保精度的地方用FP8守住底线,实现合理资源分配。
具体到模型适配过程中,占总内存的60%-80%的大模型核心参数通过Int4量化后,可将权重体积直接压缩为FP16的1/4,大幅降低芯片显存的占用压力;推理环节积累的临时对话数据可以通过Int4压缩内存的同时,将精度损失控制在 “轻微”范围。而FP8可重点针对模型中“数值敏感、影响推理准确性”的模块,降低精度损失、保留精细语义信息。
除了寒武纪,摩尔线程已基于vLLM推理框架完成对GLM-4.6 的适配,新一代GPU可在原生FP8精度下稳定运行模型,验证MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势。
寒武纪与摩尔线程此番完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的 AI 技术生态。接下来,GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 陈济深 
-
触底反弹,耐克进一步开启复苏之路
2025-10-01 09:15 -
宇树科技上市关键期遭遇专利诉讼,一审判其未侵权
2025-09-30 18:55 观网财经-科创 -
印奇的智驾千里路:浪漫可以,但别浪
2025-09-30 17:39 产经 人物·专题 -
“国产伟哥”和王老吉都救不了场?白云山7.5亿另寻“新欢”
2025-09-30 17:29 观网财经-健康 -
步入AI中场,京东要做能为产业创造价值的AI
2025-09-30 16:42 观网财经-互联网 -
孟晚舟当值华为轮值董事长
2025-09-30 16:24 观网财经-科创 -
米连科技光鲜IPO下的投诉困局
2025-09-30 16:02 观网财经-互联网 -
小米回购超50万股,卢伟冰称新旗舰有信心比上代卖更多
2025-09-30 16:00 观网财经-科创 -
3元1GB的中国移动流量钱包将停止运营
2025-09-30 14:32 产经 科创 -
新世界发展亏损同比扩大38%,郑志刚出局后已另起炉灶
2025-09-30 14:21 产经 A股/港股/美股 -
泡泡玛特“星星人”再掀抢购潮,但“Labubu3.0”部分款式跌破原价
2025-09-30 14:12 观网财经-消费 -
DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配
2025-09-30 14:09 产经 科创 -
9月制造业PMI为49.8%,连续两月回升
2025-09-30 10:27 中国经济 -
国内首款载客eVTOL正式下线
2025-09-29 20:31 观网财经-科创 -
余承东增任华为IRB主任,核心任务“打赢AI关键战役”
2025-09-29 20:26 观网财经-科创 -
两个月翻倍,余承东:鸿蒙5终端设备数突破2000万
2025-09-29 19:12 产经 科创 -
工信部向中国移动颁发卫星移动通信业务经营许可
2025-09-29 19:07 产经 科创 -
DeepSeek-V3.2-Exp官宣发布,性能更强,API价格腰斩
2025-09-29 17:47 观网财经-互联网 -
“大就是好”,但技术男阿里云并不执著“上头条”
2025-09-29 17:41 产经 价值研究院 -
中国家电协会:杜绝无序低价竞争,坚决不搞低于成本价倾销
2025-09-29 17:34 观网财经-消费
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 20
日本开发稀土担心中国干扰?日防相放话 评论 115
“美欧抢矿,遭殃的却是他们” 评论 13
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 70
时代变了,“欧洲人迫切想要中国技术” 评论 204最新闻 Hot-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-
“特朗普高兴太早咯,中国把枪放进枪套,但枪还在手上”
-
又出狂言,“加墨不能成为中国出口中心…”
-
“美欧抢矿,遭殃的却是他们”
-
“今年就当广告时间,等英国接任后我们再回归”
-
美国又开炮欧盟:你们在“霸凌”美国军工!
-
“不要惊醒‘美洲豹’”
-
土耳其急了:别碰能源设施!
-
时代变了,“欧洲人迫切想要中国技术”
-
“原来特朗普对中国做这么多”,某些美国鹰派急眼了
-
17年来最低,“好感急剧恶化”
-
韩国入境系统标示“中国台湾”,民进党当局破防
-
“在美欧闻了一鼻子尾气,才反应过来:中国早没这味了”
-
中企在非遭800亿美元天价索赔,BBC老毛病又犯了
-
俄乌冲突后普京首次来访,印“外交钢丝”还能走多久?
-

观察员
上海市互联网违法与不良信息举报中心