-
中国团队连获国际大奖,“有助于对抗美国芯片禁令”
【文/观察者网 熊超然】上个月,全球计算机存储领域的顶级学术会议——第23届USENIX文件与存储技术会议(USENIX Conference on File and Storage Technologies,简称FAST),在美国加利福尼亚州圣克拉拉举行。
本届大会上,来自中国的人工智能(AI)初创公司月之暗面(Moonshot AI)和清华大学团队合作发表论文并在其中提出一个名为Mooncake的系统,因而获得埃里克·里德尔最佳论文奖(Erik Riedel Best Paper Award)。
香港《南华早报》3月14日报道认为,Mooncake这一款大语言模型系统的效率比之前的基准提高了五倍,从而帮助降低了对计算资源的需求。在美国长期就中国获取先进AI芯片进行围堵打压的背景下,这一成果还有助于对抗美国芯片禁令、减少对英伟达等企业出产的图形处理单元(GPU)的依赖。
而在本月,无问芯穹(Infinigence AI)和上海交通大学、清华大学共同提出的视频生成大模型推理IP工作——FlightVGM,也在国际顶级会议上获奖。他们首次在可重构逻辑集成电路(FPGA)上实现了视频生成模型(VGMs)的高效推理,在美国半导体公司AMD广泛可用的V80 FPGA芯片上,该系统在性能上提升了30%,能效比英伟达旗舰产品RTX 3090 GPU高出4.5倍。
《南华早报》称,中国AI科研团队用工业芯片取代英伟达高端GPU而获全球大奖,这预示着全球优化AI硬件的竞赛也出现了重大转变。
埃里克·里德尔最佳论文奖 清华大学网站新闻图
据报道,这篇获奖论文由清华大学计算机系教师章明星、武永卫、郑纬民团队和月之暗面公司合作发表,名为“以键值缓存为中心的以存换算大语言模型推理架构”(Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot)。论文的第一作者为计算机系博士生秦若愚,导师为助理教授章明星。
根据清华大学方面的介绍,该论文提出的系统Mooncake,是月之暗面推出的大语言模型服务Kimi的底层推理服务平台。Mooncake采用了一种以键值缓存(KVCache)为中心的分离架构,不仅将预填充和解码集群分离,还高效利用了推理集群中未充分利用的CPU、DRAM、SSD和NIC资源,构建了一个独立的KVCache缓存池。其核心创新在于以KVCache为中心的全局缓存和调度器,旨在严格延迟相关服务级别目标(SLOs)下最大化吞吐量。
实验结果显示,Mooncake在处理长上下文输入的场景中表现出色。在使用真实数据进行的测试中,与基线方法相比,Mooncake在符合SLOs的情况下,将有效请求处理能力提升了59%至498%。目前,Mooncake已在数千个节点上运行,每日处理超过1000亿个token。在实际部署中,Mooncake的创新架构使Kimi在NVIDIA A800和H800集群上分别比以前的系统多处理115%和107%的请求。
《南华早报》指出,一段时间以来,美国政府已对向中国出口先进AI芯片实施了一系列限制措施,包括对英伟达高端芯片的多项禁令。
英伟达的AI芯片在全球范围内广泛部署。 《华尔街日报》
早在2022年10月,美国政府就已实施了一系列AI芯片出口限制措施,英伟达由于无法向中国市场提供A100和H100这两款AI处理器,专门为中国市场特供符合美方规定的A800和H800芯片,以绕开美国政府的管制。
2023年10月,美国商务部又发布了一系列新的芯片出口限制,扩大了对高级AI芯片的定义,并对运往40多个国家的芯片产品提出额外的许可要求,以避免转售给中国。这一新的限制措施出台,意味着A800和H800芯片也被列入禁售名单。
美方想方设法围堵打压,就是意图限制中国在AI领域的计算能力,进而压制AI模型的训练和开发。然而,这些限制反而促使中方研究人员和企业寻求通过软件优化和创新数据结构来挖掘现有芯片潜力的方法。
据报道,清华大学MADSys实验室已在软件源代码托管服务平台GitHub上启动了Mooncake项目,旨在加速该技术的采用和传播。与此同时,该项目已被包括阿里巴巴和蚂蚁集团在内的多家公司内部采用,并已融入开源社区。
- 责任编辑: 熊超然 
-
“不及中国1/200!”美国卷不动,日韩很兴奋
2025-03-14 22:28 观察者头条 -
重大战果:2255人被押解回国
2025-03-14 22:24 打击网络诈骗 -
特朗普:我跟普京聊过了,要他饶乌军一命
2025-03-14 22:09 应对特朗普冲击波 -
“美国拒绝了:还得改”
2025-03-14 21:41 乌克兰之殇 -
升级!俄夺回三座城镇,乌称击退22次进攻
2025-03-14 21:12 乌克兰之殇 -
“中方应该会欢迎?”
2025-03-14 21:05 中美关系 -
关税狂飙美股跳水,“特朗普衰退”真要来了?
2025-03-14 18:37 特朗普 -
“同意但有条件”,普京声明全文:感谢中印巴西南非
2025-03-14 18:05 乌克兰之殇 -
普京提议与特朗普会谈,中方表态
2025-03-14 16:19 乌克兰之殇 -
就伊朗核问题,王毅提出五点主张
2025-03-14 16:04 伊朗局势 -
美国肉商出口资质快到期了:很急,但中国没回
2025-03-14 16:03 应对特朗普冲击波 -
赤裸裸的权钱交易?特朗普家族被曝和币安谈入股
2025-03-14 15:47 -
特朗普:有计划与金正恩重建关系
2025-03-14 15:17 -
不装了!OpenAI上书特朗普:要对中国AI下死手
2025-03-14 14:20 人工智能 -
美国诺奖得主急了:搅吧搅吧!最后连高端制药都得从中国买了
2025-03-14 14:12 应对特朗普冲击波 -
-
伊朗核问题中俄伊北京会晤:三方强调终止所有非法单边制裁的必要性
2025-03-14 13:53 -
北京会晤举行,中俄伊交换意见
2025-03-14 11:57 中国外交 -
日本男女在长城上做不雅行为,被驱逐出境!
2025-03-14 11:44 中日关系 -
欧盟外长又来:美欧互咬,中国在笑
2025-03-14 11:43 观察者头条
相关推荐 -
“重大转变”,加总理直说了:中国确实比美国更可靠 评论 61
转折点到了,卡尼想要的经贸多元化,“中国是关键” 评论 66
欧洲派兵1+2+13… 白宫:呵,已阅 评论 266
明抢!美商务部长:台湾四成半导体供应链搬到美国 评论 231最新闻 Hot-
“重大转变”,加总理直说了:中国确实比美国更可靠
-
美国这般羞辱,台当局竟吹成“漂亮全垒打”
-
转折点到了,卡尼想要的经贸多元化,“中国是关键”
-
日媒参观“特朗普走廊”,阿塞拜疆:运的都中国货
-
是否用武力对抗中国?他全场闪躲,就是不答
-
最后一刻叫停打伊朗,详情披露:以色列也来劝…
-
不装了,“台湾必须哄我们的总统高兴,懂吧”
-
“中国第一,美国紧随其后”
-
欧洲悄悄讨论反击:切断合作、收回美军基地
-
先是格陵兰,然后是冰岛?
-
“38万亿美元的美债,迟早会反噬”
-
欧洲派兵1+2+13… 白宫:呵,已阅
-
贝森特“敲打”韩国:韩元不对劲
-
贺娇龙母校发文悼念
-
1人、2人、13人...德国还在吹:北约能扛得住中俄
-
普京也察觉,“世界太危险了”
-

观察员


上海市互联网违法与不良信息举报中心