-
华为周跃峰:大模型时代,数据存储成为关键基础设施
“大模型时代,数据决定AI智能的高度。作为数据的载体,数据存储成为AI大模型的关键基础设施。”7月14日,华为数据存储产品线总裁周跃峰在发布会上说道。
当天,华为发布大模型时代AI存储新品,为基础模型训练、行业模型训练,细分场景模型训练推理提供存储最优解,释放AI新动能。
周跃峰告诉观察者网等媒体,现在AI大模型非常热门,但企业实施AI大模型的过程是一个复杂的系统过程,会面临很多挑战。具体来讲,企业在开发及实施大模型应用过程中,面临四大挑战:
首先,数据准备时间长,数据来源分散,归集慢,预处理百TB数据需10天左右;其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s,训练集加载效率低;第三,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,需要Checkpoint机制恢复训练,故障恢复耗时超过一天;最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%。
华为数据存储产品线总裁 周跃峰
周跃峰认为,目前大模型算力成本约占整个成本的25%,而数据清洗、预处理等工作,在不算数据存储硬件的情况下,占到成本的22%。从这个角度看,数据机器存储过程,在大模型时代越来越重要。这不仅仅是简单的数据量变大,而且数据的处理过程,以及过程中对于硬件性能的要求越来越高。随着大模型出现,数据存储和处理相关领域未来会越来越有前景。
为顺应大模型时代AI发展趋势,华为针对不同行业、不同场景大模型应用,推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。
OceanStor A310深度学习数据湖存储,面向基础/行业大模型数据湖场景,实现从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理。OceanStor A310单框5U支持业界最高的400GB/s带宽以及1200万IOPS的最高性能,可线性扩展至4096节点,实现多协议无损互通。全局文件系统GFS实现跨地域智能数据编织,简化数据归集流程;通过近存计算实现近数据预处理,减少数据搬移,预处理效率提升30 %。
FusionCube A3000训/推超融合一体机,面向行业大模型训练/推理场景,针对百亿级模型应用,集成OceanStor A300高性能存储节点、训/推节点、交换设备、AI平台软件与管理运维软件,为大模型伙伴提供拎包入住式的部署体验,实现一站式交付。开箱即用,2小时内即可完成部署。训/推节点与存储节点均可独立水平扩展,以匹配不同规模的模型需求。同时FusionCube A3000通过高性能容器实现多个模型训练推理任务共享GPU,将资源利用率从40%提升到70%以上。FusionCube A3000支持两种灵活的商业模式,包括华为昇腾一站式方案,以及开放计算、网络、AI平台软件的第三方伙伴一站式方案。
“数据是很重要的,堪比人类发展历史上的文字。”对于AI大模型的数据建设现状,周跃峰认为,目前国内算力较多但存力较少,很多高价值的信息都没有被记录下来。
“目前ChatGPT英文大模型训练效率高于中文的核心原因,就在于英文资料的数字化记录远远多于中文,人工智能产业要得到高速的发展,一定要重视数据和信息的数字化的记录。”他表示。
周跃峰还提到了未来AI大模型在数据建设方面亟待突破的三个要点:对原始数据进行预处理实现“数据更好用”、数据存储与GPU更流畅地相配合、数据安全。
华为分布式存储领域副总裁韩振兴在会上表示,在算力和存力的建设过程中,一定是有一个最佳的算存比,并不是靠推算力就能把一个AI推得非常好。他认为,存力建设的落后可能加剧算力闲置,造成资源浪费;相反,高质量的存力将有助于提升AI训练。
- 责任编辑: 吕栋 
-
90%的企业或在5年内出局,中国预制菜来到洗牌前夜?
2023-07-14 19:21 观网财经-消费 -
“如果华为5G手机回归,会对荣耀产生哪些影响?”
2023-07-14 18:46 观网财经-科创 -
华为公布5G手机专利许可费率,与诺基亚、高通相比如何?
2023-07-14 14:40 观网财经-科创 -
央行:当前挑战属于疫后经济复苏过程中正常现象
2023-07-14 11:35 中国经济 -
央行:当前经济面临的一些挑战属于疫后经济复苏过程中正常现象
2023-07-14 10:57 中国经济 -
“大模型的难点不在技术追赶,而是产业突破”
2023-07-14 08:03 观网财经-科创 -
中日是否谈及日本半导体制造设备出口新规?商务部回应
2023-07-13 19:25 中日关系 -
网约车行业陷入低价竞争,平台和司机同时困于价格战
2023-07-13 19:21 观网财经-互联网 -
科通技术IPO:分拆出子公司的目标市值,为何远高于母公司?
2023-07-13 17:30 观网财经-金融 -
淘宝上线暑期特别版,首次围绕暑期生活组织快乐生活节
2023-07-13 13:46 观网财经-互联网 -
华为、中国电子ARM处理器合并生态,意在何为?
2023-07-13 13:39 观网财经-科创 -
淘宝天猫启动重大人力体系改革,取消P序列?集团回应
2023-07-13 13:33 观网财经-互联网 -
麦当劳中国将“易主”?回应来了
2023-07-13 12:40 -
如何看待最近两个月出口负增长?海关总署回应
2023-07-13 10:55 -
海关总署:上半年我国进出口增长2.1%,总值首次突破20万亿元
2023-07-13 10:12 中国经济 -
上汽回应奥迪购买其电动车平台传闻
2023-07-13 10:10 观网财经-汽车 -
平均降价16%都卖不动,合资车绊倒上半年车市
2023-07-12 18:14 观网财经-汽车 -
草甘膦巨头IPO:“老大”预减,“老二”如何?
2023-07-12 15:15 观网财经-金融 -
湖南:对隐性债务化解排名靠前的市州、县市区给予奖励
2023-07-12 15:12 地方债 -
股价翻倍后业绩暴雷,AI服务器龙头大跌7%
2023-07-12 12:35 观网财经-科创
相关推荐 -
中企修个跑道,美国吓成这样... 评论 56
数十万页!克林顿成重点,几乎没提特朗普 评论 210
比美国算法快14%!中国超大电力系统有“解”了 评论 128
美记者:在中国农村,我看到震撼一幕 评论 125最新闻 Hot

观察员

















上海市互联网违法与不良信息举报中心