-
大模型进入爆发期,中国企业如何构建自身优势?
最后更新: 2024-05-08 20:11:32早在2018年,OpenAI刚提出GPT-1时,商汤就开启了AI大模型的研发。在2019年时,商汤便推出了10亿参数量规模的视觉模型。在之后的招股书中,商汤更是把AI大模型的布局也写了进去。2021年,商汤启动语言大模型的训练,并在NLP顶级赛事中拿下过多个第一。
2022年,商汤训练出了320亿参数的通用视觉大模型,也是迄今全球最大的通用视觉模型。多模态方面,商汤在今年3月开源30亿参数的“书生2.5”大模型,具备强大的图文跨模态开放任务处理能力,而且是目前全球开源模型中ImageNet准确度最高、规模最大的模型。
这些长期能力的积累,证明商汤大模型体系的构建绝非一日之功,而是量变到质变的过程,同时也为商汤大模型展现出更多AI生成能力打下坚实基础,目前大模型已落地20多个业务场景。
在最新发布的“日日新SenseNova”大模型体系下,商汤科技还推出了包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列自研的生成式AI应用。
例如,文生图创作平台“秒画SenseMirage”展现了光影真实、细节丰富、风格多变的强大文生图能力,可支持6K高清图的生成,客户还可根据自身需求训练生成模型。
在现场演示中,商汤的精选模型中曾出现AI模型站civitai的图片,一度引发外界质疑。但实际上,“秒画SenseMirage”是一个创作平台,创作者除使用商汤自研AIGC大模型外,也可导入第三方开源模型和本地模型,所谓存疑图片在演示时均有明确说明,并标示了出处。
商汤秒画文生图效果
“如影SenseAvatar”是AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”则是3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
从“秒画”、“如影”、“琼宇”到“格物”,可以被视为一套完整的视频内容制作和生成工具平台,人、物到空间的数字化闭环都包含在这套生成式AI应用矩阵里。这些强大而易用的内容生成能力,无疑会重塑内容生产行业生态,并打开新的增长空间。
目前,商汤“日日新SenseNova”已为政企客户提供了多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注服务,客户可根据实际应用需求,调用日日新SenseNova大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
前瞻布局大模型
大模型训练非一日之功,想要入局大模型,拥有大算力是必备条件之一。尽管大模型概念持续火热,但入局者大多面临着算力之困,尤其是在外部环境紧张的情况下,许多下场的企业并没有足够的算力储备。那商汤又是如何持续发展大模型,甚至还构建了大模型体系的呢?
实际上,自成立之初,商汤便深刻认识到超大规模算力对于推动AI技术创新的战略作用,并长期深耕于算力基础设施建设。自2018年至今,商汤历时5年搭建起了AI大装置SenseCore。
目前,支持商汤大模型训练的AI大装置SenseCore拥有2.7万块GPU,是亚洲最大的智算中心之一。其输出的算力十分惊人:峰值算力高达5000Petaflops;可以并行训练20个以上的类ChatGPT模型;1750亿参数的GPT-3在此一天就能完成1次训练。
强大的算力背后,也让商汤付出了巨大的代价,在2018年—2022年之间,其研发费用率从45.9%飙升至105%,2022年全年净亏损60.45亿元。
但科技企业高强度研发导致的巨额亏损并不罕见。尤其是AI大模型企业,前期比拼的就是计算资源。市场上流传的调研纪要显示,要训练像ChatGPT这样的生成式AI,至少需要1万张英伟达A100加速卡的支持。目前,国内只有商汤等6家公司具备这样的硬件实力。
实际上,在大模型时代,衡量算力能力的核心指标也不只是简单的数字,还包括多卡并行状态下的有效利用率,即能够支撑大模型训练的实际算力,以及系统能够持续稳定运行的时长。
商汤SenseCore AI大装置拥有出色的并行计算能力,能够以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。SenseCore AI大装置在2022年已支持了超过10个大模型训练项目,其中不仅有商汤自身的大模型训练项目,也包含了一些其他企业自定义的模型训练任务。在4000卡规模集群的训练关键指标达到世界领先之后,SenseCore AI大装置将为商汤科技未来万亿级参数规模的大模型训练提供基础。
商汤科技董事长兼CEO徐立曾表示,AI的核心是解决“工业红线”问题,而商汤SenseCore AI大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决AI软件所需算力支撑挑战。
在前瞻布局算力基础的同时,商汤还在智慧城市、智慧商业等领域长期耕耘,积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。
大模型+大算力,带来AI服务涌现
一次性推出多个生成式大模型,商汤意在向外界表明,技术的研发和落地是在同步进行的。
- 原标题:大模型进入爆发期,中国企业如何构建自身优势?
- 责任编辑: 吕栋 
-
王炸芯片,难再成苹果救星
2024-05-08 18:18 观网财经-科创 -
ST阳光:控股股东涉嫌内幕交易被证监会拟罚款2.32亿元
2024-05-07 20:57 -
华为苹果同日对决,背后还有中韩面板之争
2024-05-07 17:23 观网财经-科创 -
历史性一幕!iPhone在华市场份额跌出前五
2024-05-07 11:13 观网财经-科创 -
45亿加码“五五购物节”,拼多多助力上海“拼”出精彩
2024-05-06 19:32 -
美国Tiktok法案的起草人,引火烧身了
2024-05-06 18:47 观网财经-金融 -
舒适赛道红利释放,红豆股份品牌转型出成效
2024-05-06 13:33 -
“五一”近3亿人次出游,较2019年同期增长28.2%
2024-05-06 12:16 观察者头条 -
巴菲特股东大会要点来了!回应减持苹果、巨额现金储备等
2024-05-05 08:28 -
武广高铁、沪杭客专等4条高铁线涨价,涨幅近20%
2024-05-04 14:13 高铁世纪 -
深圳将取消福田、南山之外区域住房限购?深圳住建局回应
2024-05-04 10:27 观网财经-房产 -
-
20张营业执照只有3家实存?央媒:问题在下头,根子在上头
2024-05-03 11:21 基层治理 -
上海推出商品住房“以旧换新”活动
2024-05-03 09:39 观网财经-房产 -
中俄东线天然气管道最新进展
2024-05-03 09:30 国企备忘录 -
31省份“一季报”:苏鲁浙增速超6%,山西总量下滑
2024-05-02 21:39 宏观经济 -
美联储维持利率不变,纳指两连跌星巴克重挫
2024-05-02 07:42 观网财经-海外 -
南京公积金新政:包括宣城、马鞍山在内的南京都市圈9城互认互贷
2024-05-01 19:50 观网财经-房产 -
美国当前经济数据中,也许藏着高官接连访华的答案
2024-05-01 09:24 -
余承东不再担任华为终端BG CEO
2024-05-01 08:53 观网财经-科创
相关推荐 -
鲁比奥又提到中日:我们有信心 评论 66
中企修个跑道,美国吓成这样... 评论 76最新闻 Hot-
还能这么玩?特朗普:我能允许美国政府赔我10亿美元...
-
拖了26年还要推迟,卢拉敲打欧盟
-
石破茂:日本拥核绝无好处
-
“以色列想再次袭击伊朗”
-
面对加沙废墟,美国想造“高科技城市”
-
鲁比奥又提到中日:我们有信心
-
未受制裁油轮,也被美国强行扣了
-
“俄乌谁先动的手?乌克兰可不是小国”
-
美媒大肆炒作,美企CEO无语:是我们求中企救命啊…
-
“我要回圣彼得堡了,和阿萨德做邻居,当标题去吧!”
-
肠子悔青,“太多鸡蛋装美国篮子里了,指望中印…”
-
全是克林顿,没有特朗普?美司法部急辩…
-
中企修个跑道,美国吓成这样...
-
“成都女子家门口遇害案”,宣判!
-
美方最新表态:不会强迫乌克兰
-
“台湾有事,我们印度不会学西方啦”,不过嘛…
-

观察员



上海市互联网违法与不良信息举报中心