-
美团发布并开源视频生成模型:部分参数比肩谷歌最先进模型Veo3
10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平)。
不同于以往针对单一任务训练的模型,LongCat-Video通过多任务联合训练机制,在同一框架内即可处理零帧、单帧及多帧条件输入。
此外,LongCat-Video重点突破了长视频生成难题,原生支持输出5分钟级别的视频。相比常见模型在长时序生成中易出现的画面漂移、色彩偏移等问题,该模型通过在视频续写任务上的原生预训练,保持了较高的时间一致性与视觉稳定性。
近年来,“世界模型”被业界认为是通往下一代人工智能的核心方向。它能在时空维度上建模物理规律与场景逻辑,使AI具备理解、预测甚至重构现实世界的能力。
在这一背景下,视频生成模型被视为构建“世界模型”的关键路径。通过视频生成任务压缩几何、语义与物理知识,AI可以在数字空间中模拟真实世界的运行过程。
美团LongCat团队表示,LongCat-Video的推出是公司迈向这一目标的关键一步。未来,该模型将与自动驾驶、具身智能等业务相结合,为美团在连接“原子世界”和“比特世界”方面提供技术支撑。
文生视频任务中,LongCat-Video可以根据提示词准确还原不少脑洞大开的画面
据介绍,LongCat-Video可生成720p分辨率、30帧率的高清视频,其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制,旨在解决长视频生成中常见的画面断裂、质量下降等问题,保持时序一致性与运动合理性。
在效率方面,针对高分辨率、高帧率视频生成的计算瓶颈,LongCat-Video通过“二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏”三重优化,视频推理速度提升至10.1倍,实现效率与质量的最优平衡。
LongCat-Video视频生成模型视频推理速度提升至10.1倍
在内部评测体系中,美团构建了一套覆盖文本生成视频与图像生成视频两大核心任务的基准,评估维度包括文本对齐、视觉质量、运动质量与总体表现,并在图生视频任务中额外增加了图像一致性指标。
为确保评测的科学性,团队采用人工与自动双轨评估机制,其中人工评价分为绝对打分与相对偏好两种方式,所有样本均由多名标注员独立评分,最终通过加权平均得出结果。
自动评测部分则由内部训练的多模态“判官模型”完成,与人工结果的相关性高达0.92,保证了客观性。
据发布的评测结果显示,LongCat-Video在文生视频任务的四个核心指标中,视觉质量得分几乎与谷歌的Veo3持平,整体质量超越了PixVerse-V5和国内领先的开源模型Wan2.2。
在运动质量方面,LongCat-Video生成的视频动作流畅、镜头移动自然,展现出较强的物理合理性。在文本对齐度上,LongCat-Video表现略差于Veo3。
在图生视频任务中,LongCat-Video画面细节丰富、风格真实,但在图像一致性和动作连贯性上仍有改进空间。技术报告认为,模型在处理高精度参考帧时对细节的保持较为谨慎,这在视觉质量上带来加分,却略微影响了动态平滑度。
LongCat-Video视频生成模型在文生、图生视频基础任务上达到开源SOTA
在公开评测平台VBench 2.0上,LongCat-Video在“常识理解”一项中以70.94%的得分位居所有开源模型第一,总分达到62.11%,仅次于谷歌Veo 3与生数Vidu Q1等商用闭源模型。
作为构建"世界模型"的技术尝试,LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 史岱君 
-
上市前夕业绩变脸,“鱼油大王”禹王生物不受Z世代青睐?
2025-10-27 18:01 观网财经-消费 -
始祖鸟之后,亚玛芬的“钞能力”能让Armada征服中国雪场吗?
2025-10-27 17:40 观网财经-消费 -
娃哈哈再现高层震动:宗馥莉心腹祝丽丹离职
2025-10-27 14:21 产经 热点关注 -
不再跟着西方屁股定义“卡脖子”,这样只会被动挨打
2025-10-27 14:12 观网财经-宏观 -
港股科网股走强,阿里巴巴涨超3%
2025-10-27 10:24 观网财经-金融 -
1-9月份全国规上工业企业利润增长3.2%,煤炭业下降51.1%
2025-10-27 09:50 -
智能早报丨中国光刻胶领域新突破;全球首款类脑智算体发布
2025-10-27 09:24 观网财经-科创 -
马斯克点赞中国火箭,有何深意?
2025-10-27 08:51 产经 科创 -
盛松成:经济高质量发展需平衡好消费和投资
2025-10-26 22:25 宏观经济 -
中国啤酒升级故事怎么讲?摸一摸美国“精酿革命”的石头
2025-10-26 21:54 观茶咖 -
荣丰控股:独董刘长坤失联
2025-10-26 21:32 -
新凯来总经理接任深科装备法定代表人
2025-10-26 21:30 观网财经-科创 -
对话“苹果税”举报人:中国开发者有权享受更低的佣金
2025-10-25 16:41 产经 科创 -
茅台集团换帅
2025-10-25 15:27 -
起底买环卫工粪便造假的“癌症早筛第一股”,幸亏中国医保没买单
2025-10-24 21:12 观网财经-健康 -
歌手黄子韬入淘开播,自创品牌朵薇新品在天猫双11首发
2025-10-24 21:11 观网财经-互联网 -
摆脱英伟达依赖,中国超算正在探索一条新路
2025-10-24 20:20 观察者头条 -
红米杀入4000元档,卢伟冰:不排斥和小米直接竞争
2025-10-24 19:49 观网财经-科创 -
鸿蒙再进化,互联网巨头集体表态
2025-10-24 17:52 观网财经-科创 -
存储价格狂飙,手机要越来越贵?
2025-10-24 14:40 观网财经-科创
相关推荐 -
呵呵,“‘民主国家’看不上中国技术”? 评论 221
普京访印:美国都在买,印度凭啥不能买? 评论 79
日本开发稀土担心中国干扰?日防相放话 评论 134
“美欧抢矿,遭殃的却是他们” 评论 16
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 73最新闻 Hot-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
呵呵,“‘民主国家’看不上中国技术”?
-
普京访印:美国都在买,印度凭啥不能买?
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
“华德858”轮触礁断裂
-
机密通话曝光!“美国恐将背叛,你要小心”
-
“云冈石窟大佛冻得流鼻涕”,官方:将暂时封闭、处置渗水
-
“高市早苗更加不安了”
-
高善文离职后,又有分析师集体出走国投证券
-
台军又出意外,这次是炮弹砸了民宅
-
“中产、富裕阶层也去1元店”,特朗普还嘴硬
-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-

观察员
上海市互联网违法与不良信息举报中心