10月27日,美团LongCat团队正式发布LongCat-Video视频生成模型。该模型基于Diffusion Transformer(DiT)架构,通过“条件帧数量”区分任务,原生支持文生视频、图生视频及视频续写三大核心任务,形成完整任务闭环。文生视频可生成720p、30fps高清视频,语义理解与视觉呈现能力达开源SOTA级别;图生视频严格保留参考图像属性,动态过程符合物理规律;视频续写可稳定输出5分钟级长视频,保障跨帧时序一致性与物理运动合理性。该模型已开源至GitHub、Hugging Face等平台。
