2025年10月27日,美团LongCat团队正式发布并开源LongCat-Video视频生成模型。该模型基于Diffusion Transformer架构,通过‘条件帧数量’区分任务,支持文生视频、图生视频及视频续写,形成完整任务闭环。模型可生成720p、30fps高清视频,支持5分钟级长视频输出,保障跨帧时序一致性与物理运动合理性。其136亿参数基座模型在文生、图生视频任务中达开源SOTA水平,推理效率提升10.1倍。目前,模型已开源至GitHub、Hugging Face等平台。