支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型

3 小时前 / 阅读约2分钟

来源：IT之家

生数科技发布Vidu S1实时交互模型，支持实时视频通话和语音控制视频走向，采用自回归扩散模型路线，可基于任意初始形象及个性化音色创建专属交互角色，已开启内测。

IT之家 7 月 3 日消息，生数科技今日发布面向实时交互场景的新一代模型 ——Vidu S1 实时交互模型。

官方表示，Vidu S1 模型支持实时视频通话和语音控制视频走向，用户不仅能通过语音控制数字人的行为，还能实现无限时长连续互动。

Vidu S1 支持 540P（960x540）高清分辨率、25FPS 帧率（最高支持 42FPS），可基于真人、动漫、萌宠等任意初始形象及个性化音色，快速创建专属交互角色。

据介绍，Vidu S1 采用自回归扩散模型 (AR + Diffusion) 路线，不再一次性生成完整视频，而是基于已经生成的历史画面，结合当前语音指令和对话上下文，持续预测并生成后续内容。

当用户发出新的语音指令时，模型可以实时理解并调整角色的表情、动作及后续视频走向，使视频从预先确定的固定内容，转变为一个持续生成、实时响应、动态演化的交互过程。

Vidu S1 已开启内测，IT之家附相关链接如下：

线上体验地址：https://www.vidu.cn/vidu-stream
API 体验地址：https://platform.vidu.cn/live/landing

上一篇：硬件是骨， AI 是魂，数据让二者成为一体

下一篇：三年亏一亿、股价跌七成，高瓴还在力挺这家机器人公司

返回列表

热文阅读

2 天前

特斯拉公布超级芯片工厂首位高管英特尔17年老将加盟

2 天前

上海高速特斯拉撞护栏起火，理想车主冲上前救出女司机

2 天前

卓易通官宣全面支持华为鸿蒙HarmonyOS 7.0系统

2 天前

苹果史上最恶劣泄密事件：iPhone 18 Pro 要“凉”了？

1 天前

卷不赢模型，Meta改行“算力包租公”，一夜炸崩美股AI链

1 天前

35B Agent超越万亿参数模型？上海AI Lab开源Agents-A1：scaling the Horizon

2 天前

英伟达刷新DeepSeek V4推理纪录：单Token成本降至1/5

2 天前

赤子城独家投资：4人创业团队「MobAI」，推出AI互动平台「Lunaverse Stories」 | 36氪首发

2 天前

为什么一到演唱会，你的朋友圈就发不出去？

2 天前

OpenAI：ChatGPT 全球采用率持续扩大，非英语用户占比过半

上一篇：硬件是骨， AI 是魂，数据让二者成为一体

下一篇：三年亏一亿、股价跌七成，高瓴还在力挺这家机器人公司

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们