Gemini Omni Flash
Gemini Omni Flash 视频生成
- Google 官方 Gemini Omni Flash 全能多模态视频生成模型
- 支持文生视频、图生视频、视频生视频(编辑),可混合文本 + 图片 + 视频输入
- 输出 720p / 24fps、3–10 秒、含音频;支持对话式多轮编辑
- 异步任务接口,提交后通过任务 ID 查询生成结果
POST
认证
请求参数
视频生成模型名称,固定为
gemini-omni-flash-preview。文本指令。文生视频为场景描述;图 / 视频生视频为动作 / 风格 / 编辑指令。
prompt 与参考素材(image_urls / video_urls)至少提供其一。参考图,最多 16 张。每项为
http(s):// URL。支持 JPEG / PNG。多主体(如「猫 + 毛线球」)可传多张,并在 prompt 中描述它们如何互动。参考 / 待编辑视频,最多 1 个(不支持多视频引用)。可为
http(s):// 直链或 data:video/...。视频宽高比,真正控制输出画面方向。仅支持:
16:9- 横屏(默认)9:16- 竖屏
16:9 处理。视频分辨率。当前仅支持
720p。上一个任务ID:填上一次生成任务的**
task_id**。响应
响应状态码,成功时为
200。返回任务数组。
查询任务结果
视频生成为异步任务。提交后会返回task_id,使用 获取任务状态 接口查询生成进度和结果。