Apimart
登录注册
Seedance 2 Mini API:快速、实惠的 AI 视频

Seedance 2 Mini API:快速、实惠的 AI 视频

面向开发者的字节跳动 Seedance 2 Mini 指南:输入、输出规格、约 $0.081/秒 的定价,以及用于快速、低成本短视频的异步 API 流程。

模型解读

如果你需要快速生成简短的 AI 视频片段, Seedance 2 Mini 看起来更像是一个草稿优先、而非成片优先的模型。 从我在文章中看到的情况,主要的取舍很简单:你获得了 更低的成本更短的等待时间,但放弃了一部分顶级输出质量。

简单来说:

  • 我会用 Seedance 2 Mini(seedance-2-0-fast 来制作 5 到 15 秒的片段
  • 它支持 文本、图像、视频和音频输入
  • 它返回 24 fps 的 MP4
  • 它支持 480p、720p 和 1080p
  • 一段 5 秒 720p 片段 列出的时间约为 35 到 48 秒
  • 成本在原文中有两种描述方式:
    • 每段 $0.05 到 $0.10
    • 以及 每秒 $0.081 (5 秒 $0.41)
  • 它通过 异步 API 流程 运行,使用 任务 ID、轮询或 webhook
  • 生成的文件链接在 24 小时 后失效
  • 最佳适用场景:广告测试、短社交片段、产品预告,以及批量创意测试

最关键的是你如何使用它。我不会把 Mini 当作每项任务的最终渲染层级。我会把它当作 第一遍模型:在 480p 或 720p 下测试提示词,保持片段简短,然后如果需要打磨,再把最好的想法转到像 Sora 2 这样的更高层级。

Seedance 2 Mini 与标准版对比:速度、成本与质量
Seedance 2 Mini 与标准版对比:速度、成本与质量

如何访问 Seedance 2.0 API(视频讲解)

快速对比

模型主要用途分辨率5 秒成本典型等待时间最佳适用
Seedance 2 Mini / Fast低成本打草稿480p、720p、1080p160 credits约 30–90 秒广告钩子、社交测试、批量变体
Seedance 2.0 Standard更高端的输出最高 2K240 credits约 45–120 秒最终品牌视频、精修交付

文章中有几点尤为突出。

首先,该模型围绕 短视频生成 构建。这意味着你的请求设置非常重要。你对上传的素材有限制,例如:

  • 图像: 最大 30 MB
  • 视频: 2 到 15 秒,小于 50 MB
  • 音频: MP3 或 WAV,每个最大 15 MB
  • 最多 3 个音频文件
  • 最多 9 张图像参考
  • 最多 3 个视频参考

其次,文章显示提示词结构依然重要。像 镜头 + 主体 + 运动 + 场景 + 光照 + 风格 这样朴素的格式应有助于让输出更贴近目标。对于口型同步,原文指出触发条件是提示词内引号中的台词。

第三,这看起来是一个需要谨慎接入流水线的模型。我会确保做到:

  • 保存 任务 ID
  • 轮询任务状态或使用 webhook
  • 用退避处理 429 限流
  • 在重试前捕获 402 credit 错误
  • 立即下载完成的视频,因为 URL 在 24 小时 内失效

文章还指出一个有用的工作流:通过请求最后一帧来串联片段,然后把那一帧传入下一个请求。这是让多镜头序列衔接得不那么跳的简单方法。

所以我的结论很直接:当量、短片段和周转时间比顶级打磨更重要时,Seedance 2 Mini 最为合适。 如果你在制作广告测试、竖屏社交草稿或产品预告,它看起来是个不错的起点。对于需要电影级真实感的项目,Kling V3 提供了强大的替代选择。如果你需要更精修的成片,我会用 Mini 找出胜出的方案,然后在像 Google Veo 3.1 这样的更高层级中重新生成那个概念。

下面,完整指南将更详细地介绍模型设置、请求流程、定价、限制和生产技巧。

Seedance 2 Mini:背景与脉络

Seedance 2 Mini

Seedance 2 Mini 是 ByteDance 在 Seedance 2.0 系列中的快速、低成本层级。它为短片段和快速迭代而打造。这种取舍体现在输入限制、输出选项,以及你设计请求的方式上。

Seedance 2 的底层工作原理

这些架构选择有助于解释为什么 Mini 更适合短小、可重复的任务,而非长渲染。

Seedance 2.0 使用 双分支扩散 Transformer(Dual-Branch Diffusion Transformer) 架构,在单次生成中同时产生视频和音频 [6][9]。简单来说,这让画面和声音在生成过程中保持同步,而不是事后再加音频。它还支持多模态输入,包括文本、图像、视频和音频参考 [6]

Seedance 2.0 取得了 VBench 84.1 的运动一致性分数,相比上一版本提升了 16.2% [3]。它还把平均生成延迟比 1.0 版本降低了约 40% [3]。对团队来说,这意味着更快的审阅周期,以及从一个片段到下一个片段更稳定的运动。

Mini 在 Seedance 2 产品线中的位置

Mini 在 API 中列为 seedance-2-0-fast,位于标准 Seedance 2.0 模型之下。标准层级是质量优先的基线。Mini 为速度、迭代以及产出大量创意变体而调优,而非追求顶级视觉成片 [1][11]。它比标准模型大约便宜 19% [11],并为 5、10 或 15 秒片段 而打造 [10]

Seedance 2.0 Mini / FastSeedance 2.0 Standard
主要侧重迭代速度与成本约束最高电影级质量
分辨率480p、720p、1080p最高 2K(2,560 × 1,440)
Credit 成本(5 秒片段)160 credits240 credits
典型延迟约 30–90 秒约 45–120 秒
最佳使用场景草稿、广告钩子、批量创意最终制作、品牌视频

面向美国团队的使用场景

Mini 在速度最重要的工作流中很合理。想想 A/B 测试广告钩子、制作 TikTok Reels 内容、产出大量创意变体,或为 教育或营销视频制作 B-roll [1][11]。它还能用 AI canvas 编辑器 把静态产品图动画化成简短预告,同时保持产品的视觉身份完整 [5][12]

一个常见的设置很简单:先用 Mini 在 720p 下做原型,等方向获批后再以 1080p 或更高 重新渲染胜出的想法 [6]。这让早期轮次保持快速,把最终渲染留给最可能落地的概念。接下来,我们将看看塑造请求设计的输入模式、输出格式和限制。

输入模式、输出格式与限制

只有当你的请求设置足够严谨时,那些速度和成本上的收益才站得住脚。输入选择、文件上限和输出设置都会影响你拿到的结果。

支持的输入:文本、图像、视频和音频

Seedance 2 Mini 可以在单个请求中接收文本、图像、视频片段和音频文件。每种输入类型对应不同类型的任务。

文本生视频 是广告样片和社交概念测试最快的路径。如果你想要一个纯提示词草稿,这条路无需任何源素材就能让你抵达。

图像生视频把静态图像转为运动。它支持每个请求最多 9 张图像参考,很适合电商场景,尤其是当团队想把静态产品图变成 AmazonShopify 列表用的简短动画预告时 [12][9]

视频引导生成支持最多 3 个参考片段 来引导风格、镜头运动或主体动作 [4][9]。你也可以用它来在改造已有素材时替换物体或背景。

对于 音频条件生成,模型在单次生成中同时创建音频和画面。这让 8 种以上语言 的口型同步成为可能,包括英语、西班牙语、法语和德语 [9]。要触发口型同步,把口述台词用双引号放进文本提示词里 [4]

当你需要在提示词中指向上传的文件时,使用 @ 符号。例如,@Image1@Video1 会把你的指令关联到特定素材 [12][9]

上传限制相当严格,所以它们很重要:

  • 图像每张最大 30 MB
  • 视频文件必须为 2 到 15 秒,且小于 50 MB
  • 音频上传可以是 MP3 或 WAV 文件,每个最大 15 MB,合计时长 15 秒或更短
  • Seedance 2 Mini 每个请求最多支持 3 个音频文件 [2][12][9]

这些限制影响你如何构建 API 调用,以及一个请求里能塞进多少参考。

输出概况:分辨率、时长、帧率与文件交付

输出以 MP4 文件返回,固定 24 fps [13][2]。片段时长范围为 4 到 15 秒,如果你想让模型决定最终长度,可以用 -1 表示自动时长 [12][2][4]

宽高比预设包括 16:9、9:16、1:1、4:3、3:4、21:9 和 3:2 [14][9]。对于图像生视频请求,把 ratio 参数设为 "adaptive",这样输出会跟随源图像尺寸并避免黑边 [2][4]

宽高比480p720p1080p
16:9864 × 4961,280 × 7201,920 × 1,080
9:16496 × 864720 × 1,2801,080 × 1,920
1:1640 × 640960 × 9601,080 × 1,080
21:9992 × 4321,470 × 6301,920 × 822

分辨率决定一段片段是用作粗略预览,还是更接近最终交付的成品。时长限制影响你如何把场景拆分成更小的节拍。

还有一点:生成的视频 URL 在 24 小时 后失效 [2]。所以如果任务完成而没人抓取文件,它可能就消失了。在你的流水线中加入一个自动下载步骤,然后在请求成功后立即把文件移入永久存储。

这些设置影响存储、交付和后期制作规划。

内容政策与提示词设计约束

提示词和上传内容都会经过审核。涉及真实暴力、露骨内容或未经授权的真人深度伪造的任务会失败 [2][9]。你的错误处理应直接考虑到这一点,这样一个被拒的任务才不会悄悄冻结整批运行。

对于提示词结构,使用以下顺序:[Shot type], [Subject description], [Action/motion], [Environment], [Lighting], [Style] [8]。模型支持最多 2,000 个提示词 token [3],当场景需要时,这给了你充足的空间进行细致的电影化指引。

输入规则、输出设置和政策限制都确定后,下一部分是 API 请求流程。

如何通过 API 访问 Seedance 2 Mini

为什么 APIMart 很适合这个工作流

GccAi

一旦你了解了输入和输出限制,下一步就相当简单:获取访问、处理认证、算清成本。APIMart 在单个 key 和一套认证流程下,为你提供一个 Seedance 2 Mini 的 API 端点,外加其他 像 WAN 2.6 这样的 AI 视频模型,并以美元计费。[6][16] 对美国团队而言,这让计费和 key 管理省心了许多。

这就是 Seedance 2 Mini 从一个纸面上的模型,开始融入真实 API 工作流的地方。APIMart 兼容 OpenAI,所以如果你的团队已经在用那套请求模式,加入 Seedance 2 Mini 通常只需很少的改动。

账户设置、API Key 与环境配置

上手很简单。在 APIMart 创建账户,然后进入 API Key 管理 并生成一个服务端 key。[15]

把那个 key 存进环境变量或密钥管理器。如果你在开发、预发布和生产之间切换,为每个环境使用单独的 API key。这样测试流量就不会占用生产吞吐限额,用量也更易追踪。[15]

每个请求都在 Authorization 请求头中带上一个 Bearer token:[15]

Authorization: Bearer YOUR_API_KEY

对于文本、图像、视频和音频请求,你使用相同的 key 和端点。模型 ID 始终是 seedance-2-0-fast[15][2]

定价与吞吐规划

key 设置好之后,你的预算主要取决于片段时长和分辨率。Seedance 2 Mini 的成本为 每秒 $0.081,这意味着一段 5 秒片段约 $0.41,一段 10 秒片段约 $0.81[7]

对于视频生视频工作,token 定价约为 每 100 万 token $3.90。标准的文本生视频和图像生视频任务约为 每 100 万 token $6.40[2]

分辨率会让 token 用量快速攀升。一段 5 秒 1080p 片段约使用 102,960 个 token,所以一旦你规模化运行任务,这些选择就很重要了。企业套餐可能还包含批量折扣和更高的并发限额。[2][6][17]

构建请求与生产工作流

文本生视频与图像生视频的请求模式

访问设置好后,请求流程相当简单。大多数 Seedance 2 Mini 任务都遵循相同的异步模式:发送一个 POST 请求,存储 task_id,然后轮询状态端点或等待 webhook,直到任务完成。

import requests

headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

payload = {
    "model": "seedance-2-0-fast",
    "prompt": "A barista pours latte art in a sunlit café, slow dolly push in, warm tones, cinematic",
    "resolution": "480p",
    "duration": 5,
    "aspect_ratio": "16:9",
    "generate_audio": True,
    "seed": 12345
}

response = requests.post("YOUR_GENERATION_ENDPOINT", headers=headers, json=payload)
task_id = response.json().get("task_id") or response.json().get("job_id")

对于图像生视频,包含 image_url 并把 aspect_ratio 设为 "adaptive",这样输出就会匹配源帧。[2]

当你想在多次运行间保持相同起点时,seed 参数很有用。在测试提示词改动或切换分辨率时保持它固定。这样你就能判断到底是什么发生了变化,而不会被随机变化牵着走。

提示词结构同样重要。一个简单的公式很有效:主体 + 动作 + 镜头 + 场景/光照 + 风格。对镜头运动要具体,因为当模型有清晰的视觉目标时,它往往表现更好。[21]

为速度、成本和稳定结果调优

对于生产工作,Mini 最适合用作测试层级。用它在花更多 credit 做最终渲染之前,先尝试提示词措辞、运动和宽高比。这对广告钩子、产品预告和教育视觉效果很有用,也可作为像 WAN 2.6 这样更高保真模型的前置步骤。

从 480p 和 4 到 5 秒开始,然后用 720p 重新生成最好的想法。[18][12] Fast/Mini 层级使用基于时长的定价公式:duration_seconds × 40 credits,所以一段 5 秒片段花费 160 credits。[19]

设置草稿概念精修片段
分辨率480p720p
时长4–5 秒10–15 秒
Credit 用量较低的 credit 开销较高的 credit 开销
最适合提示词测试、A/B 迭代最终交付

这种两遍式工作流节省 credit,也让流程保持理智。你先测试想法,然后只在已经看起来有希望的片段上多花钱。

异步任务、错误处理与工作流示例

提交任务后,异步地处理完成。你可以每隔几秒轮询状态端点,或者在高量运行任务时使用 webhook。300 秒的超时是一个稳妥的生产默认值。[8] 任务一旦成功,立即下载视频。

对于多镜头叙事——这在产品讲解和教育序列中经常出现,与 MiniMax Hailuo 02 的高一致性输出类似——在每个请求上设置 return_last_frame: true。然后把那一帧作为 image_url 传入下一次调用。这是个简单的技巧,但有助于让镜头之间衔接得更顺。[3]

最常见的生产错误相当容易读懂:

  • 429 意味着你触到了并发限制,所以使用指数退避。
  • 402 意味着你的 credit 余额已空,所以在开始任何重试循环前先检查这一点。
  • 政策相关问题会返回 failed;如果发生这种情况,在再次尝试前修改提示词或源素材。[20]

结语:何时使用 Seedance 2 Mini

当你把 API 流程、用量上限和定价放在一起看时,选择相当简单:速度 vs. 最终打磨。当快速周转和更低成本比顶级输出更重要时,使用 Mini。

这就是它在草稿测试和批量创意上表现出色的原因。你可以运行更多早期阶段的视频概念,而不会花太多钱。

Mini 不是最终制作层级。在复杂场景和更长片段中,它不如更高质量的层级可靠。所以把它当作 草稿通道、而非最终渲染通道更合理。

它也能顺畅地融入上文介绍的异步 API 工作流。如果你的团队在任何真实量级上制作短视频,一个两遍式设置——用 Mini 打草稿,然后在更高质量层级成片——是一种从想法到交付物的高性价比方式。

常见问题

Seedance 2 Mini 足以用于最终视频吗?

Seedance 2 Mini 在速度最重要时表现最好。

用它来做快速提示词测试、批量创意和粗略的社交概念草稿。它很适合早期阶段的工作,当你想在不放慢节奏的情况下尝试大量方向时。但它不适合作为你最终、高保真制作的主力模型。

当一个提示词开始显得出色时,把它转入完整的 Seedance 2.0 工作流。在那里你能为精修的、面向消费者的素材获得更好的输出质量、更精细的运动控制和更强的多模态连贯性。

我应该如何在 480p、720p 和 1080p 之间选择?

根据你所处的流程阶段和你需要交付的内容来选择:

  • 480p 最适合早期想法核查、快速提示词测试和批量创意,此时速度和成本最重要。
  • 720p 很适合社交帖子、预览和草稿,它们需要质量与较低 API 成本之间的稳妥平衡。
  • 1080p 是营销素材、YouTube 视频和最终客户交付物的正确选择,此时视觉质量需要显得精致。

在 API 工作流中我应该自动化什么?

端到端地自动化异步生成流程:提交请求、轮询状态、下载完成的视频。

由于生成通常需要 30 到 120 秒,你的代码应该:

  • 在请求被接受后立即保存 任务 ID
  • 每隔 5 到 10 秒 检查任务状态
  • 如果 API 返回 HTTP 429 就使用 指数退避

为短暂的失败(如超时、连接中断或临时 5xx 响应)添加重试逻辑也很有帮助。

一旦视频就绪,立即把它下载到永久存储。这很重要,因为临时下载 URL 在 24 小时 内失效。