Seedance 2 Mini API：快速、实惠的 AI 视频

面向开发者的字节跳动 Seedance 2 Mini 指南：输入、输出规格、约 $0.081/秒的定价，以及用于快速、低成本短视频的异步 API 流程。

模型解读

如果你需要快速生成简短的 AI 视频片段， Seedance 2 Mini 看起来更像是一个草稿优先、而非成片优先的模型。 从我在文章中看到的情况，主要的取舍很简单：你获得了 更低的成本 和 更短的等待时间，但放弃了一部分顶级输出质量。

简单来说：

我会用 Seedance 2 Mini（seedance-2-0-fast）来制作 5 到 15 秒的片段
它支持 文本、图像、视频和音频输入
它返回 24 fps 的 MP4
它支持 480p、720p 和 1080p
一段 5 秒 720p 片段 列出的时间约为 35 到 48 秒
成本在原文中有两种描述方式：
- 约 每段 $0.05 到 $0.10
- 以及 每秒 $0.081 （5 秒 $0.41）
它通过 异步 API 流程 运行，使用 任务 ID、轮询或 webhook
生成的文件链接在 24 小时 后失效
最佳适用场景：广告测试、短社交片段、产品预告，以及批量创意测试

最关键的是你如何使用它。我不会把 Mini 当作每项任务的最终渲染层级。我会把它当作 第一遍模型：在 480p 或 720p 下测试提示词，保持片段简短，然后如果需要打磨，再把最好的想法转到像 Sora 2 这样的更高层级。

如何访问 Seedance 2.0 API（视频讲解）

快速对比

模型	主要用途	分辨率	5 秒成本	典型等待时间	最佳适用
Seedance 2 Mini / Fast	低成本打草稿	480p、720p、1080p	160 credits	约 30–90 秒	广告钩子、社交测试、批量变体
Seedance 2.0 Standard	更高端的输出	最高 2K	240 credits	约 45–120 秒	最终品牌视频、精修交付

文章中有几点尤为突出。

首先，该模型围绕 短视频生成 构建。这意味着你的请求设置非常重要。你对上传的素材有限制，例如：

图像： 最大 30 MB
视频： 2 到 15 秒，小于 50 MB
音频： MP3 或 WAV，每个最大 15 MB
最多 3 个音频文件
最多 9 张图像参考
最多 3 个视频参考

其次，文章显示提示词结构依然重要。像 镜头 + 主体 + 运动 + 场景 + 光照 + 风格 这样朴素的格式应有助于让输出更贴近目标。对于口型同步，原文指出触发条件是提示词内引号中的台词。

第三，这看起来是一个需要谨慎接入流水线的模型。我会确保做到：

保存 任务 ID
轮询任务状态或使用 webhook
用退避处理 429 限流
在重试前捕获 402 credit 错误
立即下载完成的视频，因为 URL 在 24 小时 内失效

文章还指出一个有用的工作流：通过请求最后一帧来串联片段，然后把那一帧传入下一个请求。这是让多镜头序列衔接得不那么跳的简单方法。

所以我的结论很直接：当量、短片段和周转时间比顶级打磨更重要时，Seedance 2 Mini 最为合适。 如果你在制作广告测试、竖屏社交草稿或产品预告，它看起来是个不错的起点。对于需要电影级真实感的项目，Kling V3 提供了强大的替代选择。如果你需要更精修的成片，我会用 Mini 找出胜出的方案，然后在像 Google Veo 3.1 这样的更高层级中重新生成那个概念。

下面，完整指南将更详细地介绍模型设置、请求流程、定价、限制和生产技巧。

Seedance 2 Mini：背景与脉络

Seedance 2 Mini

Seedance 2 Mini 是 ByteDance 在 Seedance 2.0 系列中的快速、低成本层级。它为短片段和快速迭代而打造。这种取舍体现在输入限制、输出选项，以及你设计请求的方式上。

Seedance 2 的底层工作原理

这些架构选择有助于解释为什么 Mini 更适合短小、可重复的任务，而非长渲染。

Seedance 2.0 使用 双分支扩散 Transformer（Dual-Branch Diffusion Transformer） 架构，在单次生成中同时产生视频和音频 ^[6]^[9]。简单来说，这让画面和声音在生成过程中保持同步，而不是事后再加音频。它还支持多模态输入，包括文本、图像、视频和音频参考 ^[6]。

Seedance 2.0 取得了 VBench 84.1 的运动一致性分数，相比上一版本提升了 16.2% ^[3]。它还把平均生成延迟比 1.0 版本降低了约 40% ^[3]。对团队来说，这意味着更快的审阅周期，以及从一个片段到下一个片段更稳定的运动。

Mini 在 Seedance 2 产品线中的位置

Mini 在 API 中列为 seedance-2-0-fast，位于标准 Seedance 2.0 模型之下。标准层级是质量优先的基线。Mini 为速度、迭代以及产出大量创意变体而调优，而非追求顶级视觉成片 ^[1]^[11]。它比标准模型大约便宜 19% ^[11]，并为 5、10 或 15 秒片段 而打造 ^[10]。

	Seedance 2.0 Mini / Fast	Seedance 2.0 Standard
主要侧重	迭代速度与成本约束	最高电影级质量
分辨率	480p、720p、1080p	最高 2K（2,560 × 1,440）
Credit 成本（5 秒片段）	160 credits	240 credits
典型延迟	约 30–90 秒	约 45–120 秒
最佳使用场景	草稿、广告钩子、批量创意	最终制作、品牌视频

面向美国团队的使用场景

Mini 在速度最重要的工作流中很合理。想想 A/B 测试广告钩子、制作 TikTok 或 Reels 内容、产出大量创意变体，或为 教育或营销视频制作 B-roll ^[1]^[11]。它还能用 AI canvas 编辑器把静态产品图动画化成简短预告，同时保持产品的视觉身份完整 ^[5]^[12]。

一个常见的设置很简单：先用 Mini 在 720p 下做原型，等方向获批后再以 1080p 或更高 重新渲染胜出的想法 ^[6]。这让早期轮次保持快速，把最终渲染留给最可能落地的概念。接下来，我们将看看塑造请求设计的输入模式、输出格式和限制。

输入模式、输出格式与限制

只有当你的请求设置足够严谨时，那些速度和成本上的收益才站得住脚。输入选择、文件上限和输出设置都会影响你拿到的结果。

支持的输入：文本、图像、视频和音频

Seedance 2 Mini 可以在单个请求中接收文本、图像、视频片段和音频文件。每种输入类型对应不同类型的任务。

文本生视频是广告样片和社交概念测试最快的路径。如果你想要一个纯提示词草稿，这条路无需任何源素材就能让你抵达。

图像生视频把静态图像转为运动。它支持每个请求最多 9 张图像参考，很适合电商场景，尤其是当团队想把静态产品图变成 Amazon 或 Shopify 列表用的简短动画预告时 ^[12]^[9]。

视频引导生成支持最多 3 个参考片段 来引导风格、镜头运动或主体动作 ^[4]^[9]。你也可以用它来在改造已有素材时替换物体或背景。

对于音频条件生成，模型在单次生成中同时创建音频和画面。这让 8 种以上语言 的口型同步成为可能，包括英语、西班牙语、法语和德语 ^[9]。要触发口型同步，把口述台词用双引号放进文本提示词里 ^[4]。

当你需要在提示词中指向上传的文件时，使用 @ 符号。例如，@Image1 或 @Video1 会把你的指令关联到特定素材 ^[12]^[9]。

上传限制相当严格，所以它们很重要：

图像每张最大 30 MB
视频文件必须为 2 到 15 秒，且小于 50 MB
音频上传可以是 MP3 或 WAV 文件，每个最大 15 MB，合计时长 15 秒或更短
Seedance 2 Mini 每个请求最多支持 3 个音频文件 ^[2]^[12]^[9]

这些限制影响你如何构建 API 调用，以及一个请求里能塞进多少参考。

输出概况：分辨率、时长、帧率与文件交付

输出以 MP4 文件返回，固定 24 fps ^[13]^[2]。片段时长范围为 4 到 15 秒，如果你想让模型决定最终长度，可以用 -1 表示自动时长 ^[12]^[2]^[4]。

宽高比预设包括 16:9、9:16、1:1、4:3、3:4、21:9 和 3:2 ^[14]^[9]。对于图像生视频请求，把 ratio 参数设为 "adaptive"，这样输出会跟随源图像尺寸并避免黑边 ^[2]^[4]。

宽高比	480p	720p	1080p
16:9	864 × 496	1,280 × 720	1,920 × 1,080
9:16	496 × 864	720 × 1,280	1,080 × 1,920
1:1	640 × 640	960 × 960	1,080 × 1,080
21:9	992 × 432	1,470 × 630	1,920 × 822

分辨率决定一段片段是用作粗略预览，还是更接近最终交付的成品。时长限制影响你如何把场景拆分成更小的节拍。

还有一点：生成的视频 URL 在 24 小时 后失效 ^[2]。所以如果任务完成而没人抓取文件，它可能就消失了。在你的流水线中加入一个自动下载步骤，然后在请求成功后立即把文件移入永久存储。

这些设置影响存储、交付和后期制作规划。

内容政策与提示词设计约束

提示词和上传内容都会经过审核。涉及真实暴力、露骨内容或未经授权的真人深度伪造的任务会失败 ^[2]^[9]。你的错误处理应直接考虑到这一点，这样一个被拒的任务才不会悄悄冻结整批运行。

对于提示词结构，使用以下顺序：[Shot type], [Subject description], [Action/motion], [Environment], [Lighting], [Style] ^[8]。模型支持最多 2,000 个提示词 token ^[3]，当场景需要时，这给了你充足的空间进行细致的电影化指引。

输入规则、输出设置和政策限制都确定后，下一部分是 API 请求流程。

如何通过 API 访问 Seedance 2 Mini

为什么 APIMart 很适合这个工作流

GccAi

一旦你了解了输入和输出限制，下一步就相当简单：获取访问、处理认证、算清成本。APIMart 在单个 key 和一套认证流程下，为你提供一个 Seedance 2 Mini 的 API 端点，外加其他像 WAN 2.6 这样的 AI 视频模型，并以美元计费。^[6]^[16] 对美国团队而言，这让计费和 key 管理省心了许多。

这就是 Seedance 2 Mini 从一个纸面上的模型，开始融入真实 API 工作流的地方。APIMart 兼容 OpenAI，所以如果你的团队已经在用那套请求模式，加入 Seedance 2 Mini 通常只需很少的改动。

账户设置、API Key 与环境配置

上手很简单。在 APIMart 创建账户，然后进入 API Key 管理 并生成一个服务端 key。^[15]

把那个 key 存进环境变量或密钥管理器。如果你在开发、预发布和生产之间切换，为每个环境使用单独的 API key。这样测试流量就不会占用生产吞吐限额，用量也更易追踪。^[15]

每个请求都在 Authorization 请求头中带上一个 Bearer token：^[15]

Authorization: Bearer YOUR_API_KEY

对于文本、图像、视频和音频请求，你使用相同的 key 和端点。模型 ID 始终是 seedance-2-0-fast。^[15]^[2]

定价与吞吐规划

key 设置好之后，你的预算主要取决于片段时长和分辨率。Seedance 2 Mini 的成本为 每秒 $0.081，这意味着一段 5 秒片段约 $0.41，一段 10 秒片段约 $0.81。^[7]

对于视频生视频工作，token 定价约为 每 100 万 token $3.90。标准的文本生视频和图像生视频任务约为 每 100 万 token $6.40。^[2]

分辨率会让 token 用量快速攀升。一段 5 秒 1080p 片段约使用 102,960 个 token，所以一旦你规模化运行任务，这些选择就很重要了。企业套餐可能还包含批量折扣和更高的并发限额。^[2]^[6]^[17]

构建请求与生产工作流

文本生视频与图像生视频的请求模式

访问设置好后，请求流程相当简单。大多数 Seedance 2 Mini 任务都遵循相同的异步模式：发送一个 POST 请求，存储 task_id，然后轮询状态端点或等待 webhook，直到任务完成。

import requests

headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

payload = {
    "model": "seedance-2-0-fast",
    "prompt": "A barista pours latte art in a sunlit café, slow dolly push in, warm tones, cinematic",
    "resolution": "480p",
    "duration": 5,
    "aspect_ratio": "16:9",
    "generate_audio": True,
    "seed": 12345
}

response = requests.post("YOUR_GENERATION_ENDPOINT", headers=headers, json=payload)
task_id = response.json().get("task_id") or response.json().get("job_id")

对于图像生视频，包含 image_url 并把 aspect_ratio 设为 "adaptive"，这样输出就会匹配源帧。^[2]

当你想在多次运行间保持相同起点时，seed 参数很有用。在测试提示词改动或切换分辨率时保持它固定。这样你就能判断到底是什么发生了变化，而不会被随机变化牵着走。

提示词结构同样重要。一个简单的公式很有效：主体 + 动作 + 镜头 + 场景/光照 + 风格。对镜头运动要具体，因为当模型有清晰的视觉目标时，它往往表现更好。^[21]

为速度、成本和稳定结果调优

对于生产工作，Mini 最适合用作测试层级。用它在花更多 credit 做最终渲染之前，先尝试提示词措辞、运动和宽高比。这对广告钩子、产品预告和教育视觉效果很有用，也可作为像 WAN 2.6 这样更高保真模型的前置步骤。

从 480p 和 4 到 5 秒开始，然后用 720p 重新生成最好的想法。^[18]^[12] Fast/Mini 层级使用基于时长的定价公式：duration_seconds × 40 credits，所以一段 5 秒片段花费 160 credits。^[19]

设置	草稿概念	精修片段
分辨率	480p	720p
时长	4–5 秒	10–15 秒
Credit 用量	较低的 credit 开销	较高的 credit 开销
最适合	提示词测试、A/B 迭代	最终交付

这种两遍式工作流节省 credit，也让流程保持理智。你先测试想法，然后只在已经看起来有希望的片段上多花钱。

异步任务、错误处理与工作流示例

提交任务后，异步地处理完成。你可以每隔几秒轮询状态端点，或者在高量运行任务时使用 webhook。300 秒的超时是一个稳妥的生产默认值。^[8] 任务一旦成功，立即下载视频。

对于多镜头叙事——这在产品讲解和教育序列中经常出现，与 MiniMax Hailuo 02 的高一致性输出类似——在每个请求上设置 return_last_frame: true。然后把那一帧作为 image_url 传入下一次调用。这是个简单的技巧，但有助于让镜头之间衔接得更顺。^[3]

最常见的生产错误相当容易读懂：

429 意味着你触到了并发限制，所以使用指数退避。
402 意味着你的 credit 余额已空，所以在开始任何重试循环前先检查这一点。
政策相关问题会返回 failed；如果发生这种情况，在再次尝试前修改提示词或源素材。^[20]

结语：何时使用 Seedance 2 Mini

当你把 API 流程、用量上限和定价放在一起看时，选择相当简单：速度 vs. 最终打磨。当快速周转和更低成本比顶级输出更重要时，使用 Mini。

这就是它在草稿测试和批量创意上表现出色的原因。你可以运行更多早期阶段的视频概念，而不会花太多钱。

Mini 不是最终制作层级。在复杂场景和更长片段中，它不如更高质量的层级可靠。所以把它当作 草稿通道、而非最终渲染通道更合理。

它也能顺畅地融入上文介绍的异步 API 工作流。如果你的团队在任何真实量级上制作短视频，一个两遍式设置——用 Mini 打草稿，然后在更高质量层级成片——是一种从想法到交付物的高性价比方式。

常见问题

Seedance 2 Mini 足以用于最终视频吗？

Seedance 2 Mini 在速度最重要时表现最好。

用它来做快速提示词测试、批量创意和粗略的社交概念草稿。它很适合早期阶段的工作，当你想在不放慢节奏的情况下尝试大量方向时。但它不适合作为你最终、高保真制作的主力模型。

当一个提示词开始显得出色时，把它转入完整的 Seedance 2.0 工作流。在那里你能为精修的、面向消费者的素材获得更好的输出质量、更精细的运动控制和更强的多模态连贯性。

我应该如何在 480p、720p 和 1080p 之间选择？

根据你所处的流程阶段和你需要交付的内容来选择：

480p 最适合早期想法核查、快速提示词测试和批量创意，此时速度和成本最重要。
720p 很适合社交帖子、预览和草稿，它们需要质量与较低 API 成本之间的稳妥平衡。
1080p 是营销素材、YouTube 视频和最终客户交付物的正确选择，此时视觉质量需要显得精致。

在 API 工作流中我应该自动化什么？

端到端地自动化异步生成流程：提交请求、轮询状态、下载完成的视频。

由于生成通常需要 30 到 120 秒，你的代码应该：

在请求被接受后立即保存 任务 ID
每隔 5 到 10 秒 检查任务状态
如果 API 返回 HTTP 429 就使用 指数退避

为短暂的失败（如超时、连接中断或临时 5xx 响应）添加重试逻辑也很有帮助。

一旦视频就绪，立即把它下载到永久存储。这很重要，因为临时下载 URL 在 24 小时 内失效。

看完就试试

去模型市场挑选你想要的模型

在 APIMart 模型市场尝试聊天、图像和视频模型，用统一 API 快速体验模型能力。

聊天模型图像模型视频模型

进入模型市场