MiniMax Hailuo 02 使用指南：完整教程

学习在 APIMart 上使用 MiniMax Hailuo 02：生成 API 密钥，构建文生视频与图生视频请求，渲染电影级 1080p 短片。

教程

MiniMax Hailuo 02 是一款强大的 AI 模型，能够生成电影级画质的视频，并对画面、运动和特效进行精准控制。它已上线 APIMart，支持文生视频、图生视频以及基于帧的转场，让你能够生成最高 1080p 分辨率的高质量短片。以下是你需要了解的要点：

核心功能：通过文本提示词、图像或帧转场创建视频，并支持像 [Pan left] 或 [Zoom in] 这样的镜头运动指令。
价格：1080p 短片每秒 $0.08，在 APIMart 上享受 20% 折扣。
配置：生成 API 密钥，用参数构建请求，并使用异步轮询来获取视频。
应用场景：非常适合广告、产品展示、故事板和培训视频。

要开始使用，请先创建 APIMart 账户，妥善保管你的 API 密钥，并按照分步指南生成视频。使用具体的提示词和镜头指令来最大化视频质量。对于较长的项目，可以利用一致的帧把多个短片拼接起来，或者探索 Kling V3 作为另一种电影级生成方案。

在 APIMart 上开始使用 MiniMax Hailuo 02

MiniMax Hailuo 02

账户设置与 API 密钥获取

要开始使用，请前往 apimart.ai 并创建一个账户。如果你属于某个团队，APIMart 允许你设置一个组织。这一功能通过让所有人共享一个中央余额，简化了协作流程，省去了交换个人凭据的麻烦。

账户准备就绪后，为你的共享余额充值。该余额适用于平台上全部 500 多个模型，其中包括像 Veo 3.1 这样面向专业级视频生成的高端选项。接下来，进入 Console 控制台中的 API Key Management 部分，生成一个 API 密钥。

请记住：你的 API 密钥只会显示一次。 务必复制并妥善保存，比如存入密码管理器或密钥保管库。在代码中使用密钥时，应从环境变量（例如 MINIMAX_API_KEY）中加载，而不要直接写死在代码里。这样可以降低代码被分享或上传到版本控制时意外泄露的风险。你发起的每一次 API 请求都会在授权头中携带这个密钥：

Authorization: Bearer YOUR_API_KEY

对于团队而言，Organizations 功能是集中管理访问权限的好办法，无需共享个人账户凭据 ^[2]。准备好 API 密钥后，你就可以配置请求参数并开始生成视频了。你也可以探索 Grok Imagine Video 以获得另一种高质量输出。

MiniMax Hailuo 02 请求的关键参数

API 密钥就绪后，你需要用正确的参数来搭建请求。"model": "MiniMax-Hailuo-02" 字段是必填项，此外还有若干其他参数。下面快速概览最重要的几个：

参数	类型	说明	备注
`model`	string	指定模型	必须为 `MiniMax-Hailuo-02`
`prompt`	string	描述场景、动作和风格	最多 2,000 字符
`duration`	integer	短片时长（秒）	`5` 或 `10`；1080p 仅支持 5 秒
`resolution`	string	输出画质	`512p`、`768p` 或 `1080p`
`first_frame_image`	string	图生视频的起始帧	公开 URL 或 Base64；最大 20MB
`last_frame_image`	string	首尾帧模式的结束帧	公开 URL 或 Base64 字符串
`prompt_optimizer`	boolean	自动优化你的提示词	默认 `true`；推荐开启

有一个重要细节：视频生成是异步的。 当你发送请求后，API 返回的是一个 task_id，而不是视频本身。你需要每隔 15–30 秒轮询一次 /v1/tasks/{task_id}，直到状态变为 "completed"。视频就绪后请立即下载，因为生成的链接会在 24 小时后过期 ^[2]。

参数就位后，你就可以专注于撰写一个高效的提示词，充分发挥 MiniMax Hailuo 02 的能力。

如何撰写高效的提示词

撰写好提示词是生成高质量视频的关键。一个结构良好的提示词包含六个要素：镜头景别或运动、主体及描述、动作、场景、光照，以及风格或氛围。例如，与其用模糊的描述如 "a woman walking in a city"，不如尝试更具体的写法："[Tracking shot] A woman in a red coat walks briskly through a rain-soaked Manhattan street at dusk, neon signs reflecting on the wet pavement, cinematic noir style."

要让视频更有动感，可以在提示词中直接加入镜头指令。像 [Pan left, Pedestal up] 这样的指令能增加运动感，而 [Truck left]、[Push in] 或 [Static shot] 等则能进一步控制视角 ^[3]。

处理复杂场景时，请保持 prompt_optimizer 为 true。该功能会自动优化并扩展你的描述，通常只需极少的额外投入就能带来更流畅、更连贯的视频输出 ^[1]。

如何在 Hailuo 02 中创作电影级 AI 视频

分步指南：使用 MiniMax Hailuo 02 生成视频

MiniMax Hailuo 02: Video Generation Workflow on GccAi — MiniMax Hailuo 02: Video Generation Workflow on APIMart

如何发起一个基础的文生视频 API 请求

如果你已经准备好 API 密钥和提示词，发送第一个请求其实很简单。只需向 https://api.apimart.ai/v1/videos/generations 发起一个 POST 调用。在请求头中携带你的 Bearer Token，并使用如下 JSON 请求体：

{
  "model": "MiniMax-Hailuo-02",
  "prompt": "[Tracking shot] A lone astronaut walks across a red desert at golden hour, dust swirling around their boots, cinematic wide-angle style.",
  "duration": 5,
  "resolution": "1080p"
}

重要提示： 1080p 分辨率仅支持 5 秒短片。如果需要 10 秒的视频，你需要将分辨率降到 768p 或 512p。价格取决于分辨率和时长——768p 每秒 $0.04，而 1080p 每秒 $0.08 ^[2]。

提交请求后，API 会返回一个 task_id 和 submitted 状态。视频渲染大约需要 30 到 90 秒 ^[2]。

如何使用图生视频功能

对于图生视频请求，你需要额外提供一个参数：first_frame_image。它可以是一个公开 URL（例如 https://example.com/start.jpg），也可以是一个 Base64 编码的 Data URL 字符串。请确保图像符合规定的文件类型、大小和宽高比要求。

你的提示词应当描述运动，而非画面的视觉细节，因为图像本身已经提供了这部分上下文。例如，如果起始图像是一张桌上的产品照片，那么像 "[Slow zoom in] Product rotates gently, soft studio lighting, clean white background" 这样的提示词就告诉模型该如何让它动起来。输出的分辨率会与你输入图像的尺寸保持一致，所以使用高质量素材对于获得清晰效果至关重要。

要实现更高级的效果，你可以在 first_frame_image 之外再加上 last_frame_image。这会在两张图像之间生成一段转场视频，非常适合产品揭晓、前后对比，或者大型项目中的场景转换。

请求搭建完成后，监控 API 响应即可获取你的动画视频。对于需要内置音频的项目，可以考虑探索支持同步声音生成的 Veo 3.1 API。

解读 API 响应并下载输出

当你的任务状态变为 success 时，API 会提供一个 file_id。在另一个 "Retrieve File"（获取文件）请求中使用它，即可拿到 download_url。状态流转方式如下：

状态	含义	应做的操作
`submitted` / `Preparing`	任务已接收	等待并再次轮询
`processing`	视频渲染中	等待并再次轮询
`success`	生成完成	请求下载 URL
`failed`	生成失败	检查 `error_message` 并重试

每隔 15–30 秒轮询一次 /v1/tasks/{task_id} 端点，直到状态变为 success。一旦完成，请求视频并下载它。请记住，下载链接会在 24 小时后过期，因此务必立即保存你的文件 ^[2]。

如果你使用 Python，可以用 requests.get(download_url).content 下载视频并保存为 .mp4 文件。为避免手动轮询，你可以在请求中设置一个 callback_url。这样，当任务状态更新为 success 或 failed 时，APIMart 会通过 POST 请求通知你的服务器 ^[3]。

最后，请始终检查 API 响应中的 code 字段。值为 200 表示请求成功，但你仍需监控任务状态以应对潜在的渲染错误 ^[1]^[3]。

提升视频质量与工作流集成

优化提示词与参数设置

要提升视频质量，可以尝试用以下格式来构建提示词：[主体与动作]、[物理/环境元素]、[镜头运动]、[光照/氛围]、[画质描述词] ^[7]。举个例子："A barista pours steaming milk into espresso, liquid swirling in slow motion, [Zoom in], warm café lighting, cinematic quality." 这种方法能帮助模型更有效地模拟真实的运动和氛围。

MiniMax-Hailuo-2.3 提供 15 条镜头指令，你可以在一对方括号中组合使用（最多三条），比如 [Pan left, Pedestal up] ^[3]。下表可作为快速参考：

类别	指令
水平/垂直	`[Truck left/right]`、`[Pan left/right]`、`[Pedestal up/down]`、`[Tilt up/down]`
纵深	`[Push in]`、`[Pull out]`、`[Zoom in/out]`
特殊	`[Shake]`、`[Tracking shot]`、`[Static shot]`

默认情况下，prompt_optimizer 功能是开启的，它通常能改善输出质量。除非你需要模型严格遵循一个高度具体的脚本，否则请保持开启。如果你更看重速度且能接受稍欠精致的效果，可以设置 fast_pretreatment: true 来减少预处理时间 ^[1]^[6]。

当你的提示词和设置调校完毕后，把它们整合进更宏观的流水线中，就能进一步提升制作质量。

用 APIMart 构建多模型流水线

Hailuo 02 与音频和扩展序列等互补工具搭配使用时效果最佳。它擅长创作视觉上充满动感的 B-roll 素材——比如水、火或织物——但它并不生成音频。要弥补这一空缺，可以在后期制作时搭配 MiniMax Audio 工具，比如用于配音的 Speech 2.8 或用于配乐的 Music 2.6 ^[8]。对于品牌或商业项目，可以先用图像模型生成一个基础帧，再把它作为 first_frame_image 喂给 Hailuo 02，从而精准控制构图 ^[7]。

对于超过 10 秒的视频，可以截取一段完成短片的最后一帧，将其用作下一个请求的 first_frame_image。这一技巧能确保角色细节和环境光照在多个短片之间保持一致 ^[8]。

"MiniMax Hailuo 02 的一致性非常惊人！角色形象在多个短片之间保持稳定。" —— Wei Zhang，独立动画师 ^[2]

错误处理与 API 最佳实践

即便提示词和流水线已经优化，问题仍可能出现。遵循以下最佳实践，可以有效排查故障并优化 API 响应。

Hailuo 02 最常见的两类失败涉及不受支持的分辨率/时长组合以及无效的图像输入。务必确认你的分辨率和时长设置相互兼容 ^[1]^[6]。对于图生视频任务，请确保源图像小于 20MB，短边大于 300px，宽高比介于 2:5 到 5:2 之间。可接受的格式包括 JPG、PNG 和 WebP ^[5]。

错误类型	检测方式	解决方案
不受支持的配置	任务立即返回 `failed`	核实分辨率与时长是否兼容 ^[1]^[6]
无效图像	`first_frame_image` 报 API 错误	检查格式（JPG/PNG/WebP）、大小和宽高比 ^[5]
回调超时	未收到状态更新	确保服务器在 3 秒内回传 `challenge` ^[3]
速率限制 / 超时	HTTP 429 或连接中断	将轮询间隔设为 10 秒 ^[4]

当任务失败时，请务必检查 JSON 响应中的 error_message 字段。它提供了详细的诊断信息，能帮助你快速定位问题 ^[4]。对于生产环境，请使用 callback_url 参数代替手动轮询。这能减少不必要的 API 调用，让你的工作流保持响应灵敏 ^[3]。

结语：核心要点

下面快速回顾一下 MiniMax Hailuo 02 在视频生成方面脱颖而出的原因。

MiniMax Hailuo 02 以极高的精度提供电影级画质的视频创作。得益于其 NCR 架构——相比早期模型，参数量是其 3 倍、训练数据是其 4 倍 ^[7]——它能为水、火、烟雾和织物等复杂元素生成高度逼真的效果。

通过 APIMart，你可以享受 20% 折扣，同时在 768p 和 1080p 分辨率上都能获得有竞争力的价格 ^[2]。它拥有 99.9% 的可用性 SLA，典型生成时间仅为 30 到 90 秒 ^[2]，无论是专业制作还是创意实验，它都是务实之选。对于需要更可视化工作区的用户，AI 画布编辑器还能进一步简化编辑流程。

该模型的突出特性包括：

图生视频工具，实现精准控制。
方括号镜头指令（例如 [Tracking shot]、[Zoom in]），实现专业级摄影效果。
末帧连续性，为扩展序列确保流畅过渡。

用户对其可靠性和速度赞誉有加。正如全栈工程师 David Chen 所说：

"我看重稳定性和速度。MiniMax Hailuo 02 提供了卓越的表现。" ^[2]

请记住，1080p 短片限制在 5–6 秒。对于更长的视频，768p 是一个很好的替代方案，能以有竞争力的价格提供稳定的画质 ^[1]^[3]。

凭借这些特性，MiniMax Hailuo 02 已经准备好将你的视频制作工作流提升到新的高度。

常见问题

我怎样才能制作超过 10 秒的短片？

MiniMax Hailuo 02 的单个短片时长上限为 10 秒。如果你需要更长的短片，就必须在这一限制内操作。在请求中把时长设为 10 秒，并选择兼容的分辨率，比如 768p 或 1080p。

对于文生视频任务，请在请求中包含以下参数：

duration: 10
resolution: "768P"
model: "MiniMax-Hailuo-02"

提交请求后，检查任务状态，待生成文件就绪后即可下载。

如果我的任务失败了，该怎么办？

如果你的视频生成任务没有通过，请先查看 API 状态消息来定位问题。以下是一些需要留意的常见错误码：

1002：表示你已触及速率限制。
1004/2049：指向认证问题。
1008：表示你的账户余额不足。
1026：标记输入中含有敏感内容。

对于速率限制错误（HTTP 429）或服务器相关问题（HTTP 5xx），可以尝试采用_指数退避_——也就是在每次重试之间逐步加长延迟。此外，请仔细核对你的输入参数，并确保提示词避开敏感内容，以免触发校验错误。

我怎样才能让角色在多个短片间保持一致？

要在 MiniMax Hailuo 02 中保持角色一致性，请选择 Subject Reference（主体参考）模式，并使用一张清晰、光照良好的参考图像。如果你在处理多个短片，请在提示词中加入匹配的光照细节来确保一致性。为了让画面衔接更顺畅，可以让各镜头的角度保持对齐，并在后期制作中考虑使用交叉淡入淡出或匹配剪辑等微妙转场。这些技巧有助于打造连贯而精致的叙事。