
MiniMax Hailuo 02 使用指南:完整教程
学习在 APIMart 上使用 MiniMax Hailuo 02:生成 API 密钥,构建文生视频与图生视频请求,渲染电影级 1080p 短片。
MiniMax Hailuo 02 是一款强大的 AI 模型,能够生成电影级画质的视频,并对画面、运动和特效进行精准控制。它已上线 APIMart,支持文生视频、图生视频以及基于帧的转场,让你能够生成最高 1080p 分辨率的高质量短片。以下是你需要了解的要点:
- 核心功能:通过文本提示词、图像或帧转场创建视频,并支持像
[Pan left]或[Zoom in]这样的镜头运动指令。 - 价格:1080p 短片每秒 $0.08,在 APIMart 上享受 20% 折扣。
- 配置:生成 API 密钥,用参数构建请求,并使用异步轮询来获取视频。
- 应用场景:非常适合广告、产品展示、故事板和培训视频。
要开始使用,请先创建 APIMart 账户,妥善保管你的 API 密钥,并按照分步指南生成视频。使用具体的提示词和镜头指令来最大化视频质量。对于较长的项目,可以利用一致的帧把多个短片拼接起来,或者探索 Kling V3 作为另一种电影级生成方案。
在 APIMart 上开始使用 MiniMax Hailuo 02

账户设置与 API 密钥获取
要开始使用,请前往 apimart.ai 并创建一个账户。如果你属于某个团队,APIMart 允许你设置一个组织。这一功能通过让所有人共享一个中央余额,简化了协作流程,省去了交换个人凭据的麻烦。
账户准备就绪后,为你的共享余额充值。该余额适用于平台上全部 500 多个模型,其中包括像 Veo 3.1 这样面向专业级视频生成的高端选项。接下来,进入 Console 控制台中的 API Key Management 部分,生成一个 API 密钥。
请记住:你的 API 密钥只会显示一次。 务必复制并妥善保存,比如存入密码管理器或密钥保管库。在代码中使用密钥时,应从环境变量(例如 MINIMAX_API_KEY)中加载,而不要直接写死在代码里。这样可以降低代码被分享或上传到版本控制时意外泄露的风险。你发起的每一次 API 请求都会在授权头中携带这个密钥:
Authorization: Bearer YOUR_API_KEY
对于团队而言,Organizations 功能是集中管理访问权限的好办法,无需共享个人账户凭据 [2]。准备好 API 密钥后,你就可以配置请求参数并开始生成视频了。你也可以探索 Grok Imagine Video 以获得另一种高质量输出。
MiniMax Hailuo 02 请求的关键参数
API 密钥就绪后,你需要用正确的参数来搭建请求。"model": "MiniMax-Hailuo-02" 字段是必填项,此外还有若干其他参数。下面快速概览最重要的几个:
| 参数 | 类型 | 说明 | 备注 |
|---|---|---|---|
model | string | 指定模型 | 必须为 MiniMax-Hailuo-02 |
prompt | string | 描述场景、动作和风格 | 最多 2,000 字符 |
duration | integer | 短片时长(秒) | 5 或 10;1080p 仅支持 5 秒 |
resolution | string | 输出画质 | 512p、768p 或 1080p |
first_frame_image | string | 图生视频的起始帧 | 公开 URL 或 Base64;最大 20MB |
last_frame_image | string | 首尾帧模式的结束帧 | 公开 URL 或 Base64 字符串 |
prompt_optimizer | boolean | 自动优化你的提示词 | 默认 true;推荐开启 |
有一个重要细节:视频生成是异步的。 当你发送请求后,API 返回的是一个 task_id,而不是视频本身。你需要每隔 15–30 秒轮询一次 /v1/tasks/{task_id},直到状态变为 "completed"。视频就绪后请立即下载,因为生成的链接会在 24 小时后过期 [2]。
参数就位后,你就可以专注于撰写一个高效的提示词,充分发挥 MiniMax Hailuo 02 的能力。
如何撰写高效的提示词
撰写好提示词是生成高质量视频的关键。一个结构良好的提示词包含六个要素:镜头景别或运动、主体及描述、动作、场景、光照,以及风格或氛围。例如,与其用模糊的描述如 "a woman walking in a city",不如尝试更具体的写法:"[Tracking shot] A woman in a red coat walks briskly through a rain-soaked Manhattan street at dusk, neon signs reflecting on the wet pavement, cinematic noir style."
要让视频更有动感,可以在提示词中直接加入镜头指令。像 [Pan left, Pedestal up] 这样的指令能增加运动感,而 [Truck left]、[Push in] 或 [Static shot] 等则能进一步控制视角 [3]。
处理复杂场景时,请保持 prompt_optimizer 为 true。该功能会自动优化并扩展你的描述,通常只需极少的额外投入就能带来更流畅、更连贯的视频输出 [1]。
如何在 Hailuo 02 中创作电影级 AI 视频
分步指南:使用 MiniMax Hailuo 02 生成视频

如何发起一个基础的文生视频 API 请求
如果你已经准备好 API 密钥和提示词,发送第一个请求其实很简单。只需向 https://api.apimart.ai/v1/videos/generations 发起一个 POST 调用。在请求头中携带你的 Bearer Token,并使用如下 JSON 请求体:
{
"model": "MiniMax-Hailuo-02",
"prompt": "[Tracking shot] A lone astronaut walks across a red desert at golden hour, dust swirling around their boots, cinematic wide-angle style.",
"duration": 5,
"resolution": "1080p"
}
重要提示: 1080p 分辨率仅支持 5 秒短片。如果需要 10 秒的视频,你需要将分辨率降到 768p 或 512p。价格取决于分辨率和时长——768p 每秒 $0.04,而 1080p 每秒 $0.08 [2]。
提交请求后,API 会返回一个 task_id 和 submitted 状态。视频渲染大约需要 30 到 90 秒 [2]。
如何使用图生视频功能
对于图生视频请求,你需要额外提供一个参数:first_frame_image。它可以是一个公开 URL(例如 https://example.com/start.jpg),也可以是一个 Base64 编码的 Data URL 字符串。请确保图像符合规定的文件类型、大小和宽高比要求。
你的提示词应当描述运动,而非画面的视觉细节,因为图像本身已经提供了这部分上下文。例如,如果起始图像是一张桌上的产品照片,那么像 "[Slow zoom in] Product rotates gently, soft studio lighting, clean white background" 这样的提示词就告诉模型该如何让它动起来。输出的分辨率会与你输入图像的尺寸保持一致,所以使用高质量素材对于获得清晰效果至关重要。
要实现更高级的效果,你可以在 first_frame_image 之外再加上 last_frame_image。这会在两张图像之间生成一段转场视频,非常适合产品揭晓、前后对比,或者大型项目中的场景转换。
请求搭建完成后,监控 API 响应即可获取你的动画视频。对于需要内置音频的项目,可以考虑探索支持同步声音生成的 Veo 3.1 API。
解读 API 响应并下载输出
当你的任务状态变为 success 时,API 会提供一个 file_id。在另一个 "Retrieve File"(获取文件)请求中使用它,即可拿到 download_url。状态流转方式如下:
| 状态 | 含义 | 应做的操作 |
|---|---|---|
submitted / Preparing | 任务已接收 | 等待并再次轮询 |
processing | 视频渲染中 | 等待并再次轮询 |
success | 生成完成 | 请求下载 URL |
failed | 生成失败 | 检查 error_message 并重试 |
每隔 15–30 秒轮询一次 /v1/tasks/{task_id} 端点,直到状态变为 success。一旦完成,请求视频并下载它。请记住,下载链接会在 24 小时后过期,因此务必立即保存你的文件 [2]。
如果你使用 Python,可以用 requests.get(download_url).content 下载视频并保存为 .mp4 文件。为避免手动轮询,你可以在请求中设置一个 callback_url。这样,当任务状态更新为 success 或 failed 时,APIMart 会通过 POST 请求通知你的服务器 [3]。
最后,请始终检查 API 响应中的 code 字段。值为 200 表示请求成功,但你仍需监控任务状态以应对潜在的渲染错误 [1][3]。
提升视频质量与工作流集成
优化提示词与参数设置
要提升视频质量,可以尝试用以下格式来构建提示词:[主体与动作]、[物理/环境元素]、[镜头运动]、[光照/氛围]、[画质描述词] [7]。举个例子:"A barista pours steaming milk into espresso, liquid swirling in slow motion, [Zoom in], warm café lighting, cinematic quality." 这种方法能帮助模型更有效地模拟真实的运动和氛围。
MiniMax-Hailuo-2.3 提供 15 条镜头指令,你可以在一对方括号中组合使用(最多三条),比如 [Pan left, Pedestal up] [3]。下表可作为快速参考:
| 类别 | 指令 |
|---|---|
| 水平/垂直 | [Truck left/right]、[Pan left/right]、[Pedestal up/down]、[Tilt up/down] |
| 纵深 | [Push in]、[Pull out]、[Zoom in/out] |
| 特殊 | [Shake]、[Tracking shot]、[Static shot] |
默认情况下,prompt_optimizer 功能是开启的,它通常能改善输出质量。除非你需要模型严格遵循一个高度具体的脚本,否则请保持开启。如果你更看重速度且能接受稍欠精致的效果,可以设置 fast_pretreatment: true 来减少预处理时间 [1][6]。
当你的提示词和设置调校完毕后,把它们整合进更宏观的流水线中,就能进一步提升制作质量。
用 APIMart 构建多模型流水线
Hailuo 02 与音频和扩展序列等互补工具搭配使用时效果最佳。它擅长创作视觉上充满动感的 B-roll 素材——比如水、火或织物——但它并不生成音频。要弥补这一空缺,可以在后期制作时搭配 MiniMax Audio 工具,比如用于配音的 Speech 2.8 或用于配乐的 Music 2.6 [8]。对于品牌或商业项目,可以先用图像模型生成一个基础帧,再把它作为 first_frame_image 喂给 Hailuo 02,从而精准控制构图 [7]。
对于超过 10 秒的视频,可以截取一段完成短片的最后一帧,将其用作下一个请求的 first_frame_image。这一技巧能确保角色细节和环境光照在多个短片之间保持一致 [8]。
"MiniMax Hailuo 02 的一致性非常惊人!角色形象在多个短片之间保持稳定。" —— Wei Zhang,独立动画师 [2]
错误处理与 API 最佳实践
即便提示词和流水线已经优化,问题仍可能出现。遵循以下最佳实践,可以有效排查故障并优化 API 响应。
Hailuo 02 最常见的两类失败涉及不受支持的分辨率/时长组合以及无效的图像输入。务必确认你的分辨率和时长设置相互兼容 [1][6]。对于图生视频任务,请确保源图像小于 20MB,短边大于 300px,宽高比介于 2:5 到 5:2 之间。可接受的格式包括 JPG、PNG 和 WebP [5]。
| 错误类型 | 检测方式 | 解决方案 |
|---|---|---|
| 不受支持的配置 | 任务立即返回 failed | 核实分辨率与时长是否兼容 [1][6] |
| 无效图像 | first_frame_image 报 API 错误 | 检查格式(JPG/PNG/WebP)、大小和宽高比 [5] |
| 回调超时 | 未收到状态更新 | 确保服务器在 3 秒内回传 challenge [3] |
| 速率限制 / 超时 | HTTP 429 或连接中断 | 将轮询间隔设为 10 秒 [4] |
当任务失败时,请务必检查 JSON 响应中的 error_message 字段。它提供了详细的诊断信息,能帮助你快速定位问题 [4]。对于生产环境,请使用 callback_url 参数代替手动轮询。这能减少不必要的 API 调用,让你的工作流保持响应灵敏 [3]。
结语:核心要点
下面快速回顾一下 MiniMax Hailuo 02 在视频生成方面脱颖而出的原因。
MiniMax Hailuo 02 以极高的精度提供电影级画质的视频创作。得益于其 NCR 架构——相比早期模型,参数量是其 3 倍、训练数据是其 4 倍 [7]——它能为水、火、烟雾和织物等复杂元素生成高度逼真的效果。
通过 APIMart,你可以享受 20% 折扣,同时在 768p 和 1080p 分辨率上都能获得有竞争力的价格 [2]。它拥有 99.9% 的可用性 SLA,典型生成时间仅为 30 到 90 秒 [2],无论是专业制作还是创意实验,它都是务实之选。对于需要更可视化工作区的用户,AI 画布编辑器还能进一步简化编辑流程。
该模型的突出特性包括:
- 图生视频工具,实现精准控制。
- 方括号镜头指令(例如
[Tracking shot]、[Zoom in]),实现专业级摄影效果。 - 末帧连续性,为扩展序列确保流畅过渡。
用户对其可靠性和速度赞誉有加。正如全栈工程师 David Chen 所说:
"我看重稳定性和速度。MiniMax Hailuo 02 提供了卓越的表现。" [2]
请记住,1080p 短片限制在 5–6 秒。对于更长的视频,768p 是一个很好的替代方案,能以有竞争力的价格提供稳定的画质 [1][3]。
凭借这些特性,MiniMax Hailuo 02 已经准备好将你的视频制作工作流提升到新的高度。
常见问题
我怎样才能制作超过 10 秒的短片?
MiniMax Hailuo 02 的单个短片时长上限为 10 秒。如果你需要更长的短片,就必须在这一限制内操作。在请求中把时长设为 10 秒,并选择兼容的分辨率,比如 768p 或 1080p。
对于文生视频任务,请在请求中包含以下参数:
duration: 10resolution: "768P"model: "MiniMax-Hailuo-02"
提交请求后,检查任务状态,待生成文件就绪后即可下载。
如果我的任务失败了,该怎么办?
如果你的视频生成任务没有通过,请先查看 API 状态消息来定位问题。以下是一些需要留意的常见错误码:
- 1002:表示你已触及速率限制。
- 1004/2049:指向认证问题。
- 1008:表示你的账户余额不足。
- 1026:标记输入中含有敏感内容。
对于速率限制错误(HTTP 429)或服务器相关问题(HTTP 5xx),可以尝试采用_指数退避_——也就是在每次重试之间逐步加长延迟。此外,请仔细核对你的输入参数,并确保提示词避开敏感内容,以免触发校验错误。
我怎样才能让角色在多个短片间保持一致?
要在 MiniMax Hailuo 02 中保持角色一致性,请选择 Subject Reference(主体参考)模式,并使用一张清晰、光照良好的参考图像。如果你在处理多个短片,请在提示词中加入匹配的光照细节来确保一致性。为了让画面衔接更顺畅,可以让各镜头的角度保持对齐,并在后期制作中考虑使用交叉淡入淡出或匹配剪辑等微妙转场。这些技巧有助于打造连贯而精致的叙事。