
MiniMax Hailuo 03 API:1080p 视频生成
用 MiniMax Hailuo 03 API 制作 1080p AI 视频:文生视频、图生视频、异步任务、$0.08/秒定价,以及面向开发者的生产实践技巧。
如果你想通过 API 制作 1080p AI 视频,主要限制其实很简单:片段最长 5 秒、异步任务处理,以及每秒 $0.08 的成本。 我会把 Hailuo 03 当作一个短视频模型,用于那些需要文生视频或图生视频、又不想自己跑 GPU 的应用。
下面用大白话讲讲这篇文章:
- 它能做什么: 生成 1080p MP4 视频
- 输入类型: 文本提示词、图生视频、首尾帧,以及主体参考
- 片段限制: 1080p 下 5 秒
- 价格: 每个 5 秒 1080p 片段 $0.40
- API 流程: 提交任务,然后轮询
task_id或使用callback_url - 提示词控制: 用方括号写运镜,如
[Pan left]或[Zoom in] - 文件处理: 最终视频 URL 在 24 小时后过期
- 图片规则: 小于 20 MB,宽高比在 2:5 到 5:2 之间
- 可靠性说明: 文章引用了 99.9% 在线率 SLA
最重要的是:你需要后端逻辑,而不只是一个提示词。这意味着要处理异步状态查询、立即存储 MP4、在遇到 429 和 5xx 时重试,以及在需要超过 5 秒的视频时拼接片段。
如果是我来搭建,我会先在较低分辨率下测试提示词,锁定运动措辞,然后只在最终运行时才切到 1080p,把开销控制住。
观看:自动化 MiniMax 视频生成
核心能力与 1080p 输出选项
在发送第一个请求之前,先弄清楚 Hailuo 03 的输入模式、运动控制和输出限制。
支持的输入:文本提示词、图片与运动指令
Hailuo 03 支持四种输入模式:文生视频、图生视频 (I2V)、首尾帧视频,以及主体参考视频 [2]。
在运动控制方面,你可以在一条方括号指令中组合最多三个运镜,例如 [Pan left, Pedestal up] [3]。这给了你一种简单的方式来引导构图和场景运动,而无需添加额外的元数据。
这些模式与下一节介绍的请求字段相对应。
开发者应核实的 1080p 输出规格
1080p 输出限制为 5 秒片段。如果你需要更长的序列,请生成多个片段并在后端拼接。对于需要集成音频的项目,可以考虑 Google 的 Veo 3.1 作为替代方案。
这一限制应同时影响你的请求设置和后端拼接逻辑。
Hailuo 03 规格
| 规格 | 详情 |
|---|---|
| 输入模式 | 文生视频、图生视频、首尾帧视频、主体参考视频 |
| 运动控制 | 每条方括号指令最多三个运镜 |
| 最大片段时长 | 5 秒 |
| 输出分辨率 | 1080p |
如何在 APIMart 上调用 MiniMax Hailuo 03 API


既然你已经看到了 Hailuo 03 能做什么,现在该把它接入你的应用了。
认证、基础 URL 与请求头
每个发往 APIMart 的请求都在 Authorization 请求头中使用 Bearer 令牌,同时带上 Content-Type: application/json。一个 APIMart API 密钥即可处理所有请求。
POST https://api.apimart.ai/v1/videos/generations
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
文生视频与图生视频的请求示例
每次你都会使用相同的端点和相同的认证设置。变化的只是提示词、分辨率、时长和输入 URL。
model 字段指向 Hailuo 03。resolution 控制输出质量。如果你想要 1080p,duration 必须为 5。
文生视频请求:
{
"model": "MiniMax-Hailuo-03",
"prompt": "A product designer sketching at a sunlit desk, [Pan left, Zoom in], cinematic depth of field",
"resolution": "1080p",
"duration": 5,
"prompt_optimizer": true
}
图生视频请求:
{
"model": "MiniMax-Hailuo-03",
"prompt": "The product rotates slowly on a white surface, [Orbit right]",
"resolution": "1080p",
"duration": 5,
"first_frame_image": "https://your-storage.com/product-shot.jpg",
"prompt_optimizer": true
}
对于图生视频,先上传图片,再把返回的 URL 用在 first_frame_image 中。图片必须小于 20 MB,宽高比需保持在 2:5 到 5:2 之间。如果超出该范围,API 会返回 400 错误。如果你希望在生成前对提示词进行优化,将 prompt_optimizer 设为 true。
异步响应、任务状态与最终视频 URL
视频生成是异步运行的,因此你的应用需要轮询状态或使用回调。
"After submitting a task, poll its status using the task_id until it succeeds or fails." - MiniMax API Docs [2]
每 15–30 秒轮询一次该端点:
GET https://api.apimart.ai/v1/tasks/{task_id}
status 字段会经过几个阶段:
| 状态 | 含义 |
|---|---|
submitted / Preparing | 请求已接收,正在初始化 |
queued / Queueing | 等待 GPU 资源 |
processing | 视频正在渲染中 |
completed / Success | 完成——视频 URL 可用 |
failed / Fail | 发生错误;检查 error_message |
当状态达到 completed 时,响应中会包含最终的 MP4 URL。请立即下载 MP4,因为链接会在 24 小时后过期 [4]。
如果你要处理大量任务,在第一个请求中传入 callback_url 而不是轮询。任务完成时你的服务器会收到一个 POST 回调,并且必须在 3 秒内返回 challenge 值 [3]。
任务流程搭建好之后,下一步就是为生产调好质量与成本。你也可以考虑 Kling V3 来获取另一种电影级视频风格。
1080P 工作负载的参数、性能与定价
在生产中真正重要的质量控制
一旦请求格式定下来,下一步就是调优输出质量、速度和开销。对大多数 1080P 任务来说,三个设置承担了大部分工作:resolution、duration 和 prompt_optimizer。
prompt_optimizer 会重写提示词,让运动和构图更清晰 [1][3]。在大多数生产场景下,最好把它开着。但如果你的提示词需要紧扣品牌术语或精确措辞,就把它设为 false,这样系统就不会改写你需要保留的语言 [3]。
你还可以使用 fast_pretreatment 来缩短提示词预处理时间。代价是输出质量会有小幅下降 [1][3]。
对于运镜,将运动指令直接用方括号命令写进提示词。例如 [Pan left] 和 [Zoom in]。一条提示词中最多可以使用三个这样的命令 [3][5]。
延迟与以美元计的成本规划
这些控制就位后,成本主要取决于片段时长。由于生成是异步运行的,请按提交并轮询的流程来规划。如果你希望后端自动获取结果,使用 callback_url,这样任务完成时它就会收到通知 [4]。
按 每秒 $0.08 计算,一个 5 秒 1080P 片段成本为 $0.40。
减少浪费的一个简单办法是先在 768P 下测试提示词,等提示词表现和运镜都对了,再切到 1080P [1][6]。
集成模式与后续步骤
面向营销、产品与教育类应用的后端工作流
请求处理和任务状态搭好之后,下一步就是把 Hailuo 03 接入真实的产品流程。核心任务流程在不同类型的应用间保持一致。变化的是提示词风格、你发送的输入,以及片段需要实现什么。
对于营销广告片段,使用文生视频。提示词保持简短直接,并加入像 [Pan left] 或 [Tracking shot] 这样的运镜提示。对于产品视觉,使用图生视频,把产品图作为参考图传入。对于教育类讲解片,当你需要更长的片段时,768P 往往是更实用的选择。
大规模下的存储、交付与用量追踪
渲染完成后,把文件移入持久化存储以便交付和追踪。立即下载每个 MP4,并存入你自己的系统以供交付。为了可靠性,对 429 和 5xx 响应加上指数退避。如果你要处理高并发量,使用 callback_url 而不是轮询。把所有视频任务的用量统一追踪到一处。这样的设置有助于在量增长时让交付保持稳定。
结论:开发者要记住的关键点
针对用例用正确的输入类型提交任务,谨慎处理异步流程,并立即存储输出——然后在此基础上继续构建。
常见问题
一个 1080p 视频通常要多久才能生成完?
高质量 1080p 视频生成通常需要 1 分 38 秒到 5 分钟,不过有些任务能在 30 到 90 秒内完成。
具体时长取决于两件事:提示词有多复杂,以及你想要的视频有多长。由于生成是异步运行的,你的应用应轮询任务状态,直到它完成。
制作超过 5 秒视频的最佳方式是什么?
要用 MiniMax Hailuo API 制作超过 5 秒的视频,请使用较低的分辨率。
1080p 只支持 5 秒或 6 秒片段,具体取决于模型版本。768p 支持最长 10 秒的片段。
所以如果你想要 10 秒视频,请设置:
resolution设为768pduration设为10
在你的 API 请求中,实际做法就是这个思路:分辨率用 768p,时长用 10。
我什么时候该关闭 prompt_optimizer?
当你想要更严格地控制视频输出时,关闭 prompt_optimizer。默认情况下,系统会重写你的描述以帮助改善结果。
如果你想让提示词完全按原样使用,就把它关掉,尤其是当你已经精调过、不希望任何内容被改动时。