Гид по Vidu API: модель MoE и серия Q

Доступ к Vidu MoE, Q3 Pro и Q3 Turbo через один ключ APIMart. Сравните модели, цены от $0.048/сек и async-поток API для text- и image-to-video.

Туториал

Если кратко в одну строку: используйте Vidu MoE для более сложной логики промптов, Q3 Pro для финального вывода и Q3 Turbo для недорогого тестирования через одну настройку APIMart.

Вот краткая версия, которой можно сразу воспользоваться:

Я могу получить доступ к Vidu MoE, Vidu Q3 Pro и Vidu Q3 Turbo через APIMart с одним API-ключом и одним основным потоком запросов.
Основной эндпоинт — POST https://api.apimart.ai/v1/videos/generations.
Видеозадачи асинхронны, поэтому я сначала получаю task_id, затем опрашиваю GET /v1/tasks/{task_id} или использую callback_url.
Vidu поддерживает:
- text-to-video
- image-to-video
- видео на основе референсов
- переходы первый-последний кадр
Модели Q3 добавляют встроенное аудио: диалоги, звуковые эффекты и музыку.
Клипы могут длиться до 16 секунд, с выводом 540p, 720p или 1080p.
Цены APIMart в статье указывают:
- Q3 Pro: около $0.12/сек при 720p
- Q3 Turbo: около $0.048/сек при 720p
Ссылки на вывод истекают через 24 часа, поэтому файлы стоит скачивать вскоре после успеха.

Сравнение моделей Vidu API: MoE против Q3 Pro против Q3 Turbo

Краткое сравнение

Модель	Лучшее применение	Главный плюс	Главный компромисс	Цена в статье
Vidu MoE	Более сложные многосценовые промпты	Лучший контроль промпта и логика сцены	Медленнее и дороже	Премиум
Vidu Q3 Pro	Финальные видео	Более высокое качество, 1080p, синхронизация аудио и видео	Дороже Turbo	$0.12/сек
Vidu Q3 Turbo	Тесты, черновики, пакетная работа	Ниже стоимость и меньше время ожидания	Меньше визуальных деталей, чем у Pro	$0.048/сек

Что мне бросается в глаза — насколько прост переход: в большинстве случаев я просто меняю поле model и оставляю остальную настройку прежней. Это делает статью не столько о настройке, сколько о выборе правильной модели по стоимости, времени ожидания и качеству вывода.

Модели Vidu объяснены: MoE против серии Q

Vidu

Модель MoE от Vidu: что это и когда её использовать

Модель MoE (Mixture of Experts) отправляет разные части задачи генерации специализированным экспертам по движению, консистентности сцены и контролю промпта. Она имеет наибольший смысл для многосценовых или более длинных промптов, где консистентность важнее чистой скорости.

Однако есть нюанс. MoE требует больше вычислений и имеет более медленный оборот, чем серия Q ^[7]. Для простых промптов она часто больше, чем нужно.

Серия Vidu Q и Vidu Q3 Pro: производительность для продакшена

Если MoE — это специалист, то серия Q — вариант, созданный для продакшен-работы. Vidu Q3 Pro разработан для отшлифованного кинематографичного вывода и видео на основе раскадровки ^[7]. Он поддерживает видео 1080p, клипы до 16 секунд и генерацию аудио-видео с синхронизированными диалогами и звуковыми эффектами ^[1]^[2]^[4]. На APIMart Q3 Pro начинается с $0.12 за секунду ^[2]^[3].

Vidu Q3 Turbo склоняется больше к скорости и более низкой стоимости, с более быстрым переключением сцен ^[6]^[7]. На APIMart Q3 Turbo начинается с $0.048 за секунду ^[3].

Как выбирать между MoE и серией Q для вашего процесса

Этот выбор в основном сводится к сложности промпта, времени оборота и бюджету. Если ваш процесс зависит от строгого следования инструкциям и многосценовой логики, выбирайте MoE. Если нужен отшлифованный вывод с аудиовизуальной синхронизацией, Q3 Pro подходит лучше. В качестве альтернативы Kling V3 предоставляет ещё один высокоточный вариант для кинематографичного ИИ-видео. Если ваша главная цель — быстрая итерация или более низкая стоимость за клип, Q3 Turbo — практичный выбор.

Таблица ниже сопоставляет каждую модель с тем видом работы, который она обрабатывает лучше всего. Для тех, кто сравнивает топовые варианты, Sora 2 предлагает схожие кинематографичные возможности с синхронизированным аудио.

Модель	Лучше всего для	Сильные стороны	Компромиссы	Задержка	Цена (USD/сек)
Vidu MoE	Сложные многосценовые нарративы	Следование инструкциям, логика сцены, консистентность	Выше вычислительная стоимость, медленнее оборот	Высокая	Премиум
Vidu Q3 Pro	Кинематографичный продакшен	Качество визуала, аудиовизуальная синхронизация, генерация раскадровки	Дороже Turbo	Средняя	$0.12 ^[2]
Vidu Q3 Turbo	Быстрая итерация и пакетная обработка	Скорость генерации, экономичность, более быстрое переключение сцен	Чуть ниже визуальная детализация	Низкая	$0.048 ^[3]

Далее посмотрим, как выбрать модель, аутентифицироваться и отправить запрос через APIMart.

Как получить доступ к Vidu через APIMart

GccAi

Настройка аккаунта, аутентификация и работа с API-ключами

После выбора модели вы можете отправлять задачи через APIMart с одним API-ключом. Сначала создайте аккаунт APIMart и сгенерируйте ключ на странице управления API-ключами в дашборде ^[2]^[3].

Отправляйте каждый запрос с Bearer-токеном в заголовке Authorization:

Authorization: Bearer YOUR_API_KEY

Для хранения держите ключи в переменных окружения или менеджере секретов вроде AWS Secrets Manager или GCP Secret Manager. Также полезно использовать отдельные ключи для разработки, staging и production. Если ключ скомпрометирован, немедленно ротируйте его. Делайте то же самое по установленному графику. И когда логируете запросы, сохраняйте только task_id — никогда сам токен ^[5].

Поиск моделей Vidu, цен и схемы входа в APIMart

Войдя в систему, проверьте каталог, прежде чем что-либо отправлять. Именно там можно подтвердить названия моделей, поддерживаемые входы и текущие цены. В каталоге APIMart модели Vidu перечислены в разделе Video Generation. Там же можно найти другие высокопроизводительные модели вроде MiniMax-Hailuo-02. Используйте эту страницу для сравнения схемы входа, разрешения и стоимости за секунду между MoE, Q3 Pro и Q3 Turbo ^[2]^[3].

Основные поля, за которыми стоит следить:

model
prompt
duration
resolution
aspect_ratio

Для задач text-to-video используйте aspect_ratio. Для задач на основе изображений система вместо этого использует соотношение исходного изображения ^[2]. Текстовые промпты ограничены 2000 символами ^[2]^[3].

Эндпоинты, структура запроса и обработка async-задач

После выбора модели отправьте запрос на генерацию и отслеживайте async-задачу по возвращённому task_id. Отправьте POST-запрос на https://api.apimart.ai/v1/videos/generations, затем опрашивайте статус задачи через GET https://api.apimart.ai/v1/tasks/{task_id} ^[2]^[5].

Задачи проходят через эти состояния:

submitted
queueing
processing
success или failed

Если хотите, чтобы APIMart уведомлял ваше приложение по завершении задачи, добавьте callback_url и получайте результат через вебхук ^[5]. Как только задача достигает success, скачивайте файл сразу же. Оттуда можно сопоставить поля запроса либо с потоком text-to-video, либо с потоком на основе референсов.

Пошаговая интеграция для text-to-video и видео на основе референсов

Базовый поток text-to-video с выбором модели

После выбора модели из каталога поток text-to-video довольно прост. Отправляйте API-ключ со стороны сервера в заголовке Authorization как Bearer {your_api_key}.

Вот минимальный payload для задачи text-to-video с viduq3-pro:

{
  "model": "viduq3-pro",
  "prompt": "A red fox running through a snowy forest at dusk, cinematic slow motion",
  "duration": 8,
  "resolution": "720p",
  "aspect_ratio": "16:9",
  "audio": true
}

Ответ включает task_id и статус вроде submitted, queueing или processing. После этого можно либо опрашивать GET /v1/tasks/{task_id} с возвращённым task_id, либо передать callback_url в запросе, чтобы платформа уведомила ваше приложение, когда задача достигнет success или failed ^[1]^[7]^[10]. Если хотите переключиться на viduq3-turbo, в основном вы просто меняете поле model.

Async-паттерн остаётся одинаковым во всех режимах. Меняются входные поля.

Добавление изображений или референсных входов и расширенные настройки

Для image-to-video передайте один URL изображения в массиве image_urls. Используйте 0 изображений для text-to-video, 1 для image-to-video и 2 для режима первый-последний кадр ^[2]. В режимах на основе изображений соотношение сторон вывода берётся из исходного изображения, поэтому можно опустить aspect_ratio ^[2]. Если вы загружаете файлы напрямую вместо использования URL, держите каждое изображение в формате PNG, JPEG или WebP, менее 50 МБ, и держите общий HTTP-body менее 20 МБ ^[9]^[8].

Для генерации на основе референсов используйте эндпоинт /reference2video с массивом subjects. Определите каждый субъект через name и его images, затем вызовите его в промпте через @subjectname. Модели Q3 допускают до 7 референсных изображений или текстовых описаний в функции subjects ^[6]. Если используете режим первый-последний кадр, держите оба изображения близкими по соотношению сторон, в идеале в пределах отношения от 0,8 до 1,25, чтобы снизить число сбоев ^[8]. Когда задействованы лица или руки, держите промпты движения сдержанными, чтобы сократить артефакты искажения ^[5].

Таблица ниже показывает основные параметры для обоих потоков:

Параметр	Тип	Допустимый диапазон / Варианты	Применяется к
`model`	String	`viduq3-pro`, `viduq3-turbo`	Все
`prompt`	String	Макс. 2000 символов	Все (обязателен для text-to-video; опционален для image-to-video)
`duration`	Integer	1–16с	Все
`resolution`	String	`540p`, `720p`, `1080p`	Все
`aspect_ratio`	String	`16:9`, `9:16`, `4:3`, `3:4`, `1:1`	Только text-to-video
`audio`	Boolean	`true`, `false`	По умолчанию `true` для Q3
`seed`	Integer	`-1` до `4,294,967,295`	Все
`off_peak`	Boolean	`true`, `false`	Все
`callback_url`	String	Опциональный URL вебхука для обновлений статуса	Все

Задайте фиксированный seed во время тестирования, если хотите одинаковый визуальный результат между прогонами ^[2]^[9]. Для несрочных пакетных задач установите off_peak в true. Такие задачи обычно завершаются в течение 48 часов и используют меньше кредитов ^[1]^[6].

Отслеживание использования, стоимости и надёжности в продакшене

Когда ваш запрос работает, следующая задача — держать стоимость и надёжность под контролем в продакшене.

Логируйте task_id и временную метку для каждого запроса. Это даёт безопасный способ отладки без хранения чувствительных учётных данных ^[5]. Также полезно отслеживать время в очереди и время генерации отдельно, чтобы отличать задержку платформы от задержки модели.

Для оценки стоимости Vidu Q3 Pro при 720p стоит около $0.12 за секунду на APIMart, а Q3 Turbo стоит около $0.048 за секунду ^[3]. Настройте автоматические оповещения при 50%, 80% и 100% месячного бюджетного лимита, чтобы расходы не вышли из-под контроля ^[5].

Повторы тоже важны. При ошибках 5xx используйте экспоненциальную задержку: повторяйте через 2 секунды, затем 5 секунд, затем 15 секунд, прежде чем показать ошибку пользователю ^[5]. Модели серии Vidu Q3 поставляются с SLA 99,9% для продакшен-нагрузок ^[3], но кратковременные сбои всё же случаются, поэтому повторы должны быть частью любой рабочей сборки.

Чек-лист выбора модели и ключевые выводы

Чек-лист сценариев для разработчиков, креаторов и продуктовых команд

Выбирайте на основе трёх вещей: сложности промпта, скорости и качества вывода. Таблица ниже превращает сравнение моделей в практический выбор для выпуска.

Сценарий	Лучшая модель	Почему
Многосценовая реклама, раскадровки, сложные промпты	Vidu MoE (`viduq3-mix`)	Лучше для промптов с обилием инструкций и умных переходов сцен
Финальные брендовые промо, отшлифованные визуалы продуктов	Vidu Q3 Pro (`viduq3-pro`)	Высокоточный, кинематографичный вывод 1080p; ~$0.12/сек при 720p ^[3]
Быстрое прототипирование, черновики и короткие клипы	Vidu Q3 Turbo (`viduq3-turbo`)	Лучше для быстрой, высокообъёмной итерации; ~$0.048/сек при 720p ^[3]
Консистентность персонажа между референсами	Vidu Q3 Pro (`viduq3-pro`)	Поддерживает до 7 референсных изображений и требует входного изображения ^[6]^[8]

После выбора строки сохраняйте ту же схему запроса из раздела об интеграции. Проще говоря: начинайте идеи в Q3 Turbo, затем переводите финальный рендер 1080p в Q3 Pro. Это простой процесс, и он помогает двигаться быстро, не тратя больше, чем нужно.

Для клипов, где важнее всего точность движения, целитесь в 5–10 секунд, а не тянитесь к максимуму в 16 секунд. Более короткие клипы часто дают более точное движение и меньше головной боли.

Ключевые моменты для запоминания перед выпуском

MoE — выбор для сложной многосценовой логики. Q3 Pro даёт высокоточный, кинематографичный вывод 1080p ^[3]. Q3 Turbo — более дешёвый вариант за $0.048/сек при 720p ^[3].

На APIMart переключение между этими моделями — это просто изменение одного параметра model. Всё остальное в запросе остаётся прежним ^[3]. Это значит, что можно протестировать одну модель, переключиться на другую и держать работу по интеграции стабильной.

Используйте один и тот же async-поток каждый раз:

Отправьте запрос
Зафиксируйте task_id
Опросите статус или используйте callback_url

Также скачивайте сгенерированные видео вскоре после готовности. Ссылки на вывод истекают через 24 часа ^[3]^[11].

Часто задаваемые вопросы

С какой модели Vidu стоит начать?

Начните с модели, которая подходит вашим потребностям по скорости, аудио и визуальному контролю.

viduq3-pro: лучше всего для аудиовизуальной синхронизации и сегментации кадров
viduq3-turbo: более быстрая генерация, чем версия pro
viduq1 или viduq2: надёжные варианты для стабильного видеопродакшена и предсказуемого движения камеры

Как отслеживать видеозадачу после отправки?

Вы можете отслеживать задачу генерации видео двумя способами.

Для продакшена лучший вариант — включить callback_url в исходный запрос. Когда вы это делаете, API Vidu отправляет обновления задачи и метаданные результата прямо на ваш URL автоматически. Это значит, что вам не нужно постоянно самостоятельно проверять статус задачи.

Другой вариант — опрашивать API статуса с помощью task_id, который вы получаете после отправки. Как только состояние задачи меняется на success, ответ будет включать URL для скачивания видео и другие связанные метаданные.

Какие входы и ограничения стоит знать перед интеграцией?

Перед интеграцией Vidu API убедитесь, что ваши входы укладываются в эти ограничения:

Изображения: только PNG, JPEG, JPG или WebP; каждый файл должен быть менее 50 МБ и не менее 128×128 пикселей
Общий HTTP-body запроса: максимум 20 МБ
Текстовые промпты: до 5000 символов
Данные passthrough в payload: до 1 048 576 символов

Лимиты длительности зависят от используемой модели. Q3 поддерживает 1–16 секунд, Q2 поддерживает 1–10 секунд, а Q1 поддерживает 5 секунд.

Также держите свои API-ключи в безопасности. Не раскрывайте их в клиентском коде. Отправляйте запросы через серверного посредника.

Готовы попробовать?