
Гид по Vidu API: модель MoE и серия Q
Доступ к Vidu MoE, Q3 Pro и Q3 Turbo через один ключ APIMart. Сравните модели, цены от $0.048/сек и async-поток API для text- и image-to-video.
Если кратко в одну строку: используйте Vidu MoE для более сложной логики промптов, Q3 Pro для финального вывода и Q3 Turbo для недорогого тестирования через одну настройку APIMart.
Вот краткая версия, которой можно сразу воспользоваться:
- Я могу получить доступ к Vidu MoE, Vidu Q3 Pro и Vidu Q3 Turbo через APIMart с одним API-ключом и одним основным потоком запросов.
- Основной эндпоинт —
POST https://api.apimart.ai/v1/videos/generations. - Видеозадачи асинхронны, поэтому я сначала получаю
task_id, затем опрашиваюGET /v1/tasks/{task_id}или используюcallback_url. - Vidu поддерживает:
- text-to-video
- image-to-video
- видео на основе референсов
- переходы первый-последний кадр
- Модели Q3 добавляют встроенное аудио: диалоги, звуковые эффекты и музыку.
- Клипы могут длиться до 16 секунд, с выводом 540p, 720p или 1080p.
- Цены APIMart в статье указывают:
- Q3 Pro: около $0.12/сек при 720p
- Q3 Turbo: около $0.048/сек при 720p
- Ссылки на вывод истекают через 24 часа, поэтому файлы стоит скачивать вскоре после успеха.

Краткое сравнение
| Модель | Лучшее применение | Главный плюс | Главный компромисс | Цена в статье |
|---|---|---|---|---|
| Vidu MoE | Более сложные многосценовые промпты | Лучший контроль промпта и логика сцены | Медленнее и дороже | Премиум |
| Vidu Q3 Pro | Финальные видео | Более высокое качество, 1080p, синхронизация аудио и видео | Дороже Turbo | $0.12/сек |
| Vidu Q3 Turbo | Тесты, черновики, пакетная работа | Ниже стоимость и меньше время ожидания | Меньше визуальных деталей, чем у Pro | $0.048/сек |
Что мне бросается в глаза — насколько прост переход: в большинстве случаев я просто меняю поле model и оставляю остальную настройку прежней. Это делает статью не столько о настройке, сколько о выборе правильной модели по стоимости, времени ожидания и качеству вывода.
Модели Vidu объяснены: MoE против серии Q

Модель MoE от Vidu: что это и когда её использовать
Модель MoE (Mixture of Experts) отправляет разные части задачи генерации специализированным экспертам по движению, консистентности сцены и контролю промпта. Она имеет наибольший смысл для многосценовых или более длинных промптов, где консистентность важнее чистой скорости.
Однако есть нюанс. MoE требует больше вычислений и имеет более медленный оборот, чем серия Q [7]. Для простых промптов она часто больше, чем нужно.
Серия Vidu Q и Vidu Q3 Pro: производительность для продакшена
Если MoE — это специалист, то серия Q — вариант, созданный для продакшен-работы. Vidu Q3 Pro разработан для отшлифованного кинематографичного вывода и видео на основе раскадровки [7]. Он поддерживает видео 1080p, клипы до 16 секунд и генерацию аудио-видео с синхронизированными диалогами и звуковыми эффектами [1][2][4]. На APIMart Q3 Pro начинается с $0.12 за секунду [2][3].
Vidu Q3 Turbo склоняется больше к скорости и более низкой стоимости, с более быстрым переключением сцен [6][7]. На APIMart Q3 Turbo начинается с $0.048 за секунду [3].
Как выбирать между MoE и серией Q для вашего процесса
Этот выбор в основном сводится к сложности промпта, времени оборота и бюджету. Если ваш процесс зависит от строгого следования инструкциям и многосценовой логики, выбирайте MoE. Если нужен отшлифованный вывод с аудиовизуальной синхронизацией, Q3 Pro подходит лучше. В качестве альтернативы Kling V3 предоставляет ещё один высокоточный вариант для кинематографичного ИИ-видео. Если ваша главная цель — быстрая итерация или более низкая стоимость за клип, Q3 Turbo — практичный выбор.
Таблица ниже сопоставляет каждую модель с тем видом работы, который она обрабатывает лучше всего. Для тех, кто сравнивает топовые варианты, Sora 2 предлагает схожие кинематографичные возможности с синхронизированным аудио.
| Модель | Лучше всего для | Сильные стороны | Компромиссы | Задержка | Цена (USD/сек) |
|---|---|---|---|---|---|
| Vidu MoE | Сложные многосценовые нарративы | Следование инструкциям, логика сцены, консистентность | Выше вычислительная стоимость, медленнее оборот | Высокая | Премиум |
| Vidu Q3 Pro | Кинематографичный продакшен | Качество визуала, аудиовизуальная синхронизация, генерация раскадровки | Дороже Turbo | Средняя | $0.12 [2] |
| Vidu Q3 Turbo | Быстрая итерация и пакетная обработка | Скорость генерации, экономичность, более быстрое переключение сцен | Чуть ниже визуальная детализация | Низкая | $0.048 [3] |
Далее посмотрим, как выбрать модель, аутентифицироваться и отправить запрос через APIMart.
Как получить доступ к Vidu через APIMart

Настройка аккаунта, аутентификация и работа с API-ключами
После выбора модели вы можете отправлять задачи через APIMart с одним API-ключом. Сначала создайте аккаунт APIMart и сгенерируйте ключ на странице управления API-ключами в дашборде [2][3].
Отправляйте каждый запрос с Bearer-токеном в заголовке Authorization:
Authorization: Bearer YOUR_API_KEY
Для хранения держите ключи в переменных окружения или менеджере секретов вроде AWS Secrets Manager или GCP Secret Manager. Также полезно использовать отдельные ключи для разработки, staging и production. Если ключ скомпрометирован, немедленно ротируйте его. Делайте то же самое по установленному графику. И когда логируете запросы, сохраняйте только task_id — никогда сам токен [5].
Поиск моделей Vidu, цен и схемы входа в APIMart
Войдя в систему, проверьте каталог, прежде чем что-либо отправлять. Именно там можно подтвердить названия моделей, поддерживаемые входы и текущие цены. В каталоге APIMart модели Vidu перечислены в разделе Video Generation. Там же можно найти другие высокопроизводительные модели вроде MiniMax-Hailuo-02. Используйте эту страницу для сравнения схемы входа, разрешения и стоимости за секунду между MoE, Q3 Pro и Q3 Turbo [2][3].
Основные поля, за которыми стоит следить:
modelpromptdurationresolutionaspect_ratio
Для задач text-to-video используйте aspect_ratio. Для задач на основе изображений система вместо этого использует соотношение исходного изображения [2]. Текстовые промпты ограничены 2000 символами [2][3].
Эндпоинты, структура запроса и обработка async-задач
После выбора модели отправьте запрос на генерацию и отслеживайте async-задачу по возвращённому task_id. Отправьте POST-запрос на https://api.apimart.ai/v1/videos/generations, затем опрашивайте статус задачи через GET https://api.apimart.ai/v1/tasks/{task_id} [2][5].
Задачи проходят через эти состояния:
submittedqueueingprocessingsuccessилиfailed
Если хотите, чтобы APIMart уведомлял ваше приложение по завершении задачи, добавьте callback_url и получайте результат через вебхук [5]. Как только задача достигает success, скачивайте файл сразу же. Оттуда можно сопоставить поля запроса либо с потоком text-to-video, либо с потоком на основе референсов.
Пошаговая интеграция для text-to-video и видео на основе референсов
Базовый поток text-to-video с выбором модели
После выбора модели из каталога поток text-to-video довольно прост. Отправляйте API-ключ со стороны сервера в заголовке Authorization как Bearer {your_api_key}.
Вот минимальный payload для задачи text-to-video с viduq3-pro:
{
"model": "viduq3-pro",
"prompt": "A red fox running through a snowy forest at dusk, cinematic slow motion",
"duration": 8,
"resolution": "720p",
"aspect_ratio": "16:9",
"audio": true
}
Ответ включает task_id и статус вроде submitted, queueing или processing. После этого можно либо опрашивать GET /v1/tasks/{task_id} с возвращённым task_id, либо передать callback_url в запросе, чтобы платформа уведомила ваше приложение, когда задача достигнет success или failed [1][7][10]. Если хотите переключиться на viduq3-turbo, в основном вы просто меняете поле model.
Async-паттерн остаётся одинаковым во всех режимах. Меняются входные поля.
Добавление изображений или референсных входов и расширенные настройки
Для image-to-video передайте один URL изображения в массиве image_urls. Используйте 0 изображений для text-to-video, 1 для image-to-video и 2 для режима первый-последний кадр [2]. В режимах на основе изображений соотношение сторон вывода берётся из исходного изображения, поэтому можно опустить aspect_ratio [2]. Если вы загружаете файлы напрямую вместо использования URL, держите каждое изображение в формате PNG, JPEG или WebP, менее 50 МБ, и держите общий HTTP-body менее 20 МБ [9][8].
Для генерации на основе референсов используйте эндпоинт /reference2video с массивом subjects. Определите каждый субъект через name и его images, затем вызовите его в промпте через @subjectname. Модели Q3 допускают до 7 референсных изображений или текстовых описаний в функции subjects [6]. Если используете режим первый-последний кадр, держите оба изображения близкими по соотношению сторон, в идеале в пределах отношения от 0,8 до 1,25, чтобы снизить число сбоев [8]. Когда задействованы лица или руки, держите промпты движения сдержанными, чтобы сократить артефакты искажения [5].
Таблица ниже показывает основные параметры для обоих потоков:
| Параметр | Тип | Допустимый диапазон / Варианты | Применяется к |
|---|---|---|---|
model | String | viduq3-pro, viduq3-turbo | Все |
prompt | String | Макс. 2000 символов | Все (обязателен для text-to-video; опционален для image-to-video) |
duration | Integer | 1–16с | Все |
resolution | String | 540p, 720p, 1080p | Все |
aspect_ratio | String | 16:9, 9:16, 4:3, 3:4, 1:1 | Только text-to-video |
audio | Boolean | true, false | По умолчанию true для Q3 |
seed | Integer | -1 до 4,294,967,295 | Все |
off_peak | Boolean | true, false | Все |
callback_url | String | Опциональный URL вебхука для обновлений статуса | Все |
Задайте фиксированный seed во время тестирования, если хотите одинаковый визуальный результат между прогонами [2][9]. Для несрочных пакетных задач установите off_peak в true. Такие задачи обычно завершаются в течение 48 часов и используют меньше кредитов [1][6].
Отслеживание использования, стоимости и надёжности в продакшене
Когда ваш запрос работает, следующая задача — держать стоимость и надёжность под контролем в продакшене.
Логируйте task_id и временную метку для каждого запроса. Это даёт безопасный способ отладки без хранения чувствительных учётных данных [5]. Также полезно отслеживать время в очереди и время генерации отдельно, чтобы отличать задержку платформы от задержки модели.
Для оценки стоимости Vidu Q3 Pro при 720p стоит около $0.12 за секунду на APIMart, а Q3 Turbo стоит около $0.048 за секунду [3]. Настройте автоматические оповещения при 50%, 80% и 100% месячного бюджетного лимита, чтобы расходы не вышли из-под контроля [5].
Повторы тоже важны. При ошибках 5xx используйте экспоненциальную задержку: повторяйте через 2 секунды, затем 5 секунд, затем 15 секунд, прежде чем показать ошибку пользователю [5]. Модели серии Vidu Q3 поставляются с SLA 99,9% для продакшен-нагрузок [3], но кратковременные сбои всё же случаются, поэтому повторы должны быть частью любой рабочей сборки.
Чек-лист выбора модели и ключевые выводы
Чек-лист сценариев для разработчиков, креаторов и продуктовых команд
Выбирайте на основе трёх вещей: сложности промпта, скорости и качества вывода. Таблица ниже превращает сравнение моделей в практический выбор для выпуска.
| Сценарий | Лучшая модель | Почему |
|---|---|---|
| Многосценовая реклама, раскадровки, сложные промпты | Vidu MoE (viduq3-mix) | Лучше для промптов с обилием инструкций и умных переходов сцен |
| Финальные брендовые промо, отшлифованные визуалы продуктов | Vidu Q3 Pro (viduq3-pro) | Высокоточный, кинематографичный вывод 1080p; ~$0.12/сек при 720p [3] |
| Быстрое прототипирование, черновики и короткие клипы | Vidu Q3 Turbo (viduq3-turbo) | Лучше для быстрой, высокообъёмной итерации; ~$0.048/сек при 720p [3] |
| Консистентность персонажа между референсами | Vidu Q3 Pro (viduq3-pro) | Поддерживает до 7 референсных изображений и требует входного изображения [6][8] |
После выбора строки сохраняйте ту же схему запроса из раздела об интеграции. Проще говоря: начинайте идеи в Q3 Turbo, затем переводите финальный рендер 1080p в Q3 Pro. Это простой процесс, и он помогает двигаться быстро, не тратя больше, чем нужно.
Для клипов, где важнее всего точность движения, целитесь в 5–10 секунд, а не тянитесь к максимуму в 16 секунд. Более короткие клипы часто дают более точное движение и меньше головной боли.
Ключевые моменты для запоминания перед выпуском
MoE — выбор для сложной многосценовой логики. Q3 Pro даёт высокоточный, кинематографичный вывод 1080p [3]. Q3 Turbo — более дешёвый вариант за $0.048/сек при 720p [3].
На APIMart переключение между этими моделями — это просто изменение одного параметра model. Всё остальное в запросе остаётся прежним [3]. Это значит, что можно протестировать одну модель, переключиться на другую и держать работу по интеграции стабильной.
Используйте один и тот же async-поток каждый раз:
- Отправьте запрос
- Зафиксируйте
task_id - Опросите статус или используйте
callback_url
Также скачивайте сгенерированные видео вскоре после готовности. Ссылки на вывод истекают через 24 часа [3][11].
Часто задаваемые вопросы
С какой модели Vidu стоит начать?
Начните с модели, которая подходит вашим потребностям по скорости, аудио и визуальному контролю.
- viduq3-pro: лучше всего для аудиовизуальной синхронизации и сегментации кадров
- viduq3-turbo: более быстрая генерация, чем версия pro
- viduq1 или viduq2: надёжные варианты для стабильного видеопродакшена и предсказуемого движения камеры
Как отслеживать видеозадачу после отправки?
Вы можете отслеживать задачу генерации видео двумя способами.
Для продакшена лучший вариант — включить callback_url в исходный запрос. Когда вы это делаете, API Vidu отправляет обновления задачи и метаданные результата прямо на ваш URL автоматически. Это значит, что вам не нужно постоянно самостоятельно проверять статус задачи.
Другой вариант — опрашивать API статуса с помощью task_id, который вы получаете после отправки. Как только состояние задачи меняется на success, ответ будет включать URL для скачивания видео и другие связанные метаданные.
Какие входы и ограничения стоит знать перед интеграцией?
Перед интеграцией Vidu API убедитесь, что ваши входы укладываются в эти ограничения:
- Изображения: только PNG, JPEG, JPG или WebP; каждый файл должен быть менее 50 МБ и не менее 128×128 пикселей
- Общий HTTP-body запроса: максимум 20 МБ
- Текстовые промпты: до 5000 символов
- Данные passthrough в payload: до 1 048 576 символов
Лимиты длительности зависят от используемой модели. Q3 поддерживает 1–16 секунд, Q2 поддерживает 1–10 секунд, а Q1 поддерживает 5 секунд.
Также держите свои API-ключи в безопасности. Не раскрывайте их в клиентском коде. Отправляйте запросы через серверного посредника.