Apimart
Гид по Vidu API: модель MoE и серия Q

Гид по Vidu API: модель MoE и серия Q

Доступ к Vidu MoE, Q3 Pro и Q3 Turbo через один ключ APIMart. Сравните модели, цены от $0.048/сек и async-поток API для text- и image-to-video.

Туториал

Если кратко в одну строку: используйте Vidu MoE для более сложной логики промптов, Q3 Pro для финального вывода и Q3 Turbo для недорогого тестирования через одну настройку APIMart.

Вот краткая версия, которой можно сразу воспользоваться:

  • Я могу получить доступ к Vidu MoE, Vidu Q3 Pro и Vidu Q3 Turbo через APIMart с одним API-ключом и одним основным потоком запросов.
  • Основной эндпоинт — POST https://api.apimart.ai/v1/videos/generations.
  • Видеозадачи асинхронны, поэтому я сначала получаю task_id, затем опрашиваю GET /v1/tasks/{task_id} или использую callback_url.
  • Vidu поддерживает:
    • text-to-video
    • image-to-video
    • видео на основе референсов
    • переходы первый-последний кадр
  • Модели Q3 добавляют встроенное аудио: диалоги, звуковые эффекты и музыку.
  • Клипы могут длиться до 16 секунд, с выводом 540p, 720p или 1080p.
  • Цены APIMart в статье указывают:
    • Q3 Pro: около $0.12/сек при 720p
    • Q3 Turbo: около $0.048/сек при 720p
  • Ссылки на вывод истекают через 24 часа, поэтому файлы стоит скачивать вскоре после успеха.
Сравнение моделей Vidu API: MoE против Q3 Pro против Q3 Turbo
Сравнение моделей Vidu API: MoE против Q3 Pro против Q3 Turbo

Краткое сравнение

МодельЛучшее применениеГлавный плюсГлавный компромиссЦена в статье
Vidu MoEБолее сложные многосценовые промптыЛучший контроль промпта и логика сценыМедленнее и дорожеПремиум
Vidu Q3 ProФинальные видеоБолее высокое качество, 1080p, синхронизация аудио и видеоДороже Turbo$0.12/сек
Vidu Q3 TurboТесты, черновики, пакетная работаНиже стоимость и меньше время ожиданияМеньше визуальных деталей, чем у Pro$0.048/сек

Что мне бросается в глаза — насколько прост переход: в большинстве случаев я просто меняю поле model и оставляю остальную настройку прежней. Это делает статью не столько о настройке, сколько о выборе правильной модели по стоимости, времени ожидания и качеству вывода.

Модели Vidu объяснены: MoE против серии Q

Vidu

Модель MoE от Vidu: что это и когда её использовать

Модель MoE (Mixture of Experts) отправляет разные части задачи генерации специализированным экспертам по движению, консистентности сцены и контролю промпта. Она имеет наибольший смысл для многосценовых или более длинных промптов, где консистентность важнее чистой скорости.

Однако есть нюанс. MoE требует больше вычислений и имеет более медленный оборот, чем серия Q [7]. Для простых промптов она часто больше, чем нужно.

Серия Vidu Q и Vidu Q3 Pro: производительность для продакшена

Если MoE — это специалист, то серия Q — вариант, созданный для продакшен-работы. Vidu Q3 Pro разработан для отшлифованного кинематографичного вывода и видео на основе раскадровки [7]. Он поддерживает видео 1080p, клипы до 16 секунд и генерацию аудио-видео с синхронизированными диалогами и звуковыми эффектами [1][2][4]. На APIMart Q3 Pro начинается с $0.12 за секунду [2][3].

Vidu Q3 Turbo склоняется больше к скорости и более низкой стоимости, с более быстрым переключением сцен [6][7]. На APIMart Q3 Turbo начинается с $0.048 за секунду [3].

Как выбирать между MoE и серией Q для вашего процесса

Этот выбор в основном сводится к сложности промпта, времени оборота и бюджету. Если ваш процесс зависит от строгого следования инструкциям и многосценовой логики, выбирайте MoE. Если нужен отшлифованный вывод с аудиовизуальной синхронизацией, Q3 Pro подходит лучше. В качестве альтернативы Kling V3 предоставляет ещё один высокоточный вариант для кинематографичного ИИ-видео. Если ваша главная цель — быстрая итерация или более низкая стоимость за клип, Q3 Turbo — практичный выбор.

Таблица ниже сопоставляет каждую модель с тем видом работы, который она обрабатывает лучше всего. Для тех, кто сравнивает топовые варианты, Sora 2 предлагает схожие кинематографичные возможности с синхронизированным аудио.

МодельЛучше всего дляСильные стороныКомпромиссыЗадержкаЦена (USD/сек)
Vidu MoEСложные многосценовые нарративыСледование инструкциям, логика сцены, консистентностьВыше вычислительная стоимость, медленнее оборотВысокаяПремиум
Vidu Q3 ProКинематографичный продакшенКачество визуала, аудиовизуальная синхронизация, генерация раскадровкиДороже TurboСредняя$0.12 [2]
Vidu Q3 TurboБыстрая итерация и пакетная обработкаСкорость генерации, экономичность, более быстрое переключение сценЧуть ниже визуальная детализацияНизкая$0.048 [3]

Далее посмотрим, как выбрать модель, аутентифицироваться и отправить запрос через APIMart.

Как получить доступ к Vidu через APIMart

GccAi

Настройка аккаунта, аутентификация и работа с API-ключами

После выбора модели вы можете отправлять задачи через APIMart с одним API-ключом. Сначала создайте аккаунт APIMart и сгенерируйте ключ на странице управления API-ключами в дашборде [2][3].

Отправляйте каждый запрос с Bearer-токеном в заголовке Authorization:

Authorization: Bearer YOUR_API_KEY

Для хранения держите ключи в переменных окружения или менеджере секретов вроде AWS Secrets Manager или GCP Secret Manager. Также полезно использовать отдельные ключи для разработки, staging и production. Если ключ скомпрометирован, немедленно ротируйте его. Делайте то же самое по установленному графику. И когда логируете запросы, сохраняйте только task_id — никогда сам токен [5].

Поиск моделей Vidu, цен и схемы входа в APIMart

Войдя в систему, проверьте каталог, прежде чем что-либо отправлять. Именно там можно подтвердить названия моделей, поддерживаемые входы и текущие цены. В каталоге APIMart модели Vidu перечислены в разделе Video Generation. Там же можно найти другие высокопроизводительные модели вроде MiniMax-Hailuo-02. Используйте эту страницу для сравнения схемы входа, разрешения и стоимости за секунду между MoE, Q3 Pro и Q3 Turbo [2][3].

Основные поля, за которыми стоит следить:

  • model
  • prompt
  • duration
  • resolution
  • aspect_ratio

Для задач text-to-video используйте aspect_ratio. Для задач на основе изображений система вместо этого использует соотношение исходного изображения [2]. Текстовые промпты ограничены 2000 символами [2][3].

Эндпоинты, структура запроса и обработка async-задач

После выбора модели отправьте запрос на генерацию и отслеживайте async-задачу по возвращённому task_id. Отправьте POST-запрос на https://api.apimart.ai/v1/videos/generations, затем опрашивайте статус задачи через GET https://api.apimart.ai/v1/tasks/{task_id} [2][5].

Задачи проходят через эти состояния:

  • submitted
  • queueing
  • processing
  • success или failed

Если хотите, чтобы APIMart уведомлял ваше приложение по завершении задачи, добавьте callback_url и получайте результат через вебхук [5]. Как только задача достигает success, скачивайте файл сразу же. Оттуда можно сопоставить поля запроса либо с потоком text-to-video, либо с потоком на основе референсов.

Пошаговая интеграция для text-to-video и видео на основе референсов

Базовый поток text-to-video с выбором модели

После выбора модели из каталога поток text-to-video довольно прост. Отправляйте API-ключ со стороны сервера в заголовке Authorization как Bearer {your_api_key}.

Вот минимальный payload для задачи text-to-video с viduq3-pro:

{
  "model": "viduq3-pro",
  "prompt": "A red fox running through a snowy forest at dusk, cinematic slow motion",
  "duration": 8,
  "resolution": "720p",
  "aspect_ratio": "16:9",
  "audio": true
}

Ответ включает task_id и статус вроде submitted, queueing или processing. После этого можно либо опрашивать GET /v1/tasks/{task_id} с возвращённым task_id, либо передать callback_url в запросе, чтобы платформа уведомила ваше приложение, когда задача достигнет success или failed [1][7][10]. Если хотите переключиться на viduq3-turbo, в основном вы просто меняете поле model.

Async-паттерн остаётся одинаковым во всех режимах. Меняются входные поля.

Добавление изображений или референсных входов и расширенные настройки

Для image-to-video передайте один URL изображения в массиве image_urls. Используйте 0 изображений для text-to-video, 1 для image-to-video и 2 для режима первый-последний кадр [2]. В режимах на основе изображений соотношение сторон вывода берётся из исходного изображения, поэтому можно опустить aspect_ratio [2]. Если вы загружаете файлы напрямую вместо использования URL, держите каждое изображение в формате PNG, JPEG или WebP, менее 50 МБ, и держите общий HTTP-body менее 20 МБ [9][8].

Для генерации на основе референсов используйте эндпоинт /reference2video с массивом subjects. Определите каждый субъект через name и его images, затем вызовите его в промпте через @subjectname. Модели Q3 допускают до 7 референсных изображений или текстовых описаний в функции subjects [6]. Если используете режим первый-последний кадр, держите оба изображения близкими по соотношению сторон, в идеале в пределах отношения от 0,8 до 1,25, чтобы снизить число сбоев [8]. Когда задействованы лица или руки, держите промпты движения сдержанными, чтобы сократить артефакты искажения [5].

Таблица ниже показывает основные параметры для обоих потоков:

ПараметрТипДопустимый диапазон / ВариантыПрименяется к
modelStringviduq3-pro, viduq3-turboВсе
promptStringМакс. 2000 символовВсе (обязателен для text-to-video; опционален для image-to-video)
durationInteger1–16сВсе
resolutionString540p, 720p, 1080pВсе
aspect_ratioString16:9, 9:16, 4:3, 3:4, 1:1Только text-to-video
audioBooleantrue, falseПо умолчанию true для Q3
seedInteger-1 до 4,294,967,295Все
off_peakBooleantrue, falseВсе
callback_urlStringОпциональный URL вебхука для обновлений статусаВсе

Задайте фиксированный seed во время тестирования, если хотите одинаковый визуальный результат между прогонами [2][9]. Для несрочных пакетных задач установите off_peak в true. Такие задачи обычно завершаются в течение 48 часов и используют меньше кредитов [1][6].

Отслеживание использования, стоимости и надёжности в продакшене

Когда ваш запрос работает, следующая задача — держать стоимость и надёжность под контролем в продакшене.

Логируйте task_id и временную метку для каждого запроса. Это даёт безопасный способ отладки без хранения чувствительных учётных данных [5]. Также полезно отслеживать время в очереди и время генерации отдельно, чтобы отличать задержку платформы от задержки модели.

Для оценки стоимости Vidu Q3 Pro при 720p стоит около $0.12 за секунду на APIMart, а Q3 Turbo стоит около $0.048 за секунду [3]. Настройте автоматические оповещения при 50%, 80% и 100% месячного бюджетного лимита, чтобы расходы не вышли из-под контроля [5].

Повторы тоже важны. При ошибках 5xx используйте экспоненциальную задержку: повторяйте через 2 секунды, затем 5 секунд, затем 15 секунд, прежде чем показать ошибку пользователю [5]. Модели серии Vidu Q3 поставляются с SLA 99,9% для продакшен-нагрузок [3], но кратковременные сбои всё же случаются, поэтому повторы должны быть частью любой рабочей сборки.

Чек-лист выбора модели и ключевые выводы

Чек-лист сценариев для разработчиков, креаторов и продуктовых команд

Выбирайте на основе трёх вещей: сложности промпта, скорости и качества вывода. Таблица ниже превращает сравнение моделей в практический выбор для выпуска.

СценарийЛучшая модельПочему
Многосценовая реклама, раскадровки, сложные промптыVidu MoE (viduq3-mix)Лучше для промптов с обилием инструкций и умных переходов сцен
Финальные брендовые промо, отшлифованные визуалы продуктовVidu Q3 Pro (viduq3-pro)Высокоточный, кинематографичный вывод 1080p; ~$0.12/сек при 720p [3]
Быстрое прототипирование, черновики и короткие клипыVidu Q3 Turbo (viduq3-turbo)Лучше для быстрой, высокообъёмной итерации; ~$0.048/сек при 720p [3]
Консистентность персонажа между референсамиVidu Q3 Pro (viduq3-pro)Поддерживает до 7 референсных изображений и требует входного изображения [6][8]

После выбора строки сохраняйте ту же схему запроса из раздела об интеграции. Проще говоря: начинайте идеи в Q3 Turbo, затем переводите финальный рендер 1080p в Q3 Pro. Это простой процесс, и он помогает двигаться быстро, не тратя больше, чем нужно.

Для клипов, где важнее всего точность движения, целитесь в 5–10 секунд, а не тянитесь к максимуму в 16 секунд. Более короткие клипы часто дают более точное движение и меньше головной боли.

Ключевые моменты для запоминания перед выпуском

MoE — выбор для сложной многосценовой логики. Q3 Pro даёт высокоточный, кинематографичный вывод 1080p [3]. Q3 Turbo — более дешёвый вариант за $0.048/сек при 720p [3].

На APIMart переключение между этими моделями — это просто изменение одного параметра model. Всё остальное в запросе остаётся прежним [3]. Это значит, что можно протестировать одну модель, переключиться на другую и держать работу по интеграции стабильной.

Используйте один и тот же async-поток каждый раз:

  • Отправьте запрос
  • Зафиксируйте task_id
  • Опросите статус или используйте callback_url

Также скачивайте сгенерированные видео вскоре после готовности. Ссылки на вывод истекают через 24 часа [3][11].

Часто задаваемые вопросы

С какой модели Vidu стоит начать?

Начните с модели, которая подходит вашим потребностям по скорости, аудио и визуальному контролю.

  • viduq3-pro: лучше всего для аудиовизуальной синхронизации и сегментации кадров
  • viduq3-turbo: более быстрая генерация, чем версия pro
  • viduq1 или viduq2: надёжные варианты для стабильного видеопродакшена и предсказуемого движения камеры

Как отслеживать видеозадачу после отправки?

Вы можете отслеживать задачу генерации видео двумя способами.

Для продакшена лучший вариант — включить callback_url в исходный запрос. Когда вы это делаете, API Vidu отправляет обновления задачи и метаданные результата прямо на ваш URL автоматически. Это значит, что вам не нужно постоянно самостоятельно проверять статус задачи.

Другой вариант — опрашивать API статуса с помощью task_id, который вы получаете после отправки. Как только состояние задачи меняется на success, ответ будет включать URL для скачивания видео и другие связанные метаданные.

Какие входы и ограничения стоит знать перед интеграцией?

Перед интеграцией Vidu API убедитесь, что ваши входы укладываются в эти ограничения:

  • Изображения: только PNG, JPEG, JPG или WebP; каждый файл должен быть менее 50 МБ и не менее 128×128 пикселей
  • Общий HTTP-body запроса: максимум 20 МБ
  • Текстовые промпты: до 5000 символов
  • Данные passthrough в payload: до 1 048 576 символов

Лимиты длительности зависят от используемой модели. Q3 поддерживает 1–16 секунд, Q2 поддерживает 1–10 секунд, а Q1 поддерживает 5 секунд.

Также держите свои API-ключи в безопасности. Не раскрывайте их в клиентском коде. Отправляйте запросы через серверного посредника.