Wan2.6 Генерация видео

Модель генерации видео Alibaba Cloud Wanxiang
Поддержка трёх режимов: текст-в-видео, изображение-в-видео и референсное видео (r2v)
Сервер автоматически выбирает нужную модель на основе параметров запроса
Поддержка разрешений 720p/1080p, длительность 5/10/15 секунд
Не-Flash версия всегда включает аудио в выходное видео

Важное изменение: Для повышения производительности и контроля затрат мы больше не поддерживаем передачу данных изображений в формате base64 напрямую в image_urls. Пожалуйста, сначала используйте API загрузки изображений для загрузки изображений и получения URL, а затем вызывайте этот эндпоинт.

Логика маршрутизации

Сервер автоматически выбирает модель на основе параметров запроса:

Переданные параметры	Режим
`metadata.reference_urls` (URL видео)	Референсное видео (r2v)
`image_urls` (изображение)	Изображение-в-видео (i2v)
Только `prompt`	Текст-в-видео (t2v)

Аутентификация

Authorization

string

обязательно

Все API требуют аутентификации Bearer TokenПолучите API Key на странице управления API ключамиДобавьте в заголовок запроса:

Authorization: Bearer YOUR_API_KEY

Параметры запроса

model

string

обязательно

Название модели генерации видео, фиксированное значение wan2.6

prompt

string

обязательно

Описание содержимого видеоОбязательно для режима текст-в-видео; опционально для изображение-в-видео и референсного видео (описывает желаемое движение или стиль)Пример: "Милый котенок потягивается на солнце"

image_urls

string[]

Массив URL референсных изображений (режим изображение-в-видео, поддерживает только 1 изображение)⚠️ Только формат URL (base64 больше не поддерживается)

Публично доступный URL изображения (http:// или https://)
Вы можете использовать API загрузки изображений для загрузки локальных изображений и получения URL

Пример: ["https://example.com/image.jpg"]Примечание: Нельзя использовать вместе с metadata.reference_urls

aspect_ratio

string

по умолчанию:"16:9"

Соотношение сторон видео (для режимов текст-в-видео и референсного видео)Доступные значения:

16:9 - Горизонтальный (по умолчанию)
9:16 - Вертикальный
1:1 - Квадрат
4:3 - Горизонтальный
3:4 - Вертикальный

По умолчанию: 16:9Примечание: Не поддерживается в режиме изображение-в-видео

resolution

string

по умолчанию:"1080p"

Разрешение видеоДоступные значения:

720p - Стандартное
1080p - Высокое качество (по умолчанию)

По умолчанию: 1080p480p не поддерживается. Тарификация посекундная; разные разрешения имеют разную стоимость.

duration

integer

по умолчанию:"5"

Длительность видео (секунды)Поддерживается: 5, 10, 15По умолчанию: 5

negative_prompt

string

Негативный промпт — описывает нежелательное содержимоеПример: "размытый, низкое качество, деформированный"

seed

integer

Случайное зерно для воспроизводимости результатовПример: 12345

prompt_extend

boolean

по умолчанию:"true"

Автоматическое расширение промптаПри включении система автоматически оптимизирует и обогащает ваш промпт. Включено по умолчанию — установите false для отключения.

audio

boolean

Включить аудио в видеоНе-Flash модели Wan2.6 по умолчанию генерируют видео со звуком. Установите true для явного включения.

shot_type

string

Тип съёмки (для режимов текст-в-видео и референсного видео)Доступные значения:

single - Один непрерывный план
multi - Несколько планов (кинематографический монтаж)

watermark

boolean

Добавить водяной знак Alibaba Cloud на видео

metadata

object

Расширенные параметры

Показать Показать поля metadata

reference_urls

string[]

Режим референсного видео (r2v) — массив URL референсных видеоПри наличии этого поля сервер направляет запрос к модели референсного видео (wan2.6-r2v). Модель использует эти видео для генерации нового контента с согласованными персонажами или сценами.

Каждый элемент должен быть публично доступным URL видео (http:// или https://)

Пример: ["https://cdn.example.com/ref-character.mp4"]Примечание: Нельзя использовать вместе с image_urls

Комбинации разрешений и соотношений сторон

Соотношение сторон	Описание	Размер 720p	Размер 1080p
16:9	Горизонтальный (по умолчанию)	1280×720	1920×1080
9:16	Вертикальный	720×1280	1080×1920
1:1	Квадрат	960×960	1440×1440
4:3	Горизонтальный	1088×832	1632×1248
3:4	Вертикальный	832×1088	1248×1632

Ответ

string

Уникальный идентификатор задачи для последующих запросов

object

string

Тип объекта, всегда generation.task

model

string

Использованное название модели

status

string

Статус задачи

queued - В очереди
in_progress - Обрабатывается
completed - Успешно завершена
failed - Ошибка

progress

integer

Прогресс задачи в процентах (0-100)

created_at

integer

Временная метка создания задачи (Unix timestamp)

metadata

object

Метаданные задачи

Сценарии использования

Сценарий 1: Текст-в-видео

{
  "model": "wan2.6",
  "prompt": "Милый котенок бежит по траве, солнечный день",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 5
}

Сценарий 2: Изображение-в-видео

{
  "model": "wan2.6",
  "prompt": "Кот начинает радостно бегать",
  "image_urls": ["https://example.com/cat.jpg"],
  "resolution": "1080p",
  "duration": 10
}

Сценарий 3: Референсное видео (r2v)

{
  "model": "wan2.6",
  "prompt": "Персонаж машет рукой и улыбается камере",
  "metadata": {
    "reference_urls": ["https://cdn.example.com/ref-character.mp4"]
  },
  "shot_type": "single",
  "resolution": "1080p",
  "duration": 5
}

Сценарий 4: Текст-в-видео (полные параметры)

{
  "model": "wan2.6",
  "prompt": "Золотистый ретривер бежит через поле подсолнухов",
  "negative_prompt": "размытый, низкое качество, деформированный",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 10,
  "seed": 12345,
  "prompt_extend": true,
  "shot_type": "multi",
  "watermark": false
}

Получение результатов задачиГенерация видео — асинхронная задача. После отправки возвращается task_id. Используйте интерфейс Получить статус задачи для запроса прогресса и результатов.

curl --request POST \
  --url https://toapis.com/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.6",
    "prompt": "Милый котенок бежит по траве",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 5
  }'

{
  "id": "video_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ",
  "object": "generation.task",
  "model": "wan2.6",
  "status": "queued",
  "progress": 0,
  "created_at": 1768380224,
  "metadata": {
    "aspect_ratio": "16:9"
  }
}

Обзор

Быстрый старт

API чата

API изображений

API видео

Управление задачами

Загрузка файлов

Аккаунт

Wan2.6 Генерация видео

Логика маршрутизации

Аутентификация

Параметры запроса

Комбинации разрешений и соотношений сторон

Ответ

Сценарии использования

Сценарий 1: Текст-в-видео

Сценарий 2: Изображение-в-видео

Сценарий 3: Референсное видео (r2v)

Сценарий 4: Текст-в-видео (полные параметры)

Обзор

Быстрый старт

API чата

API изображений

API видео

Управление задачами

Загрузка файлов

Аккаунт

​Логика маршрутизации

​Аутентификация

​Параметры запроса

​Комбинации разрешений и соотношений сторон

​Ответ

​Сценарии использования

​Сценарий 1: Текст-в-видео

​Сценарий 2: Изображение-в-видео

​Сценарий 3: Референсное видео (r2v)

​Сценарий 4: Текст-в-видео (полные параметры)

Логика маршрутизации

Аутентификация

Параметры запроса

Комбинации разрешений и соотношений сторон

Ответ

Сценарии использования

Сценарий 1: Текст-в-видео

Сценарий 2: Изображение-в-видео

Сценарий 3: Референсное видео (r2v)

Сценарий 4: Текст-в-видео (полные параметры)