Модель генерации видео Alibaba Cloud Wanxiang
Поддержка текст-в-видео и изображение-в-видео
Поддержка разрешения 720p/1080p, длительность 5/10/15 секунд
Поддержка автоматического расширения промпта и генерации аудио
Аутентификация
Все API требуют аутентификации Bearer Token Получите API Key на странице управления API ключами Добавьте в заголовок запроса: Authorization: Bearer YOUR_API_KEY
Параметры запроса
Название модели генерации видео, фиксированное значение wan2.6
Описание содержимого видео Обязательно для режима текст-в-видео, рекомендуется детально описать сцену, действие, стиль Пример: "Милый котенок потягивается на солнце"
Массив URL референсных изображений (поддерживает только 1 изображение) Обязательно для режима изображение-в-видео, поддерживает публично доступные URL или кодирование Base64 Пример: ["https://example.com/image.jpg"] или ["data:image/png;base64,iVBORw0KGgo..."] Система автоматически выбирает режим текст-в-видео или изображение-в-видео в зависимости от наличия image_urls в запросе
Негативный промпт, описывает нежелательное содержимое Пример: "размытый, низкое качество, деформированный"
aspect_ratio
string
по умолчанию: "16:9"
Соотношение сторон видео Доступные значения:
16:9 - Горизонтальный (по умолчанию)
9:16 - Вертикальный
1:1 - Квадрат
4:3 - Горизонтальный
3:4 - Вертикальный
По умолчанию: 16:9 Этот параметр не поддерживается в режиме изображение-в-видео
resolution
string
по умолчанию: "720p"
Разрешение видео Доступные значения:
720p - Стандартное разрешение (по умолчанию)
1080p - Высокое разрешение
По умолчанию: 720p Разрешение 480p не поддерживается Тарификация по секундам, разные разрешения имеют разные цены, подробности см. на рынке моделей
Длительность видео (секунды) Поддерживает только: 5, 10, 15 секунд По умолчанию: 5
Случайное зерно для воспроизводимости результатов Пример: 12345
Автоматическое расширение промпта При включении система автоматически оптимизирует и обогащает ваш промпт
Автоматическое добавление аудио При включении система автоматически генерирует соответствующее аудио для видео
Указать URL аудио Имеет приоритет над параметром audio Длительность аудио не может превышать длительность видео. Если аудио короче видео, первая часть будет со звуком, а последняя часть будет без звука.
Тип кадра Доступные значения:
single - Одиночный кадр
multi - Множественный кадр
Название шаблона эффекта для режима эффектов изображение-в-видео При использовании режима эффектов:
Требуется только одно изображение (передается через image_urls)
Промпт не нужен (модель игнорирует поле prompt)
Общие эффекты:
squish - Сжатие и растяжение
rotation - Вращение
poke - Тыкание
inflate - Надувание шара
dissolve - Молекулярная диффузия
melt - Плавление тепловой волной
icecream - Планета мороженого
flying - Магическая левитация
Эффекты для одного человека:
carousel - Временная карусель
singleheart - Люблю тебя
dance1 - Момент качания
dance2 - Топ-танец
Дополнительные эффекты см. в документации шаблонов Alibaba Cloud Wanxiang
Комбинации разрешения и соотношения сторон
Соотношение Описание Размер 720p Размер 1080p 16:9 Горизонтальный (по умолчанию) 1280×720 1920×1080 9:16 Вертикальный 720×1280 1080×1920 1:1 Квадрат 960×960 1440×1440 4:3 Горизонтальный 1088×832 1632×1248 3:4 Вертикальный 832×1088 1248×1632
Ответ
Код статуса ответа, 200 при успехе
Массив данных ответа Показать Показать элементы массива
Статус задачи, submitted при первичной отправке
Уникальный идентификатор задачи для запроса статуса и результатов задачи
Сценарии использования
Сценарий 1: Текст-в-видео (простой запрос)
{
"model" : "wan2.6" ,
"prompt" : "Милый котенок потягивается на солнце"
}
Сценарий 2: Текст-в-видео (полные параметры)
{
"model" : "wan2.6" ,
"prompt" : "Милый котенок бежит по траве" ,
"negative_prompt" : "размытый, низкое качество, деформированный" ,
"aspect_ratio" : "16:9" ,
"resolution" : "720p" ,
"duration" : 5 ,
"seed" : 12345 ,
"prompt_extend" : true ,
"audio" : true ,
"shot_type" : "single" ,
"watermark" : false
}
Сценарий 3: Изображение-в-видео
{
"model" : "wan2.6" ,
"prompt" : "Котенок бежит по земле" ,
"image_urls" : [ "https://upload.apimart.ai/f/apimart-models-images/9998233432754770-c059992d-9b01-47d5-810d-ea0502ac9279-image_task_01KD7SSXDBCEWZ869D6PF249ZW_0.png" ],
"resolution" : "1080p" ,
"duration" : 10
}
Сценарий 4: Изображение-в-видео (изображение Base64)
{
"model" : "wan2.6" ,
"prompt" : "Пусть котенок встанет и пойдет" ,
"image_urls" : [ "data:image/png;base64,iVBORw0KGgo..." ],
"duration" : 5
}
Описание режимов
Текст-в-видео
Необходимо предоставить параметр prompt
Параметр image_urls не нужен
Изображение-в-видео
Необходимо предоставить параметр image_urls (поддерживает только 1 изображение)
Параметр prompt необязателен, используется для описания ожидаемых действий
Система автоматически выбирает режим в зависимости от наличия image_urls в запросе
Запрос результатов задачи Генерация видео - асинхронная задача. После отправки возвращается task_id. Используйте интерфейс Получить статус задачи для запроса прогресса генерации и результатов.
curl --request POST \
--url https://toapis.com/v1/videos/generations \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.6",
"prompt": "Милый котенок бежит по траве",
"aspect_ratio": "16:9",
"resolution": "720p",
"duration": 5
}'
{
"code" : 200 ,
"data" : [
{
"status" : "submitted" ,
"task_id" : "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
}
]
}