Перейти к основному содержанию
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://toapis.com/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2-0",
    "prompt": "Используй video 1 для POV-композиции, audio 1 как музыкальную подложку, стартуй с image 1 и завершайся на image 2 в стиле свежего рекламного ролика.",
    "duration": 11,
    "aspect_ratio": "16:9",
    "image_with_roles": [
      {"url": "https://example.com/ref-image-1.jpg", "role": "reference_image"},
      {"url": "https://example.com/ref-image-2.jpg", "role": "reference_image"}
    ],
    "video_with_roles": [
      {"url": "https://example.com/ref-video-1.mp4", "role": "reference_video"}
    ],
    "audio_with_roles": [
      {"url": "https://example.com/ref-audio-1.mp3", "role": "reference_audio"}
    ],
    "metadata": {
      "resolution": "720p",
      "generate_audio": true
    }
  }'
{
  "id": "<string>",
  "object": "<string>",
  "model": "<string>",
  "status": "<string>",
  "progress": 123,
  "created_at": 123,
  "metadata": {}
}
  • Видео-модели нового поколения от ByteDance
  • Поддерживаются doubao-seedance-2-0 и doubao-seedance-2-0-fast
  • Поддерживаются text-to-video, генерация по первому кадру, по первому и последнему кадру, а также multimodal reference-to-video
  • Поддерживаются референсные изображения, видео и аудио
  • Поддерживаются генерация синхронного аудио, web search tools и возврат последнего кадра
  • Асинхронный рабочий процесс с проверкой статуса по ID задачи

Authorizations

Authorization
string
обязательно
Все запросы требуют аутентификацию Bearer TokenПолучите API Key на странице API Key ManagementДобавьте в заголовки запроса:
Authorization: Bearer YOUR_API_KEY

Тело запроса

model
string
по умолчанию:"doubao-seedance-2-0"
обязательно
Название модели генерации видеоДоступные модели:
  • doubao-seedance-2-0 - стандартная версия с упором на более высокое качество, поддерживает 4-15 секунд
  • doubao-seedance-2-0-fast - ускоренная версия для preview и iteration, поддерживает 4-12 секунд
prompt
string
Текстовое описание видеоПоддерживаются запросы на китайском и английском. Чем точнее описание сцены, движения камеры, действий, стиля и аудио-атмосферы, тем лучше результат.Рекомендации:
  • Китайский текст лучше держать в пределах 500 символов
  • Английский текст лучше держать в пределах 1000 слов
  • Для ссылок на загруженные материалы используйте обозначения вида “image 1”, “video 1”, “audio 1”
Пример: "Используй video 1 для POV-композиции, начни с image 1, заверши image 2 и сохрани ритм и настроение из audio 1"
duration
integer
по умолчанию:5
Длительность видео в секундахДопустимые значения:
  • doubao-seedance-2-0: 4-15
  • doubao-seedance-2-0-fast: 4-12
  • -1: автоматическая длительность, выбранная моделью
doubao-seedance-2-0-fast не поддерживает длительность больше 12 секунд.
aspect_ratio
string
по умолчанию:"adaptive"
Соотношение сторон видеоВарианты:
  • 21:9
  • 16:9
  • 4:3
  • 1:1
  • 3:4
  • 9:16
  • adaptive
Поведение adaptive:
  • Text-to-video: модель выбирает наиболее подходящее соотношение сторон по prompt
  • Генерация по первому кадру или по первому и последнему кадру: ориентируется на первый кадр
  • Multimodal reference-to-video: обычно приоритет у reference video, затем у reference image
image_urls
string[]
Массив URL изображений в режиме совместимостиДля явного контроля ролей рекомендуется использовать image_with_roles.image_urls и image_with_roles не следует использовать одновременно.
image_with_roles
array
Массив изображений с ролямиПоддерживаемые сценарии:
  • Генерация по первому кадру: один first_frame
  • Генерация по первому и последнему кадру: один first_frame и один last_frame
  • Multimodal reference-to-video: элементы reference_image, от 1 до 9
Требования к изображениям:
  • Форматы: jpeg, png, webp, bmp, tiff, gif
  • Размер одного файла: меньше 30MB
  • Общий размер запроса: рекомендуется не более 64MB
  • Соотношение сторон: примерно от 0.4 до 2.5
  • Размеры: примерно от 300px до 6000px
  • Режимы first-frame и first-and-last-frame нельзя смешивать с reference_image, reference_video или reference_audio
  • Разрешен только один first_frame и один last_frame
  • В multimodal reference mode все изображения должны использовать роль reference_image
video_with_roles
array
Массив видео с ролямиСейчас поддерживается только reference_video для multimodal reference mode.Требования к видео:
  • Форматы: mp4, mov
  • Разрешение: 480p или 720p
  • Длительность одного видео: 2-15 секунд
  • Максимум: 3 референсных видео
  • Суммарная длительность reference video: не более 15 секунд
  • Размер одного файла: меньше 50MB
  • Частота кадров: примерно 24-60 FPS
audio_with_roles
array
Массив аудио с ролямиСейчас поддерживается только reference_audio для multimodal reference mode.Требования к аудио:
  • Форматы: wav, mp3
  • Длительность одного файла: 2-15 секунд
  • Максимум: 3 аудиореференса
  • Суммарная длительность reference audio: не более 15 секунд
  • Размер одного файла: меньше 15MB
audio_with_roles нельзя использовать отдельно. Нужен хотя бы один image reference или video reference.
metadata
object
Дополнительные параметры

Правила комбинации входных данных

Типовые поддерживаемые комбинации:
  • Только текст: text-to-video
  • Текст + один first-frame image: генерация по первому кадру
  • Текст + first-frame image + last-frame image: генерация по первому и последнему кадру
  • Текст + reference images: multimodal reference-to-video
  • Текст + reference videos: reference-guided video generation
  • Текст + reference images + reference audio: multimodal reference-to-video
  • Текст + reference images + reference videos + reference audio: multimodal reference-to-video
Эти три режима взаимоисключающие:
  • Генерация по первому кадру
  • Генерация по первому и последнему кадру
  • Multimodal reference-to-video
Если нужен строгий контроль первого и последнего кадра, используйте first_frame и last_frame. Если важнее общее референсное управление, используйте reference_image, reference_video и reference_audio.

Соответствие разрешения и соотношения сторон

РазрешениеСоотношение сторонРазмер в пикселях
480p16:9864x496
480p4:3752x560
480p1:1640x640
480p3:4560x752
480p9:16496x864
480p21:9992x432
720p16:91280x720
720p4:31112x834
720p1:1960x960
720p3:4834x1112
720p9:16720x1280
720p21:91470x630

Возможности и ограничения

ПараметрSeedance 2.0Seedance 2.0 Fast
ПозиционированиеБолее высокое качествоБолее быстрая генерация и ниже стоимость
Длительность4-15 секунд или -1 auto4-12 секунд или -1 auto
Разрешение480p / 720p480p / 720p
Роли изображенийfirst_frame / last_frame / reference_imagefirst_frame / last_frame / reference_image
Роли видеоreference_videoreference_video
Роли аудиоreference_audioreference_audio
Генерация аудиоmetadata.generate_audiometadata.generate_audio
Toolsmetadata.toolsmetadata.tools
Последний кадрmetadata.return_last_framemetadata.return_last_frame
Тарификация идет по секундам. Актуальная цена может отличаться в зависимости от версии модели, разрешения и стратегии отображения платформы. Проверяйте страницу цен моделей.

Response

id
string
Уникальный идентификатор задачи для проверки статуса
object
string
Тип объекта, всегда generation.task
model
string
Использованная модель
status
string
Статус задачи
  • queued - В очереди
  • in_progress - В обработке
  • completed - Успешно завершена
  • failed - Ошибка
progress
integer
Процент выполнения задачи (0-100)
created_at
integer
Время создания задачи (Unix timestamp)
metadata
object
Метаданные задачи
Генерация видео выполняется асинхронно. При создании задачи вы получаете task ID, а затем можете использовать Get Video Task Status для опроса прогресса и результата.
curl --request POST \
  --url https://toapis.com/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2-0",
    "prompt": "Используй video 1 для POV-композиции, audio 1 как музыкальную подложку, стартуй с image 1 и завершайся на image 2 в стиле свежего рекламного ролика.",
    "duration": 11,
    "aspect_ratio": "16:9",
    "image_with_roles": [
      {"url": "https://example.com/ref-image-1.jpg", "role": "reference_image"},
      {"url": "https://example.com/ref-image-2.jpg", "role": "reference_image"}
    ],
    "video_with_roles": [
      {"url": "https://example.com/ref-video-1.mp4", "role": "reference_video"}
    ],
    "audio_with_roles": [
      {"url": "https://example.com/ref-audio-1.mp3", "role": "reference_audio"}
    ],
    "metadata": {
      "resolution": "720p",
      "generate_audio": true
    }
  }'