Автоматизация видеопроизводства: пайплайн на Sora 2 и n8n за $0.15 за ролик
Есть задача: производить видеоконтент для YouTube Shorts без участия человека. Не один ролик в неделю, а шесть в день. И чтобы себестоимость каждого не превышала 15 центов.
Звучит как фантастика, но один разработчик собрал такой пайплайн на n8n и Sora 2. Рассказываю, как устроена архитектура.
Почему нельзя просто попросить GPT придумать идею
Типичная ошибка — дать языковой модели промпт "придумай вирусный видеосюжет". Получите что-то настолько усреднённое и безликое, что досматривать это не захочется никому.
Вместо этого решение использует структурированную случайность. В коде захардкожены три массива:
- Действия: прыжки с парашютом, медитация, игра на гитаре
- Персонажи: киберпанк-самурай, гигантский зефирный человек, дракон
- Локации: неоновая улица Токио, мир Minecraft, пейзаж Studio Ghibli
Скрипт на JavaScript берёт по одному случайному элементу из каждого массива. Получается "дракон медитирует в мире Minecraft" — странно, но визуально интересно. Затем LangChain-агент разворачивает эту комбинацию в полноценный кинематографический промпт.
Рендеринг через прокси-сервис
Официальный API Sora до сих пор закрыт для массового использования. Пайплайн обходит это ограничение через api.kie.ai — сервис, который транслирует запросы к Sora.
Параметры запроса:
- Модель: sora-2-text-to-video
- Формат: 9:16 (вертикальное видео для Shorts и Reels)
- Убрать водяной знак: да
Стоимость одной генерации — около 15 центов.
Асинхронная обработка
Видео не появляется мгновенно. API возвращает taskId, и дальше нужен поллинг:
- Пауза 10 минут — этого хватает для рендера большинства роликов
- GET-запрос для проверки статуса
- Если код 200 и есть resultJson — забираем ссылку на готовый MP4
Параллельно второй LLM-агент генерирует заголовок для YouTube. После получения видео workflow скачивает файл и загружает его на канал с автоматически сгенерированными метаданными.
Расписание и экономика
Весь процесс запускается каждые 4 часа. Это 6 видео в день. При стоимости 15 центов за ролик дневные расходы — меньше доллара.
Людям остаётся только смотреть на аналитику и решать, какие темы заходят лучше.
Что я об этом думаю
Подобные системы уже работают. Контент-фермы на нейросетях — не прогноз на 2030 год, а реальность 2026-го.
С точки зрения инженерии решение элегантное: каждый модуль отвечает за свою задачу, асинхронность обрабатывается корректно, стоимость минимизирована.
Для тех, кто строит автоматизации с AI: главный урок здесь — не давать модели полную свободу творчества. Структурированные входные данные с элементом случайности работают лучше, чем "придумай что-нибудь интересное".