Включите исполнение JavaScript в браузере, чтобы запустить приложение.
AI28 октября, 2024

Как использовать open source Wunjo AI для генерации контента

Подробное руководство об open-source приложении Wunjo AI для создания контента. Что такое Wunjo AI: обзор функционала и преимущества перед аналогами. Подробно расскажем, как начать работу с Wunjo AI для создания deepfake-видео и синтеза речи. Примеры использования Wunjo AI — в нашей статье.
  1. Что такое Wunjo AI
  2. Что может Wunjo AI: обзор функционала
  3. Синтез речи из текста
  4. Создание дипфейковых видео
  5. Расширяемость
  6. Преимущества Wunjo AI
  7. Как начать работу с Wunjo AI
  8. Примеры применения Wunjo AI

Что такое Wunjo AI

Платформа искусственного интеллекта Wunjo AI используется для создания дипфейк-видео, а также для синтеза звучащей устной речи из печатного текста. Перечислим основные особенности этого приложения:

  • свобода творчества.  Wunjo AI не ограничивает вас в выборе контента, длительности видео или применении водяных знаков;
  • доступность. Программа полностью бесплатна, кроме того, она работает на русском языке;
  • локальная работа. Приложение не требует использования облачных серверов, что исключает абонентскую плату;
  • удобство. Wunjo AI обладает интуитивно понятным интерфейсом, а также доступен пошаговый гид для начинающих;
  • интеграция с ChatGPT для генерации текстов.

Важно отметить, что использование программы для создания дипфейков может иметь как положительные, так и отрицательные последствия. Поэтому важно использовать инструмент ответственно, с пониманием этических аспектов. Расскажем, что можно сделать с помощью этого приложения, как с ним работать, где использовать.

Что может Wunjo AI: обзор функционала

Расскажем об основных функциях Wunjo AI.

Синтез речи из текста

Wunjo AI легко превращает печатный текст в живую устную речь, что полезно для создателей текстового контента, рассказчиков, разработчиков. 

Благодаря технологиям обработки естественного языка (NLP) программа генерирует аудио, максимально приближенные к человеческой речи. В распоряжении пользователя есть три голоса: женский, мужской и роботизированный. Все они поддерживают русский язык. В программе можно контролировать ударения, используя символ "+".

Помимо стандартных моделей для голосов, Wunjo AI предоставляет возможность использовать собственные из семейства Tacatron2. Они бесплатно доступны в интернете, чаще всего представлены на английском языке и могут включать голоса известных персонажей. 

Приложение умеет создавать беседы между несколькими лицами, используя интеграцию с ChatGPT. 

Создание дипфейковых видео

Искусственный интеллект в Wunjo AI позволяет оживить изображения, превращая их в видео. Технология ИИ умеет плавно передавать жесты, мимику, телодвижения персонажей. 

Процесс оживления изображений основан на обучении глубокой нейронной сети на датасете аудиовизуальных записей говорящих людей:

  • сеть обучается на данных, состоящих из видео с говорящими людьми и соответствующим им звуком; 
  • кадры обрабатываются с помощью 2D-детектора лицевых ориентиров, который извлекает лицевые черты, используемые как входные данные для сети;
  • обученная сеть предсказывает набор 3D-коэффициентов движения, которые определяют движения лица в соответствии со звуковым входом. 

Эта технология позволяет создавать реалистичную анимацию, которая соответствует исходному изображению с точки зрения стиля и освещения.

Расширяемость

Wunjo AI может расширять свои функции с помощью дополнительных модулей, называемых расширениями. Они позволяют настроить приложение под конкретные потребности пользователя. 

Существуют расширения для использования графического процессора (GPU), взаимодействия с консолью, обучения моделей на интеграции с ChatGPT или на разных голосах. 

Главные достоинства расширений — это:

  • функциональность — можно добавить новые возможности к приложению, не затрагивая его основную структуру;
  • персонализация — пользователи могут изменить интерфейс, темы, поведение приложения в соответствии со своими предпочтениями;
  • интеграция — расширения позволяют легко интегрировать приложение с внешними сервисами, API или платформами;
  • повышение производительности — автоматизация повторяющихся задач или предоставление специальных функций увеличивает производительность работы;
  • сообщество — разработчики делятся своими расширениями с другими, обогащая функциональность приложения.

Преимущества Wunjo AI

Перечислим основные достоинства Wunjo AI.

  • Бесплатный доступ. В отличие от многих аналогичных решений на основе ИИ, приложение доступно без платной подписки и каких-либо ограничений.
  • Локальная работа. Приложение работает на компьютере напрямую, не требуя подключения к интернету: оно использует ресурсы процессора (CPU). 
  • Отсутствие ограничений. В программе можно создавать видео и аудио любой длительности и с любым контентом. 
  • Открытый исходный код: разработчики и энтузиасты могут свободно улучшать функциональность приложения, расширять его возможности.
  • Изменение видео при помощи текста. С помощью нейросети можно менять отдельные составляющие видео, используя текстовые запросы (prompt). 

Как начать работу с Wunjo AI

Исходный код проекта находится в открытом доступе. Приложение создано на основе BeeWare и Flask UI, что делает его доступным для широкого круга пользователей. 

Готовое приложение можно скачать бесплатно и поставить на macOS, Linux, Windows с помощью установщика. Сами модели нейросетей скачиваются автоматически при первом запуске.

Пользователи, знакомые с основами разработки ПО, могут модифицировать программу. Чтобы взаимодействовать с ней в режиме разработчика, вам потребуется выполнить несколько простых шагов для запуска Wunjo AI.

1. Настройка Flask: 

  • измените строку 1348 в коде на app.run(port=8000, host="0.0.0.0"). Это позволит запустить Wunjo AI как Flask-приложение с портом 8000, а не в режиме FlaskUI;
  • чтобы информация могла выводиться в консоль, измените строку 1225 на if app.config['DEBUG']: в противном случае все сведения будут доступны только через GET-запросы по адресу 127.0.0.1:8000/console_log.

2. Запуск в режиме разработчика:

  • убедитесь в установке всех нужных зависимостей;
  • выполните команду briefcase dev.

3. Доступ к приложению: 

  • фронтенд-часть доступна по адресу 127.0.0.1:8000;
  • при запуске программы на 0.0.0.0 доступ к ней можно получить по IP:PORT из интернета либо из локальной сети.

Примеры применения Wunjo AI

Перечислим задачи, для которых подходит программа.

  • Создание оригинального контента для соцсетей и YouTube. Это могут быть видеоролики с использованием синтеза речи, дипфейков, анимации изображений. Программа позволяет добавлять голоса знаменитостей или персонажей в видео для увеличения привлекательности контента. 
  • Разработка решений для видеомонтажа и постпродакшена. С помощью Wunjo можно создавать спецэффекты, анимировать изображения, синхронизировать речь с движениями лиц.
  • Обучение и эксперименты в области ИИ: Wunjo AI — это платформа для изучения дипфейков, речевых технологий, обработки видео. Пользователи могут создавать собственные модели, проводить эксперименты, развивать свои навыки в области работы с искусственным интеллектом.

Приведем несколько примеров типовых задач для Wunjo AI.

  • Пародии на знаменитостей. Голос знаменитости добавляется в видео с другим человеком при помощи дипфейка и синтеза речи.
  • Анимированные видео: статичные изображения превращаются в видео с плавными движениями и мимикой.
  • Автоматизация повторяющихся задач видеомонтажа, например, синхронизации речи с движениями губ или добавления эффектов к видео.
  • Интерактивные виртуальные ассистенты: модель Wunjo AI можно обучить любому голосу, а затем создать виртуального помощника, способного общаться в режиме реального времени.

В целом, Wunjo AI — это бесплатный инструмент с широкими возможностями, помогающий реализовать творческие идеи, а заодно экспериментировать с открытым кодом.