Tools

AI-видеопоздравление за 5 минут: HeyGen vs. D-iD + бонус

Сейчас нейросети умеют не только рисовать фотореалистичные изображения, но и превращать их видео. Причем этим совершенно бесплатно может воспользоваться каждый, кто умеет выходить в интернет. Но насколько хорош результат?

AI-видеопоздравление за 5 минут: HeyGen vs. D-iD + бонус

Мы создали новогоднее поздравление с помощью двух бесплатных сервисов генерации AI-видео, и предлагаем сравнить, что получилось.

HeyGen — празднично (но недолго)

Главные функции нейросети HeyGen, ранее носившей имя Movio, это:

  • преобразование текста в речь (поддерживает более 40 языков) для озвучивания видео;
  • генерация видеороликов с AI-аватарами, в том числе пользовательскими;
  • «оживление» фотографий.

Последней опцией мы и воспользовались. Работать максимально просто: нажимаем «Create Video», переходим во вкладку «Photo Avatar», загружаем фото, пишем текст (генерируем его встроенной текстовой нейросетью или грузим свою аудиодорожку), и выбираем голос. Точнее, выбора по сути нет: для озвучивания на русском языке доступно лишь по одному мужскому и женскому голосу.

Article image

Далее, жмем «Submit», и генерируется ролик — вот такой:

Новогоднее поздравление «Винтра» от HeyGen

Скачать видео можно в разрешении 720p и 1080p (и 4K — только на платных тарифах). В целом анимация нравится. Особенно — максимально праздничное выражение лица, перешедшее с исходного фото. Но вид несколько портят излишне частые, на наш взгляд, моргания.

На бесплатном тарифе доступен 1 кредит, который соответствует 1 минуте видео.

Списание выполняется с округлением до 30 секунд, так что в месяц бесплатно можно создать максимум два ролика продолжительностью не более полминуты, или один — длительностью от 30 до 60 секунд.

Стоимость платных тарифов стартует с $29, за которые выдается 15 кредитов-минут. Правда, российские банковские карты (немного предсказуемо) не принимаются.

D-iD — больше серьезности (и возможностей)

Прямой конкурент HeyGen — нейросеть D-iD. Она привлекает в первую очередь приличными возможностями бесплатной версии: здесь каждому доступны 5 минут видео, причем время списывается по 15 секунд. Да и платные тарифы более чем в 3 раза дешевле, чем в HeyGen: за $5,9 предоставляют 10 минут, за $9,4 — 16 минут (российские карты также не принимаются).

Процесс создания видео из фото аналогичен предлагаемому HeyGen.

Поле «Название видео» на D-iD работает как-то неправильно: справа —налево :)
Поле «Название видео» на D-iD работает как-то неправильно: справа —налево :)

Для русскоязычных пользователей у D-iD есть еще одно важное преимущества: она предлагает: два мужских и четыре женских голоса для озвучивания текстов на русском языке.

Кстати, судя по всему, HeyGen и D-iD использует голоса из общей библиотеки. Оба наших видео озвучены голосами с одинаковым названием Dmitry — сравните.

А еще прямо в D-iD можно попросить нарисовать своего AI-персонажа. Для упрощения этой задачи предлагаются готовые промпты. На бесплатном тарифе доступны 15 запросов, по каждому из которых генерируется по 4 изображения.

Такие персонажи сгенерировались по предложенному D-iD промпту, описывающему фотореалистичное изображение женщины-юриста.
Такие персонажи сгенерировались по предложенному D-iD промпту, описывающему фотореалистичное изображение женщины-юриста.

А в результате оживления нашего исходного фото получилось это:

Новогоднее поздравление «Винтра» от D-iD

D-iD несколько упростил себе задачу, лишив нашего персонажа очаровательной улыбки. Из-за этого чуть прищуренные глаза смотрятся раскосыми )

Зато моргания получились более естественными. Разрешение видео осталось таким же, как и у загруженного изображения: 1024×576.

Бонус: импортозамещение (нет)

Когда искали, где можно быстро и бесплатно сделать видео из картинки, попался еще сервис Visper. Судя по информации с официального сайта — это разработка принадлежащему «Сберу» ООО «СалютДевайсы». По задуманному функционалу он аналогичен рассмотренным сервисам, а в чем-то даже интересней. Например, предусмотрены жесты вроде махания рукой и указания в сторону (где может размещаться дополнительная картинка).

Article image

Бесплатно выдаются две минуты видео, но возможности сильно ограничены: даже скачать готовый ролик нельзя. Зато докупать время в теории можно поминутно, по цене от 90 р./минуту.

И это все было бы хорошо, если бы не одно «но»: Visper находится он ни то в зачаточном, ни то в мертворожденном состоянии: анимация по факту не работает.

В то же время, если сервис «допилят» и сохранят заявленные цены — должен получится интересный вариант, особенно для российских пользователей.

Заключение

Да, сейчас нейросети позволяют бесплатно и буквально за 5 минут оживлять изображения. Из рассмотренных вариантов для любительского использования более выигрышно смотрится D-iD за счет привлекательных условий бесплатного тарифа. Хотя в конкретном случае ролик от HeyGen нам нравится больше :)

Но генерация AI-видео на серьезном уровне, как и любой другой процесс, требует значительных вложений времени, знаний, денег. И мы уже работаем в этом направлении.

Похожие статьи

Что такое облачные сервисы?
Tools

Что такое облачные сервисы?

Каждый отдельный компьютер имеет свои ограничения по мощности. Как расширить аппаратные возможности компьютерного оборудования? Обычный пользователь копит деньги или берет кредит в банке, затем идет в магазин и покупает новый системный блок или заказывает в интернет-магазине.

Обзор сервисов управления проектами
Tools

Обзор сервисов управления проектами

В настоящее время многие крупные компании и небольшие организации задействуют в своей работе сервисы управления проектами, представляющие собой программные продукты для решения огромного спектра задач. Основные из них - это кооперация сотрудников между собой и удобный контроль руководителя над выполняемой деятельностью.

Tools

Обзор облачных платформ

Облачными технологиями называют упрощенные услуги доступа к технологическим сервисам: базам данных, и вычислительным сервисам. Они используются для аварийного восстановления какой-либо программы, тестирования, анализа, создания интернет-приложений.

Написать