Нейросеть Hedra
Нейросеть Hedra: как сделать фото говорящими и даже поющими
Похоже, у D-ID появился серьезный конкурент. Hedra, судя по презентации, отлично справляется с мимикой, оживляя при анимации всю портретную зону. Для сравнения, D-ID анимирует только губы. Появление Hedra открывает перспективу создания не только «говорящих голов», но и живых, выражающих эмоции лиц. Пока нейросеть на стадии бета-тестов, есть возможность использовать сервис бесплатно. Не безгранично, но достаточно, чтобы попробовать и друзьям показать.
Возможности сервиса Hedra
Hedra – инструмент для анимации фото и передачи эмоциональных и вербальных смыслов. Заставит статичные картинки кривляться, разговаривать, грустить и петь. Для исходника можно использовать реальное фото или картинку, созданную тут же, на сервисе, с помощью обычных промптов. Под анимацией мы имеем в виду нечто большее, чем обычное шевеление губ. Hedra оживляет всю мимику, что выводит платформу в несомненные лидеры. Ничего подобного у конкурентов мы не встречали.
Персонаж артикулирует синхронно с текстом (что немаловажно, на русском тоже), играет бровями, шевелит головой. И моментами кажется даже более реалистичным, чем люди, которых мы видим на улицах города. «Живая» мимика, увы, выходит из моды. Девушки берегут себя от морщин, а «парни не плачут». В общем, Hedra – тот случай, когда «как настоящее, только лучше».
Для каких целей подойдет
Сервис можно использовать для развлечений – поздравить друга, удивить коллег, повеселить подписчиков. Мона Лиза, читающая рэп, уже разошлась по социальным сетям. То есть простор для генерации развлекательного контента ограничен только фантазией и, конечно, цензурой сервиса.
С другой стороны, интернет семимильными шагами движется в сторону тотального использования цифровых аватаров везде, где это уместно и возможно. Навык их создавать и использовать через несколько месяцев будет сильно востребован. Это значит, есть смысл потратить немного времени (и ноль денег, пока сервис на стадии «беты»), чтобы хорошо разобраться, что тут к чему.
Как пользоваться Hedra?
Регистрация, как обычно, с помощью почты. Можно войти через Google (Use Google Login). Соглашаемся с условиями использования сервиса и попадаем в простой, интуитивно понятный интерфейс. В рабочем окне (клик на кнопку Create) есть три блока. В первом загружаем voice-файл или пишем текст для озвучки вручную (на русском можно). Цензура на сервисе жесткая. Бранную речь загрузить не получится. Голос можно выбрать из каталога – есть мужские и женские, каждый можно прослушать, нажав на Play.
Блок номер два – это блок персонажа. Сюда грузим фото. Персонажа для анимации можно создать с помощью промпта или даже отдать генерацию на откуп сервису (для этого в поле промпта жмем на кнопку с «костями», ничего не вводя). Тут же есть гайд по созданию аватаров (клик по кнопке с вопросительным знаком). С персонажами, сгенерированными сервисом, Hedra справляется лучше – меньше «мыла» и всяких «косяков». После всех манипуляций жмем Generate video. Процесс генерации, как и готовое видео, отображаются в третьем блоке.
Стоимость услуг сервиса
Free – бесплатно. Как долго продлится удовольствие, пока непонятно. На Free есть лимиты – до 5 минут видео в день, до 30 секунд длительность ролика, без коммерческого использования, watermark (в правом нижнем углу и существенно не мешает). Попробовать – достаточно. Для чего-то серьезного придется потратиться.
Платных тарифов на сервисе три: Basic ($10 в месяц), Professional ($50 в месяц), Enterprise (индивидуальное ценообразование). За деньги уберут водяные знаки, добавят количество и качество, дадут добро на использование роликов в «корыстных» целях и откроют каталог с премиальными голосами, что бы это ни значило.
Выводы
В отличие от конкурентов, персонажи которых шевелят только губами, анимация Hedra «включает» всю мимику. Герои правдоподобно и органично вертят головами, двигают мышцами и выдают что-то похожее на живые эмоции. С учетом того, что пока мы имеем дело с тестовой версией, «почин хороший». Да, анимация пока неидеальная, местами плывет, но потенциал у сервиса есть, и он огромный. Определенно, лучшая в этом сегменте модель. Это действительно новая ступень в генерации цифровых аватаров – «живых портретов», через которые можно вводить любой (почти) контент в публичное цифровое пространство.