Китайская компания ByteDance, владеющая TikTok, представила демо нового ИИ генератора видео OmniHuman-1. Пожалуй, самого наилучшего на данный момент. Генератор на голову превосходит своих аналогичных конкурентов: люди на видео кажутся настолько живыми, что пресловутый эффект зловещей долины🤖 незаметно стирается. А вместе с ним – и грань между иллюзией и реальностью.

Прорывная модель под звучным именем OmniHuman совершает невероятное: из одиночной фотографии создает поразительно реалистичный, “живой” видеоряд. Искусственно воссозданные люди жестикулируют🖐 в унисон со своей речью, могут петь, владеют мимикой на “человеческом” уровне. По сравнению с существующими на рынке ИИ моделями, которые, как правило, могли анимировать только лицо или верхнюю часть тела, это уже какой-то квантовый скачок в будущее. Ну или в прошлое. Ведь теперь нам доступна возможность посмотреть лекцию самого Эйнштейна – и не возникнет сомнений, что он в самом деле когда-то однажды записал свои мысли на видео для потомков:

Секрет успеха генератора – новая стратегия обучения omni-conditions, при которой нейросеть обучается сразу по нескольким источникам информации (текст, аудио, движение тела), объединяя их в единый поток. Применяя этот подход, OmniHuman-1 “просмотрела”👀 более 18700 часов видеозаписей с участием людей. По словам исследователей, подобный метод обучения помогает ИИ “значительно сократить потери данных”. А чтобы добиться столь впечатляющих результатов, разработчики прибегли к глубокому анализу человеческого тела – от самых возможных форм до малейших мимических изменений.

Всё это, несомненно, вызывает восторг, однако одновременно приводит и в ужас. Мир уже столкнулся с последствиями применения технологии deepfake отнюдь не во благо. Дезинформация в политических кругах, мошенничество, “грязные” видео – только верхушка айсберга возможностей для недобросовестных людей, перед которыми, с развитием технологического мира, открываются всё более качественные пути совершения преступления. На весь мир гремели многомиллиардные судебные разбирательства, связанные с использованием deepfake в финансовых махинациях. А в 2024 году мошенник, притворившись Брэдом Питтом с помощью качественного дипфейка, убедил женщину развестись с мужем и попутно выманил у обманутой $850 000 якобы на лечение. Далеко ходить не надо: совсем недавно от deepfake-технологий пострадала Лариса Долина, где её “зловещий двойник”😓 взял кредит на 50 миллионов рублей. Ущерб немаленький, и моральный в том числе. TechCrunch, к слову, новость о появлении OmniHuman-1 встретили с неприкрытой тревогой, опасаясь, что новый генератор видео перевернет мир в худшую сторону, заполонив интернет намного более качественными дипфейками.

Где же можно опробовать новую штуку? Ответ: пока что нигде. Ловите ссылку на демо, отобранные ByteDance и восхищайтесь (или ужасайтесь) вместе с нами.