Spotify начинался как поставщик плейлистов для меломанов 🎧, потом захватил рынок подкастов 🎙️, а теперь сделал шаг в сторону аудиокниг. Не тех, которые пишут долго и дорого в студиях, а сгенерированных по-быстрому искусственным интеллектом. Благодаря сотрудничеству с ElevenLabs на сервисе появилась ИИ-библиотека 📚. Выход в «большое плавание» аудиокниг, озвученных нейросетью — тревожный звонок для дикторов 🔔. Профессия может уйти из зоны «неподделываемого» человеческого мастерства в область нишевого искусства.

Процесс создания аудиокниги максимально простой. Берешь текст, загружаешь в ElevenLabs, выбираешь язык и голос, нажимаешь Generate — и готово. Причем не какая-то там синтетическая читка, а вполне естественное, почти человеческое произношение. Типа Игоря Князева или Кирилла Головина. Через год-другой разницу не заметим.

Чтобы книга попала на Spotify, нужно еще немного покликать. Скачать LPF-файл — формат, который понимает и принимает Findaway Voices, платформа для дистрибуции аудиокниг, принадлежащая Spotify. И, конечно, создать свой аккаунт на Findaway Voices. Потом заливаем LPF в Findaway Voices и отправляем аудиокнигу покорять Spotify 🚀.

Напомним, что в бесплатную версию ElevenLabs включено 10 минут преобразования текста в речь и 1 проект, созданный в Studio (инструмент ElevenLabs для работы с длинными текстами типа книг). Платная подписка стартует от $5 в месяц — это 30 минут обычного TTS и целых 20 проектов с помощью Studio. Платформа генерирует речь на 32 языках, включая, конечно же, русский.

Spotify одним движением рук делает рынок «синтетических» аудиокниг масштабным и массовым. По сути, любой человек может озвучить свою «пытку творчества» и залить на платформу. Это значит, что все, что раньше лежало в виде текстов на самиздатах и блогах 📄, получит голос и внимание широкой публики. С учетом того, что можно быстро и, в общем, недорого делать версии на разных языках, широкая публика — это значит международная аудитория 🌍.

Монетизация ИИ-книг пока под вопросом. Обычные приносят доход обладателям через роялти💸. Систему выплат не так давно обновили, установив минимальный порог в 1000 прослушиваний в течение последних 12 месяцев для начисления вознаграждений. Условия монетизации озвученных искусственным интеллектом аудиокниг, возможно, будут другими. Информацию о политике выплат роялти за ИИ-материалы Spotify не предоставила.

Те, кто строил карьеру на озвучке книг, должны пересмотреть свои планы. Точно останутся дикторы, чьи голоса стали культовыми. Всем остальным надо готовиться к жесткой конкуренции с моделями синтеза речи 🤖. Не стоит полагаться на такой аргумент, как эмоции. Две минуты до того, как алгоритмы научатся их моделировать. Уже сегодня нейросети — Zonos от Zyphra, к примеру — умеют грустить, смеяться, бояться. И никто, конечно, не будет терпеть дорогого, капризного диктора, если можно нажатием кнопки добавить «чуть больше теплоты».