Новая фича от ElevenLabs генерирует голос с нуля по текстовому запросу. Не text-to-speech, как мы привыкли, а text-to-voice, чего мы не видели, то есть не слышали. Создает именно голос – тембр, темп, интонацию, настроение. Фактически, первая в мире такая модель. На входе задаете параметры, на выходе получаете уникальный, созданный специально для вас, без синтезаторного звучания и заданных образцов человеческий голос.

В промпте можно задать такие критерии, как возраст, пол, акцент и все остальное. На сайте есть руководство по созданию голоса. Генератор поддерживает 32 языка, включая русский. Компания рекомендует его для всего – от озвучивания аудиокниг до дубляжа видеороликов. Путь к дизайнеру голосов: Voices – My Voices – Add a new voice – Voice Design.

Тарифы – от Free до Business. Нужна регистрация. В бесплатную подписку включено: 10 минут текста в речь высокого качества, тысячи уникальных тембров из библиотеки и герой нашей новости – генератор человеческих голосов. Подписка расширяет возможности. Например, за $5 в месяц получите 30 минут аудио материалов, опцию клонирования голоса и разрешение на коммерческое использование.

Кстати, про клонирование. Опция позволяет создать цифровую копию вашего голоса на основе аудиозаписи. Конкретно в ElevenLabs достаточно одной минуты, чтобы алгоритм изучил уникальные характеристики звука и выдал «идентичный натуральному». Этот голос впоследствии можно использовать для озвучки чего угодно. Да, самому даже ртом не пошевелив. И на любом из 32 языков.

Коротко о других возможностях ElevenLabs. На платформе можно переозвучить загруженную аудиозапись (speech-to-speech) с сохранением эмоциональной насыщенности. В разделе «Проекты» превращайте свои документы в разговорные аудиозаписи – фичу обычно используют для создания аудиокниг. Есть ИИ-дублирование и видеопереводчик. Для разработчиков предусмотрели API.

К вопросу, почему ElevenLabs – лучший. Например, потому, что генерирует самые реалистичные голоса, которые почти невозможно отличить от «живых» человеческих. Так и пишут о нем – самый реалистичный генератор голоса с искусственным интеллектом. Стартап был основан в 2022 году Петром Дабковским и Мати Станишевским. Бета-платформу открыли в 2023, а сегодня стали лидером в нише. Ребята взяли и показали, как у маленького стартапа получилось стать большим, то есть значительным. А мы вдохновляемся смелостью и делаем что-то свое.