Время – это самая дорогая валюта в мире ⏳. Поэтому мы в восторге от нейросетей, которые его экономят. ElevenLabs тоже сделали ставку на скорость ⚡. Их новая нейронка Flash превращает текст в речь за какие-то 75 миллисекунд. Еще никогда генерация text-to-speech не была такой быстрой. Это меньше, чем за секунду 🤯. Поговорим, отразилось ли это на качестве и к чему такая спешка.
Понятно, что 75 миллисекунд – это «чистое» время без учета сетевых и других сторонних задержек. Технические нюансы никто не отменял. ElevenLabs, конечно, не могут управлять скоростью вашего интернета. Но даже с учетом всех этих факторов Flash остается самой быстрой моделью генерации речи из текстовых промптов.
Модель представлена в двух версиях. Flash v2 работает только с английским. Flash v2.5 поддерживает 32 языка, включая русский 🌍. Охватили аудиторию глобально, что правильно. Конечно, в погоне за скоростью пришлось чем-то жертвовать. Голоса, созданные с помощью Flash, могут казаться менее выразительными в сравнении с теми, что генерируются более медленными моделями сервиса. Но, как отмечают в ElevenLabs, большинство вряд ли заметит эту разницу.
Осенью компания тоже релизнула что-то особенное. В октябре на платформу подвезли голосовой генератор 🎙️. Не text-to-speech, как у всех, а text-to-voice. Первая в мире модель, которая создает уникальные голоса. Каждый – в единственном экземпляре. Сгенерирован специально для вас.
Скоростную нейронку Flash можно использовать на платформе или через API. Что по стоимости: каждые 2 символа текста съедают кредит 💸. Бесплатная версия (Free) щедро дает 10 000 кредитов ежемесячно. Хочется больше – добро пожаловать в платные планы. Подписка стартует с $5 месяц. В ней – от 30 000 кредитов и права на коммерческое использование. Российскими картами, как обычно, нельзя 😐.
Напомним, ElevenLabs – это самый реалистичный генератор голосов. Маниакальная одержимость создателей качеством (а теперь и скоростью) генерации привела к тому, что компания стала мировым лидером в области голосового ИИ. Модели звучат как настоящие люди 🗣️. Если надо – с придыханием или нужным акцентом. Добавьте сюда демократичный подход (бесплатный тариф с приличным лимитом, API для интеграции) – у конкурентов нет шансов. В общем, уверенно доминируют 🏆, а остальные догоняют.