ElevenLabs: голосовое клонирование стало массовым
ElevenLabs — стартап, специализирующийся на AI-генерации голоса — вывел технологию клонирования голоса на уровень массовой доступности. Достаточно загрузить 30 секунд записи речи — и система создаёт цифровую копию голоса, которую можно использовать для генерации произвольного текста. Результат звучит неотличимо от оригинала для большинства слушателей.
Применения
Подкастеры используют ElevenLabs для создания мультиязычных версий эпизодов — один и тот же голос ведущего говорит на 29 языках. Авторы книг — для генерации аудиоверсий без найма диктора. Компании — для создания AI-голосовых ассистентов с уникальным брендированным голосом. Разработчики игр — для озвучки персонажей.
Опасности
Обратная сторона: голосовое клонирование используется мошенниками. Достаточно 30-секундного фрагмента из публичного видео (YouTube, TikTok, корпоративное выступление) — и злоумышленник получает инструмент для телефонного мошенничества. «Мама, это я, мне срочно нужны деньги» — голосом, неотличимым от настоящего. Microsoft зафиксировал рост AI-голосового фишинга в своём Digital Defense Report.
ElevenLabs внедряет safeguards: верификация личности при клонировании, ограничения на использование голосов публичных фигур, watermarking сгенерированного аудио. Но технология открыта — и конкуренты (Resemble.ai, Play.ht) предлагают аналогичные возможности с меньшими ограничениями. Контроль за голосовым клонированием — одна из самых сложных задач AI-безопасности 2025 года.


