Anthropic: дистилляция моделей и 24 000 заблокированных аккаунтов
Anthropic заблокировал около 24 000 аккаунтов, уличённых в попытках дистилляции моделей Claude — процессе, при котором ответы одной модели используются для обучения другой (более дешёвой или open-source). Дистилляция запрещена условиями использования Claude API, и Anthropic начал активно её пресекать.
Что такое дистилляция
Компания или разработчик отправляет тысячи запросов в Claude API, собирает ответы и использует их как обучающие данные для собственной модели. Результат — «модель-клон», которая воспроизводит поведение Claude без оплаты API. Для Anthropic это прямая потеря выручки: клиент использует продукт для создания конкурента.
Масштаб
24 000 аккаунтов — значительное число, указывающее на системную практику, а не на единичные случаи. Дистилляция — особенно популярна в Китае и регионах с ограниченным доступом к западным API: вместо прямого использования Claude создают локальную копию. DeepSeek, по некоторым данным, использовал дистилляцию (не обязательно Claude) как один из методов обучения — что вызвало дискуссию об этике «обучения на ответах конкурента».
Вопрос шире
Где граница между «использованием API» и «копированием модели»? Если пользователь задаёт 100 вопросов — это использование. Если 100 000 однотипных вопросов — это дистилляция. Но между 100 и 100 000 — серая зона, и определить намерение алгоритмически сложно. Anthropic использует комбинацию rate limiting, паттернов запросов и ручного аудита для обнаружения дистилляции. Но гонка «дистиллятор vs детектор» — только начинается.