Нейросети 15 декабря 2025 · 1 мин чтения 186 0

DeepSeek V3.1: $6 млн на обучение — в 50 раз дешевле GPT-5

Китайский стартап DeepSeek выпустил V3.1 — обновление, подтвердившее цифру, шокировавшую индустрию: стоимость обучения — около $6 миллионов. Для контекста: обучение GPT-5 обошлось OpenAI в $300–500 миллионов по оценкам аналитиков. DeepSeek достигает сопоставимого качества за долю стоимости.

Как это возможно

Архитектура Mixture of Experts (MoE): при обработке каждого запроса активируется только часть параметров, а не вся сеть — это снижает вычислительные затраты кратно. Оптимизация обучения: DeepSeek использует специализированные алгоритмы, извлекающие максимум из ограниченных GPU-ресурсов. Команда компенсирует нехватку чипов (экспортные ограничения США) инженерной изобретательностью.

Последствия для рынка

DeepSeek V3.1 ставит под вопрос экономику фронтирных лабораторий. Если модель сопоставимого качества можно обучить за $6 миллионов, зачем OpenAI тратит сотни миллионов? Часть ответа — в универсальности (GPT-5 покрывает больше задач), часть — в safety-исследованиях. Но вопрос остаётся: насколько эффективно западные лаборатории используют ресурсы?

Для стартапов и компаний за пределами США — включая Беларусь — DeepSeek V3.1 практически значим: open-source модель, которую можно развернуть на собственных серверах, с качеством, приближающимся к закрытым лидерам. Зависимость от API OpenAI или Anthropic перестаёт быть единственным вариантом.