Нейросети 30 октября 2025 · 1 мин чтения 184 0

Qwen3 от Alibaba: 8 открытых моделей под Apache 2.0

Alibaba Cloud представила Qwen3 — третье поколение семейства открытых языковых моделей, которое включает шесть плотных моделей (от 0.6B до 32B параметров) и две MoE-модели (30B и 235B). Все модели доступны под лицензией Apache 2.0 — полная свобода для коммерческого использования, дообучения и развёртывания.

Флагман: Qwen3-235B

Главная модель серии — Qwen3-235B-A22B — использует архитектуру Mixture-of-Experts с 22 миллиардами активных параметров из 235 миллиардов общих. Модель обучена на 36 триллионах токенов — вдвое больше, чем у предшественницы Qwen 2.5. Поддерживает 119 языков и диалектов.

Ключевая особенность — гибридное мышление: модель может переключаться между быстрым режимом (прямой ответ) и глубоким (с цепочкой рассуждений до 38 000 токенов). Разработчик контролирует длительность размышлений через API.

Для кого

Qwen3 нативно поддерживает Model Context Protocol (MCP) от Anthropic и мощный function calling, что делает модели готовыми для создания AI-агентов. Компактные версии (0.6B–4B) предназначены для мобильных устройств, умных очков и IoT. Флагман — для серверного развёртывания и конкуренции с закрытыми моделями.

На SWE-bench Verified (задачи реального программирования) Qwen3-235B показывает результаты, сопоставимые с Claude 3.5 Sonnet и GPT-4o, при существенно более низкой стоимости инференса.