Нейросети 17 февраля 2026 · 3 мин чтения 188 0

Qwen 3.5: Alibaba выложила в open-source модель, которая бьёт GPT-5

Alibaba Cloud приурочила один из главных AI-релизов года к кануну Лунного Нового года — и расчёт оправдался. 16 февраля компания представила Qwen 3.5 — новое поколение открытой ИИ-модели, которая по заявленным характеристикам и независимым тестам способна конкурировать с лучшими закрытыми разработками мира.

Архитектура: эффективность вместо грубой силы

Qwen 3.5 построена на гибридной архитектуре, сочетающей блоки Gated Delta Networks с разреженной системой Mixture-of-Experts (MoE). Общий объём параметров — 397 миллиардов, но для обработки каждого токена активируются лишь 17 миллиардов. Это принципиально важный момент: модель обладает потенциалом большой системы, но при работе потребляет ресурсы маленькой.

Флагманская версия обучена как нативно мультимодальная: она одновременно понимает текст, изображения и видеоролики длительностью до двух часов в рамках одного контекста. Это не «прикрученное сбоку» зрение, как у многих конкурентов, а единая архитектура, где визуальные и текстовые данные обрабатываются одной моделью с самого начала обучения.

Количество поддерживаемых языков выросло с 82 до 201, включая диалекты Южной Азии и Африки — рынки, на которые Alibaba делает стратегическую ставку.

Бенчмарки: кто кого

Alibaba заявила, что Qwen 3.5-Plus — коммерческая версия, работающая на серверах компании — демонстрирует результаты на уровне GPT-5.2 и Claude 4.5 в категориях знаний (MMMLU), следования инструкциям и визуального рассуждения (MMMU-Pro). CNBC оговорилась, что не смогла независимо верифицировать эти данные, однако независимые обзоры от VentureBeat и GlobalData подтвердили: открытая версия Qwen 3.5 с 397 миллиардами параметров действительно обгоняет GPT-5 mini и Claude Sonnet 4.5 от Anthropic по ряду метрик.

Контекстное окно коммерческой версии — 1 миллион токенов, открытой — 256 тысяч. Для большинства задач, включая анализ крупных кодовых баз и длинных документов, этого более чем достаточно.

Open-source с оговорками

Открытая версия Qwen 3.5-397B-A17B доступна на Hugging Face и ModelScope под лицензией Apache 2.0. Это означает полную свободу использования: скачивание, модификация, дообучение и коммерческое развёртывание на собственных серверах. Для стартапов и небольших команд, которым не по карману ежемесячные счета за API крупных провайдеров, это существенный аргумент.

Впрочем, называть Qwen полностью «опен-сорсным» не совсем корректно: Alibaba публикует веса модели, но не раскрывает обучающие данные и тренировочный код. Это стандартная практика для моделей с «открытыми весами» — термин, который всё чаще отделяют от классического понятия open source.

Контекст: гонка за Глобальный Юг

Релиз Qwen 3.5 не существует в вакууме. Alibaba открыто нацелена на рынки, где западные AI-сервисы труднодоступны — по финансовым, платёжным или инфраструктурным причинам. Поддержка 201 языка и диалекта — не техническая прихоть, а рыночная стратегия: компания хочет стать провайдером ИИ по умолчанию там, где OpenAI и Anthropic не дотягиваются.

Учитывая, что DeepSeek уже завоевал огромную аудиторию в этих регионах (включая Беларусь с её 56% проникновением), Alibaba запускает Qwen 3.5 в высококонкурентную среду. Но у Qwen есть преимущество: открытые веса и возможность локального развёртывания, что критически важно для компаний с чувствительными данными и для государств, которые не хотят зависеть от стороннего API.

Через десять дней после релиза флагмана Alibaba выпустит серию Qwen 3.5 Medium для локального запуска — но об этом мы расскажем отдельно.