Разработка 26 февраля 2026 · 2 мин чтения 228 0

Qwen 3.5 Medium: топовая ИИ-модель, которая запускается на домашнем ПК

Через десять дней после релиза флагманской Qwen 3.5 Alibaba представила серию Qwen 3.5 Medium — компактные модели, оптимизированные для локального запуска. Идея проста: интеллект фронтирного уровня на обычном оборудовании.

Архитектура эффективности

Флагман серии — Qwen3.5-35B-A3B — содержит 35 миллиардов параметров, но для обработки каждого токена активирует лишь 3 миллиарда. За этим стоит архитектура Mixture-of-Experts: 256 экспертов, из которых для каждого запроса задействуются только 8 маршрутизируемых и 1 общий. Это как команда из 256 специалистов, где на каждый вопрос отвечают лишь девять самых релевантных.

Ключевое преимущество — сохранение качества при квантизации до 4-битных весов. Модель сжимается в разы с минимальной потерей точности, что радикально снижает требования к видеопамяти. Контекстное окно превышает 1 миллион токенов — и это первый случай, когда модель фронтирного уровня с таким контекстом доступна для запуска на потребительском оборудовании.

Бенчмарки

На тесте MMMLU (мультиязычные знания) модель обходит GPT-5 mini и Claude Sonnet 4.5. На MMMU-Pro (визуальное рассуждение) превосходит модели с вдвое большим числом параметров, включая предшественницу Qwen3-235B. Три модели серии доступны под лицензией Apache 2.0 на Hugging Face: Qwen3.5-35B-A3B, Qwen3.5-122B-A10B и Qwen3.5-27B.

Для кого это

Локальный запуск — не прихоть, а необходимость для тех, кто работает с конфиденциальными данными, в изолированных средах или просто не хочет зависеть от стороннего API. Qwen 3.5 Medium делает это реальным без аренды серверов: достаточно рабочей станции с 24–48 ГБ видеопамяти.

Четвёртая модель серии — Qwen3.5-Flash — доступна только через API Alibaba Cloud по цене, существенно ниже западных аналогов. Для тех, кому локальный запуск не нужен, но важна экономия — это дополнительный вариант.