Gemini 3.1 Pro: Google удвоил интеллект своей главной модели
19 февраля Google представил Gemini 3.1 Pro — первое обновление формата «.1» в истории серии Gemini, которое по масштабу улучшений тянет на полноценный новый продукт. Раньше компания использовала приращение «.5» для промежуточных обновлений, но на этот раз даже более скромная цифра скрывает за собой кардинальный скачок.
Двойной скачок в рассуждениях
Главная метрика, на которую делает ставку Google, — бенчмарк ARC-AGI-2, оценивающий умение модели решать логические задачи, которых она гарантированно не видела в обучающих данных. Gemini 3.1 Pro набрал 77,1% — более чем вдвое выше результата предшественника Gemini 3 Pro, показавшего 31,1%. Скачок в 46 процентных пунктов за одно обновление — крупнейший в истории любого семейства моделей.
Но ARC-AGI-2 — не единственный бенчмарк, где Gemini 3.1 Pro лидирует. По научным знаниям (GPQA Diamond) модель достигла 94,3% — рекордный показатель для любой модели на этом тесте. На LiveCodeBench Pro — рейтинг Elo 2887, что значительно выше GPT-5.2 (2393) и Gemini 3 Pro (2439). На MCP Atlas, тестирующем способность координировать инструменты, — 69,2%, лучший результат среди всех протестированных моделей. Всего Gemini 3.1 Pro занимает первое место по 12 из 18 отслеживаемых бенчмарков.
Три уровня мышления
Ключевое архитектурное нововведение — трёхуровневая система мышления. Gemini 3 Pro работал в двух режимах: Low (быстро, поверхностно) и High (глубоко, медленно). Gemini 3.1 Pro добавляет промежуточный уровень Medium, который позволяет разработчикам гибко настраивать баланс между качеством ответа, глубиной рассуждения и скоростью отклика.
На практике это означает, что один и тот же API можно использовать для разных задач без смены модели: Low для быстрой классификации, Medium для стандартной работы с документами, High для глубокого анализа научных статей или сложного рефакторинга кода.
Увеличенный выход
Контекстное окно осталось на отметке 1 миллион токенов, но объём генерируемого текста вырос до 65 536 токенов — вдвое больше, чем у большинства конкурентов. Это решает конкретную боль разработчиков: Gemini 3 Pro нередко обрезал генерацию кода примерно на 21 000 токенов, заставляя запрашивать продолжение. Теперь рефакторинг крупных файлов, генерация длинных отчётов и создание объёмных документов возможны за один проход.
Мультимодальные возможности также расширены: модель принимает до 900 изображений в одном промпте, до 8,4 часа непрерывного аудио и до одного часа видео.
Цены и доступность
Стоимость осталась прежней: $2 за миллион входных токенов и $12 за миллион выходных. Для сравнения: Claude Opus 4.6 от Anthropic стартует с $5/$25 за аналогичные объёмы. Модель запущена в статусе preview через Gemini API в Google AI Studio, Vertex AI, приложение Gemini, NotebookLM, Android Studio и новую платформу для агентной разработки Google Antigravity.
Google обещает довести Gemini 3.1 Pro до общедоступного релиза «в ближайшее время» после проверки стабильности на масштабных агентных сценариях. Учитывая, что Gemini 3 Pro уже снят с поддержки в пользу 3.1, переход для разработчиков, по сути, обязателен.
Контекст: борьба за корону
Релиз Gemini 3.1 Pro происходит в разгар острой конкуренции. В тот же месяц Alibaba выпустила Qwen 3.5, а Anthropic продолжает развивать Claude Opus 4.6. Каждая компания лидирует в своей нише: Claude — в длинных текстовых задачах и кодировании, Qwen — в соотношении качества к цене, Gemini — в мультимодальных и агентных сценариях.
Для конечного пользователя и разработчика это означает одно: эпоха, когда одна модель безоговорочно доминировала по всем метрикам, закончилась. Выбор инструмента теперь зависит от конкретной задачи, бюджета и инфраструктурных предпочтений.


