vLLM на TPU: оптимизированный инференс для всех
Google оптимизировал vLLM — популярнейший движок инференса — для работы на TPU. Open-source модели теперь запускаются на инфраструктуре Google с максимальной эффективностью.
Google оптимизировал vLLM — популярнейший движок инференса — для работы на TPU. Open-source модели теперь запускаются на инфраструктуре Google с максимальной эффективностью.
Google объединил Threat Intelligence и Security Operations с облачной платформой Wiz в Agentic Defense — AI-агенты для обнаружения и реагирования на угрозы.
Google представил TorchTPU — нативную поддержку PyTorch для TPU. Разработчики запускают существующий PyTorch-код на TPU без переписывания.
Google превратил каждый сервис Google Cloud в инструмент для AI-агентов через MCP. Агенты управляют инфраструктурой, используя десятилетия телеметрии.
Google Cloud станет одним из первых, кто предложит Nvidia Vera Rubin NVL72 — следующее поколение GPU-систем после Blackwell.
GE Appliances развернула более 800 AI-агентов на базе Gemini Enterprise в производстве, логистике и цепочке поставок. Масштаб промышленного AI.
Google выпустил Nano Banana 2 — обновлённую модель генерации изображений с контролем стиля и разрешения. Продолжение вирусного хита осени 2025.
Deutsche Telekom построил MINDR — мультиагентную систему на Gemini, которая обнаруживает и исправляет сетевые проблемы автономно. Время реагирования сократилось на 95%.
Сундар Пичай раскрыл: модели Google обрабатывают 16 млрд токенов в минуту через API — рост с 10 млрд за квартал. Масштаб агентной эры.
Kubernetes 2026: базовые понятия (Pod, Deployment, Service), managed-сервисы (EKS, GKE, AKS, Yandex Cloud), стоимость, альтернативы (Cloud Run, ECS) и серьёзные ошибки внедрения.
Google Kubernetes Engine получил Agent Sandbox — изолированные среды для AI-агентов. 300 песочниц в секунду на кластер, менее секунды до первой инструкции.
Google выпустил Gemma 4 — четвёртое поколение open-source моделей, доступных через Model Garden. Лёгкая, быстрая, бесплатная.