RAG-системы: chunking, retrieval, reranking и hybrid search
Устройство RAG-пайплайна: стратегии чанкинга, embedding-модели, hybrid search, reranking, метрики качества и production-проблемы на масштабе.
Устройство RAG-пайплайна: стратегии чанкинга, embedding-модели, hybrid search, reranking, метрики качества и production-проблемы на масштабе.
Канадский стартап Cohere объявил о программе инвестиций на $20 млрд в AI-инфраструктуру Европы. Цель — стать «европейской альтернативой» OpenAI и Google.
DeepSeek выпустил preview модели V4 с 1,6 триллиона параметров. Pro и Flash версии, миллион токенов контекста, лидерство в open-source бенчмарках.
OpenAI представил GPT-5.5 — модель, которая позиционируется не как чат-бот, а как коллега-инженер. Самые сильные safeguards в истории компании.
OpenAI провёл брифинги для федеральных агентств, штатов и союзников Five Eyes по модели GPT-5.4-Cyber. AI становится инструментом национальной обороны.
Google выпустил Nano Banana 2 — обновлённую модель генерации изображений с контролем стиля и разрешения. Продолжение вирусного хита осени 2025.
Сундар Пичай раскрыл: модели Google обрабатывают 16 млрд токенов в минуту через API — рост с 10 млрд за квартал. Масштаб агентной эры.
Google выпустил Gemma 4 — четвёртое поколение open-source моделей, доступных через Model Garden. Лёгкая, быстрая, бесплатная.
Google запустил Gemini Enterprise Agent Platform — платформу для создания, масштабирования, управления и оптимизации AI-агентов в корпоративной среде.
Google представил восьмое поколение TPU: два специализированных чипа — TPU 8t для обучения и TPU 8i для инференса. Разделение обязанностей ради эффективности.
Исследование Cybersecurity Insiders: 92% организаций не имеют полной видимости AI-идентичностей в своих системах. 86% не применяют политики доступа.
Amazon увеличил инвестиции в Anthropic до $33 млрд. В ответ Anthropic обязалась потратить $100 млрд на AWS за 10 лет. Крупнейшая AI-сделка в истории.