Fine-tuning vs RAG vs few-shot: как адаптировать LLM под задачу
Три подхода к адаптации языковых моделей: few-shot prompting, RAG и fine-tuning. Когда какой применять, LoRA и QLoRA, гибридные стратегии.
Три подхода к адаптации языковых моделей: few-shot prompting, RAG и fine-tuning. Когда какой применять, LoRA и QLoRA, гибридные стратегии.
Как оценивать качество языковых моделей: академические бенчмарки MMLU и HELM, Chatbot Arena, LLM-as-Judge, golden sets и production-метрики.
Сравнение векторных баз для RAG и семантического поиска: архитектурные различия, типы развёртывания, специфика фильтрации и масштаба.
Современные AI-агенты в production: паттерны ReAct и Plan-Execute, tool use, MCP, ведущие фреймворки, безопасность и реальная экономика автономности.
Устройство RAG-пайплайна: стратегии чанкинга, embedding-модели, hybrid search, reranking, метрики качества и production-проблемы на масштабе.
Канадский стартап Cohere объявил о программе инвестиций на $20 млрд в AI-инфраструктуру Европы. Цель — стать «европейской альтернативой» OpenAI и Google.
DeepSeek выпустил preview модели V4 с 1,6 триллиона параметров. Pro и Flash версии, миллион токенов контекста, лидерство в open-source бенчмарках.
OpenAI представил GPT-5.5 — модель, которая позиционируется не как чат-бот, а как коллега-инженер. Самые сильные safeguards в истории компании.
OpenAI провёл брифинги для федеральных агентств, штатов и союзников Five Eyes по модели GPT-5.4-Cyber. AI становится инструментом национальной обороны.
Google выпустил Nano Banana 2 — обновлённую модель генерации изображений с контролем стиля и разрешения. Продолжение вирусного хита осени 2025.
Сундар Пичай раскрыл: модели Google обрабатывают 16 млрд токенов в минуту через API — рост с 10 млрд за квартал. Масштаб агентной эры.
Google выпустил Gemma 4 — четвёртое поколение open-source моделей, доступных через Model Garden. Лёгкая, быстрая, бесплатная.