Нейросети 14 июня 2026 · 10 мин чтения 295 0

AI agents и agentic workflows: Claude Code, LangGraph, AutoGen и MCP

За последние два года понятие AI-агента превратилось из академического термина в один из ключевых концептов индустрии. Если первая волна LLM-приложений строилась вокруг диалоговых интерфейсов — пользователь задаёт вопрос, модель отвечает — то вторая волна делает шаг дальше: модель сама планирует действия, использует инструменты, итеративно работает над задачей и возвращается с результатом. Это уже не чат-бот, а автономная программа, использующая языковую модель как мозг.

Появление таких систем меняет архитектуру корпоративных продуктов и подходы к автоматизации. Разбираем устройство современных AI-агентов: какие паттерны размышления лежат в основе, как работает tool use, чем отличаются ведущие фреймворки, где агенты реально приносят пользу и где они пока проваливаются на простых задачах.

Концепция AI-агента: автономия и tool use

AI-агент — это система, в которой LLM не просто генерирует текст, а получает доступ к набору инструментов (функций, API, баз данных, файловой системы) и сама решает, какие из них вызвать для решения поставленной задачи. После каждого вызова инструмента результат возвращается в модель, она оценивает прогресс и решает, что делать дальше: вызывать другой инструмент, переформулировать запрос или возвращать финальный ответ.

Ключевое отличие от классического приложения с LLM — наличие цикла. В обычном чат-боте модель отвечает один раз. В агенте модель работает в loop: думает, действует, наблюдает результат, снова думает. Цикл продолжается, пока агент не сочтёт задачу выполненной или не достигнет лимита итераций.

Тип системы Архитектура Уровень автономии
Чат-бот Один LLM-вызов, ответ → пользователь Нулевой
RAG-приложение Retrieval → LLM → ответ Низкий
Workflow с LLM Фиксированная цепочка LLM-вызовов Средний
AI-агент LLM в цикле с tool use и планированием Высокий
Multi-agent система Несколько агентов, обменивающихся данными Высший

ReAct, Plan-and-Execute, Tree of Thoughts

Паттернов размышления у современных агентов несколько. Самый распространённый — ReAct (Reasoning + Acting). Модель чередует шаги рассуждения и действия: «мне нужно узнать погоду в Минске → вызываю инструмент weather_api → получаю результат → формулирую ответ». ReAct прост в реализации и хорошо работает на задачах, где шаги легко формализуемы.

Plan-and-Execute разделяет планирование и выполнение. Сначала модель строит полный план — список шагов с инструментами и параметрами. Затем отдельный исполнитель проходит по плану, при необходимости корректируя его. Подход даёт более предсказуемые результаты на длинных задачах, но менее гибок при возникновении неожиданных ситуаций.

Tree of Thoughts расширяет одиночное рассуждение до дерева гипотез. Модель параллельно рассматривает несколько возможных путей решения, оценивает их и выбирает наиболее перспективный. Дороже в вычислениях, но даёт лучший результат на задачах с большим пространством решений — математических, логических, исследовательских.

Паттерн Сильные стороны Слабые стороны
ReAct Простота, гибкость, скорость отладки Плохо работает на длинных задачах
Plan-and-Execute Предсказуемость, верифицируемость плана Жёсткость, трудности с динамикой
Tree of Thoughts Качество на сложных задачах Высокая стоимость вычислений
Reflexion Самокоррекция через обратную связь Дополнительные циклы инференса

Tool use: function calling и MCP

Способность модели вызывать внешние функции называется tool use или function calling. Ведущие LLM-провайдеры реализовали стандартизированный механизм: разработчик описывает инструмент в JSON-схеме (имя, описание, параметры с типами), модель возвращает структурированный вызов с заполненными параметрами, приложение исполняет вызов и передаёт результат обратно в контекст.

В 2024 году появился протокол MCP (Model Context Protocol) — попытка стандартизировать интеграцию инструментов с LLM на уровне индустрии. MCP описывает универсальный интерфейс между языковой моделью и серверами инструментов: один сервер может предоставлять доступ к календарю, другой — к репозиториям кода, третий — к базе клиентов. Любой MCP-совместимый агент может подключиться к любому MCP-совместимому серверу без специфического кода интеграции.

MCP сравнивают с появлением USB для AI-агентов. Раньше каждая интеграция требовала отдельного кода и тестирования. Стандарт превращает интеграции в подключаемые модули, которые работают в любом совместимом окружении.

LangGraph: state machines для AI-агентов

LangGraph — фреймворк от команды LangChain для построения агентов на основе явных state machines. Разработчик описывает узлы графа (этапы работы агента) и переходы между ними (условные или безусловные). Каждый узел может быть LLM-вызовом, использованием инструмента, обработкой данных или ветвлением.

Подход даёт жёсткий контроль над поведением агента и упрощает отладку. В отличие от свободно-итерирующих агентов, LangGraph-системы предсказуемы: разработчик видит на графе все возможные пути выполнения. Минус — больше boilerplate-кода и менее гибкая работа с задачами, не вписывающимися в заранее заданный граф.

AutoGen: мульти-агентные диалоги

AutoGen от Microsoft Research строится на концепции диалогов между агентами. В системе создаются несколько агентов с разными ролями — пользователь-прокси, программист, тестировщик, критик — и они общаются друг с другом для решения задачи. Архитектура удобна для имитации профессиональных команд: один агент пишет код, другой проверяет, третий тестирует, четвёртый утверждает результат.

На бенчмарках сложных задач multi-agent системы показывают качество выше одиночного агента. Но возрастает стоимость — каждый агент это LLM-инстанс с собственным контекстом. На простых задачах overhead не окупается, multi-agent имеет смысл от уровня сложности, где одиночный агент стабильно не справляется.

Claude Code и подобные dev-агенты

Отдельное направление — агенты, специализированные на разработке программного обеспечения. Claude Code от Anthropic, Cursor с агентным режимом, Aider и подобные инструменты получают доступ к файловой системе проекта, могут читать и модифицировать код, запускать тесты, делать коммиты. Разработчик ставит задачу на естественном языке, агент сам разбирается со структурой проекта и вносит изменения.

Уровень автономии у таких агентов сильно зависит от настроек. В консервативном режиме каждое изменение требует подтверждения, в автономном — агент работает часами над сложными задачами без вмешательства. Зрелость dev-агентов выросла резко: то, что в 2023 году считалось фантастикой, в 2026-м становится повседневной частью рабочего процесса инженеров.

CrewAI и иерархические системы агентов

CrewAI продвигает концепцию «команды» агентов с явной иерархией. Менеджер-агент получает задачу, декомпозирует её на подзадачи и распределяет между исполнителями с соответствующей специализацией. Каждый агент-исполнитель имеет собственное описание роли, цели, набор инструментов.

Подход хорошо подходит для бизнес-процессов, где задачи естественно разбиваются на роли — маркетинг-исследование с агентом-аналитиком и агентом-копирайтером, генерация контента с агентом-исследователем и агентом-редактором. Сильная сторона — близость архитектуры к привычным организационным процессам, что упрощает осмысление и поддержку системы.

Фреймворк Парадигма Целевая аудитория
LangGraph State machines Production-системы с предсказуемой логикой
AutoGen Multi-agent dialog Сложные задачи, требующие критики и итераций
CrewAI Иерархия ролей Бизнес-процессы с явной декомпозицией
Claude Code Coding-агент с tool access Разработчики ПО
Custom MCP-агенты Свободная архитектура на MCP Команды с уникальными интеграциями

Где агенты реально работают, а где провисают

Сильные сценарии для агентов: задачи с чётко формализуемыми инструментами (вызов API, запрос к базе, выполнение кода), задачи с обратной связью (можно проверить результат и переделать), задачи с длинным контекстом, который сложно держать одной LLM-сессией. Примеры — автоматизация саппорта первой линии, исследование данных, написание и рефакторинг кода, поиск информации в корпоративных системах.

Слабые сценарии: задачи без чётких критериев успеха, задачи в плохо формализованных доменах (творческие, оценочные, эмпатийные), задачи с высокой ценой ошибки и невозможностью отката. Агент, которому поручили подобрать дизайн для лендинга, может выбрать «нормальный» вариант — но без эстетического чутья дизайнера он не отличит средний от выдающегося.

  • Хорошие use cases: data extraction, code generation, технический саппорт, research, ETL-процессы
  • Спорные use cases: творческое письмо, дизайн, стратегические решения
  • Плохие use cases: высокорисковые финансовые операции, юридические заключения, медицинские диагнозы

Cost-economics: цена автономности

Агент стоит дороже одиночного LLM-вызова. Каждая итерация — это полный запрос с контекстом, который накапливается. На задаче из 20–30 шагов общий объём токенов может достигать миллионов, что выливается в реальные деньги. Mult-agent системы умножают стоимость на количество агентов.

Расчёт ROI агента требует учёта не только стоимости инференса, но и экономии человеческого времени. Если агент за $0.50 решает задачу, которая у человека заняла бы 30 минут, экономия очевидна. Если за $5 решает задачу на 5 минут — экономика не сходится. Поэтому первые продакшен-внедрения часто касаются задач с высокой стоимостью человеческого часа и относительно низкой стоимостью ошибки.

Безопасность и guardrails для агентов

Автономный агент с доступом к инструментам — потенциально опасная система. Агент может удалить файлы по ошибке, отправить некорректное сообщение клиенту, превысить лимит API-вызовов, провести нежелательную транзакцию. Классические подходы к безопасности через permissions и audit-логирование становятся обязательными.

  • Allowlist инструментов: агент имеет доступ только к явно разрешённым операциям
  • Confirmation flow: критичные действия требуют подтверждения пользователя
  • Sandbox-окружение: агент работает в изолированном пространстве, не имея прямого доступа к production
  • Rate limiting: ограничение количества вызовов инструментов в единицу времени
  • Prompt injection защита: фильтрация контента, который агент получает от внешних источников
  • Audit log: запись всех действий с возможностью разбора инцидентов

Human-in-the-loop: где он нужен

Полностью автономный агент — частный случай. Большинство продакшен-агентов работают по схеме human-in-the-loop: на критических точках принятия решений агент останавливается и запрашивает подтверждение оператора. Это компромисс между скоростью автоматизации и контролем рисков.

Дизайн интеграции с человеком — отдельная задача. Если уведомлений слишком много, оператор перестаёт реагировать осмысленно и подтверждает всё подряд. Если слишком мало, агент может натворить вреда без своевременной остановки. Хороший дизайн human-in-the-loop опирается на калибровку confidence модели: только действия с низкой уверенностью требуют подтверждения, остальные проходят автоматически.

Эволюция профессии: что меняется

Появление зрелых AI-агентов перестраивает рабочие процессы разработчиков, аналитиков, маркетологов, специалистов поддержки. Не в формате «агент заменяет человека», а в формате «человек работает с агентом как с младшим коллегой». Меняется тип задач: меньше рутинного исполнения, больше постановки задач, верификации результатов, обработки исключений.

Для разработчиков это особенно заметно. Coding-агенты берут на себя написание boilerplate-кода, генерацию тестов, рефакторинг. Разработчик переключается на архитектурные решения, ревью изменений агента, постановку задач. Скорость работы команды растёт, но вместе с этим растут и требования к навыкам: способность чётко формулировать задачи, оценивать качество автоматически сгенерированного кода, понимать ограничения моделей.

Эволюция и зрелость технологии

AI-агенты в 2026 году находятся на ранней стадии массового внедрения. Базовые архитектуры стабилизировались, фреймворки продолжают развиваться, лучшие практики формируются на ходу. Зрелые внедрения существуют — в первую очередь в SaaS-компаниях, технологических стартапах, инженерных командах крупных корпораций. Массовое использование в традиционных отраслях ещё впереди.

Ключевые направления развития: повышение надёжности через лучшие модели и более продуманные guardrails, снижение стоимости инференса, стандартизация интеграций через MCP и подобные протоколы, появление специализированных моделей под агентные задачи. Через два-три года ожидается значительный рост проникновения AI-агентов в корпоративные процессы.

Часто задаваемые вопросы

Чем агент отличается от обычного workflow с LLM-вызовами?

Workflow — это фиксированная цепочка шагов, описанная разработчиком заранее. Агент сам выбирает, какие шаги выполнять и в каком порядке, исходя из текущего состояния задачи. У workflow предсказуемая стоимость и поведение, у агента — гибкость, но менее предсказуемые результаты.

Какой фреймворк выбрать для начала работы с агентами?

Для production-систем с чётко формализуемой логикой — LangGraph. Для исследований и сложных задач с критикой — AutoGen. Для бизнес-процессов с ролями — CrewAI. Для coding-задач — Claude Code или его аналоги. Для уникальных интеграций — custom-агент на MCP. Опытная команда часто использует несколько фреймворков под разные задачи.

Какие задачи нельзя поручать агентам?

Задачи с высокой ценой ошибки и без возможности человеческого контроля: критичные финансовые операции, медицинские решения, юридические заключения, операции с персональными данными без явной авторизации. Также плохо подходят задачи с нечёткими критериями успеха — творческие, эстетические, требующие глубокого человеческого понимания контекста.

Как контролировать стоимость агентов в продакшене?

Лимиты на количество итераций (max steps), ограничение длины контекста через периодическую суммаризацию, кэширование результатов одинаковых tool calls, выбор более дешёвых моделей для рутинных подшагов и дорогих для финальных решений, мониторинг расхода токенов с алертами на превышение бюджета.

Что такое MCP и зачем он нужен?

MCP — Model Context Protocol, стандартизированный интерфейс между языковыми моделями и серверами инструментов. Без MCP каждая интеграция пишется специфическим кодом. С MCP инструменты становятся подключаемыми модулями: один MCP-сервер для GitHub, другой для Slack, третий для базы данных, и любой совместимый агент работает со всеми ими одинаково.

Можно ли построить агента без специализированного фреймворка?

Да, базовый агент пишется на ~200 строках кода — цикл с LLM-вызовом, парсингом tool calls, исполнением функций, передачей результатов обратно. Фреймворки добавляют удобства: state management, отладку, мониторинг, готовые паттерны. Для прототипа и понимания механики стоит начать с самописного варианта, для production-системы — взять зрелый фреймворк.

Заключение

AI-агенты — следующий слой абстракции над языковыми моделями. Базовая LLM решает одну задачу за вызов; агент решает многошаговую задачу с использованием инструментов, итеративной проверкой и корректировкой. Технология вышла из стадии экспериментов и закрепляется в производственных системах — особенно в инженерных и аналитических доменах.

Ключевые элементы зрелого агентного решения — продуманная архитектура (выбор паттерна размышления и фреймворка), безопасность (guardrails, sandboxing, аудит), экономика (контроль стоимости итераций), интеграция с человеком (human-in-the-loop в критичных точках), evaluation (метрики качества и регулярные замеры). Без любого из этих элементов агент превращается в нестабильный прототип, который трудно поддерживать в продакшене.

В ближайшие пару лет агенты станут стандартным компонентом корпоративного софта — наряду с базами данных, очередями сообщений, кэшами. Команды, которые уже сейчас осваивают разработку и эксплуатацию агентных систем, получают значительное преимущество в скорости автоматизации и качестве продуктов.