Нейросети 17 апреля 2026 · 11 мин чтения 281 0

Prompt Engineering: 20 практических техник для работы с LLM

Prompt engineering — навык формулировать запросы к языковым моделям так, чтобы получать качественные результаты. На первый взгляд тривиальная штука: написал что хочешь — получил ответ. На практике разница между «средним» и «отлично написанным» промптом для одной и той же задачи даёт разницу в качестве ответа в разы. Освоение базовых техник занимает день, освоение всех нюансов — годы практики.

В этой статье — 20 практических техник prompt engineering, проверенных на frontier-моделях 2026 года (Claude, GPT, Gemini). Каждая техника с примером и указанием, в каких задачах она работает лучше всего. От базовых zero-shot и few-shot до продвинутых meta-prompting и chain-of-verification.

Базовые принципы качественного промпта

Перед изучением конкретных техник — три базовых принципа, на которых стоит всё остальное:

  • Clarity (ясность). Чем точнее сформулирован запрос, тем точнее ответ. «Напиши что-нибудь о маркетинге» даёт что угодно. «Напиши 5 ключевых причин снижения CTR в email-рассылках за последние 2 года» — конкретный результат.
  • Specificity (конкретность). Чем больше контекста и ограничений, тем меньше модель «фантазирует». Целевая аудитория, формат, длина, тон — всё это сужает вариативность ответа.
  • Structure (структура). Хорошо структурированный промпт с явным разделением на роли, контекст, задачу, формат вывода работает лучше потока сознания. Используйте XML-теги, заголовки, нумерацию.

Эти три принципа лежат в основе всех 20 техник ниже.

Техника 1. Zero-shot prompting

Простейший подход. Прямая постановка задачи без примеров. Модель решает на основе общих знаний.

Пример: «Классифицируй следующий отзыв как позитивный, нейтральный или негативный: „Заказывал две недели назад, всё ещё не пришло“».

Когда использовать: для типовых задач, которые модель решает «из коробки». Простые классификации, перевод, базовое резюмирование. Не подходит для специфических форматов или редких задач.

Техника 2. Few-shot prompting

Перед основным запросом приводится несколько примеров «вход → выход». Модель улавливает паттерн и применяет его к новому запросу.

Пример:

Классифицируй отзывы:

Отзыв: "Прекрасное обслуживание, рекомендую"
Категория: позитивный

Отзыв: "Долго отвечают, но в итоге помогли"
Категория: нейтральный

Отзыв: "Заказывал две недели назад, всё ещё не пришло"
Категория:

Когда использовать: для задач со специфическим форматом ответа или нюансами категоризации. Особенно эффективен с 3–5 примерами; больше — растёт стоимость токенов без пропорционального улучшения качества.

Техника 3. Chain-of-Thought (CoT)

Просьба к модели рассуждать пошагово перед финальным ответом. Резко улучшает качество в задачах, требующих логики или вычислений.

Стандартная формулировка: «Подумай по шагам перед ответом» или «Let’s think step by step».

Пример: «У меня 3 яблока. Я отдал половину другу, потом купил ещё 5. Сколько яблок осталось? Подумай по шагам».

Когда использовать: математика, логические задачи, многоступенчатые рассуждения, юридический анализ. С появлением reasoning-моделей (OpenAI o-серия, Claude Extended Thinking) частично заменена на «нативное» рассуждение модели, но классический CoT всё ещё работает с базовыми моделями.

Техника 4. Self-Consistency

Развитие CoT. Модель генерирует несколько вариантов решения с разной температурой, и финальный ответ — наиболее часто встречающийся среди них.

Реализация: запустить промпт 3–5 раз с temperature=0.7, проголосовать за самый частый ответ.

Когда использовать: задачи с дискретным ответом, где важна точность. Математика, классификации, фактологические вопросы. Минус — стоимость в 3–5 раз выше обычного запроса.

Техника 5. Tree of Thoughts

Модель исследует дерево возможных решений, оценивая каждую ветку и углубляясь в наиболее перспективные. Аналог стратегии шахматного движка.

Реализуется через структурированные промпты с явным указанием на исследование альтернатив или через специализированные фреймворки.

Когда использовать: задачи с пространством решений (планирование, креативные задачи, стратегический анализ). Сложнее в реализации, чем CoT, но даёт лучший результат на исследовательских задачах.

Техника 6. ReAct (Reasoning + Acting)

Модель чередует рассуждения и действия (вызовы инструментов). Структура: Thought → Action → Observation → Thought → …

Стандартный паттерн для агентских систем. Модель явно говорит, что собирается сделать, выполняет действие через tool, интерпретирует результат, планирует следующий шаг.

Когда использовать: задачи, требующие доступа к внешним данным или выполнения операций. Веб-поиск, работа с БД, файловые операции. Основа большинства AI-агентов.

Техника 7. Role prompting / Persona

Установка роли модели в начале промпта. «Ты опытный SEO-консультант с 10-летним стажем», «Ты технический рецензент академических статей».

Меняет стиль, глубину и тон ответов. Модель «вживается» в роль и подстраивает экспертизу под заявленную.

Когда использовать: когда нужна экспертная точка зрения или определённый стиль. Эффективнее в system prompt, чем в обычном сообщении. Не панацея — нельзя сделать модель «экспертом» в области, которой она не знает.

Техника 8. System prompt vs User prompt

Разделение инструкций на «системные» (контекст, роль, ограничения, формат) и «пользовательские» (конкретный запрос). System prompt имеет приоритет и сложнее «сбить» через user input.

Используется в API-режиме большинства провайдеров. Чат-интерфейсы (Claude.ai, ChatGPT) частично эмулируют это через настройки.

Когда использовать: production-системы с консистентным поведением. Помещайте всё, что должно сохраняться между запросами, в system prompt.

Техника 9. Format specification

Чёткое указание формата ответа: JSON, Markdown, XML, конкретные поля.

Пример: «Ответ верни строго в формате JSON со следующими полями: title (строка), tags (массив из 3–5 строк), summary (строка не более 100 слов).»

Современные модели поддерживают structured outputs через API (OpenAI structured outputs, Claude tool use). Это надёжнее, чем просить JSON в промпте: API гарантирует соответствие схеме.

Когда использовать: автоматическая обработка ответов модели, интеграция с другими системами, нужен предсказуемый формат.

Техника 10. Constraints (ограничения)

Явное указание ограничений: длина ответа, разрешённые/запрещённые слова, стиль, тон, аудитория.

Примеры ограничений:

  • «Не более 200 слов»
  • «Не используй технические термины»
  • «Тон должен быть формальным, для делового письма»
  • «Целевая аудитория — школьники 14–16 лет»
  • «Не упоминай конкретные бренды»

Когда использовать: контент с определёнными требованиями, маркетинговые материалы под конкретные платформы, юридические тексты с ограничениями по терминологии.

Техника 11. Step-by-step decomposition

Разбиение сложной задачи на явные шаги перед запросом результата. Отличается от CoT тем, что шаги задаёт человек, а не модель.

Пример: «Чтобы написать SEO-статью, выполни следующее по порядку: 1. Определи целевой запрос. 2. Проанализируй интент. 3. Составь структуру H2. 4. Напиши лид-абзац. 5. Раскрой каждый H2-раздел.»

Когда использовать: сложные creative-задачи, где у модели может «расплываться фокус», обучающие материалы, генерация по фиксированному шаблону.

Техника 12. Examples-driven (in-context learning)

Расширение few-shot. Использование 10–20 примеров для глубокого обучения формату или стилю в рамках одного запроса.

Большие контекстные окна современных моделей (миллионы токенов) позволяют включать обширные библиотеки примеров. Эффективно заменяет fine-tuning для многих задач.

Когда использовать: задачи со специфическим стилем (имитация бренда, перевод с уникальной терминологией), узкоспециализированные форматы.

Техника 13. Negative examples

Показ примеров того, как НЕ нужно делать. Модель учится избегать определённых паттернов.

Пример: «Вот пример плохого ответа: [пример]. Объясняю, почему он плохой: [объяснение]. Теперь напиши хороший вариант».

Когда использовать: когда модель регулярно делает определённую ошибку (слишком формальный тон, неуместные шутки, лишние оговорки), и явный запрет не работает. Negative examples часто эффективнее, чем «не делай X».

Техника 14. Self-critique / Self-refinement

Двухэтапный процесс: сначала модель генерирует ответ, потом критикует его и переписывает.

Реализация:

  1. «Напиши X»
  2. «Теперь критически оцени написанное: что можно улучшить?»
  3. «Перепиши с учётом критики»

Иногда объединяется в один промпт: «Напиши X, потом критически оцени и предложи улучшенную версию».

Когда использовать: контент, для которого нужно высокое качество — статьи, презентации, важные документы. Удваивает стоимость и время, но заметно повышает результат.

Техника 15. Prompt chaining

Разбиение сложной задачи на цепочку отдельных промптов. Результат одного шага становится контекстом для следующего.

Пример: цепочка для написания статьи:

  1. Промпт 1: сгенерировать список H2-заголовков
  2. Промпт 2: для каждого H2 написать структуру H3
  3. Промпт 3: написать каждый раздел отдельно
  4. Промпт 4: написать введение и заключение
  5. Промпт 5: проверить связность и переходы

Когда использовать: длинные структурированные документы, многоступенчатые анализы, задачи, не помещающиеся в один запрос по сложности. Реализуется через LangChain, LlamaIndex или собственный код.

Техника 16. Multi-step reasoning через workflow

Развитие prompt chaining. Каждый шаг — отдельный «специализированный» промпт со своим system prompt и форматом.

Пример. Анализ отзывов:

  1. Шаг 1: классификация тональности (модель-классификатор)
  2. Шаг 2: извлечение упомянутых аспектов продукта (extractor)
  3. Шаг 3: для негативных отзывов — генерация предложений по улучшению (advisor)
  4. Шаг 4: финальная сборка отчёта (writer)

Когда использовать: системы автоматической обработки больших объёмов, где разные стадии требуют разной экспертизы.

Техника 17. Output validation

Проверка структуры и содержания ответа после генерации. Если результат не соответствует требованиям — автоматический ре-промпт с указанием на ошибку.

Стандартная реализация:

  1. Получить ответ от модели
  2. Валидировать (JSON Schema, regex, business rules)
  3. Если невалиден — отправить обратно с описанием ошибки
  4. Повторять до 3 раз или до успеха

Когда использовать: production-системы, где важна гарантированная корректность ответов. Особенно при работе с JSON или другими структурированными форматами.

Техника 18. Temperature tuning

Параметр temperature контролирует случайность выбора следующего токена. Низкие значения (0–0.3) — детерминированные ответы. Высокие (0.7–1.5) — креативные, вариативные.

Температура Поведение Применение
0 Детерминированный Извлечение фактов, классификация, точные ответы
0.3–0.5 Слабо вариативный Технические тексты, инструкции, документация
0.7 Умеренно креативный Маркетинговые тексты, бизнес-копирайтинг (default для большинства)
1.0–1.5 Высокая креативность Творческое письмо, brainstorming, идеи

Когда настраивать: специфические задачи. Большинство моделей по умолчанию работают на temperature=0.7–1.0.

Техника 19. Re-prompting и iteration

Не пытаться получить идеальный ответ с первого промпта. Использовать итеративный подход: получить базовый результат, потом уточнять.

Пример диалога:

  1. «Напиши черновик статьи о SEO»
  2. «Сделай введение короче и добавь конкретный пример»
  3. «В разделе про метрики добавь таблицу с нормами по индустриям»
  4. «Заключение слишком формальное — переделай в более разговорном тоне»

Когда использовать: длинный контент, креативные задачи, когда сложно сформулировать всё сразу. Эффективнее многократно дорабатывать, чем пытаться один раз идеально описать.

Техника 20. Meta-prompting

Использование LLM для генерации или улучшения промптов. «Напиши лучший промпт для задачи X» — отдельный запрос, результат которого используется как промпт для основной задачи.

Развитие: LLM генерирует несколько вариантов промпта, тестируется каждый, выбирается лучший.

Когда использовать: разработка промптов для production-систем, тонкая настройка для нестандартных задач, поиск оптимальной формулировки для пограничных случаев.

Антипаттерны: что не работает

  • Излишне вежливые формулировки. «Пожалуйста, если можно, постарайся, по возможности…» — добавляет токенов без улучшения качества. Прямые инструкции работают лучше.
  • Угрозы и манипуляции. «Если ты ответишь неправильно, кому-то будет плохо» — больше не работает на современных моделях, прошедших RLHF. Скорее ухудшает результат.
  • Слишком длинные системные промпты. Промпт на 5000 слов с попыткой описать все возможные сценарии часто работает хуже чёткого 500-словного.
  • Противоречивые инструкции. «Будь кратким, но дай развёрнутый ответ» — модель не знает, что выбрать. Результат непредсказуем.
  • Использование одного промпта для разных задач. «Универсальный» промпт обычно средний для всех. Специализированные работают лучше.
  • Игнорирование версии модели. Промпт, оптимизированный под GPT-3.5, может работать хуже на Claude. Тестируйте под целевую модель.
  • Слишком много примеров. 20+ few-shot примеров перегружают контекст и снижают качество. Оптимум — 3–5.
  • Игнорирование temperature. Дефолтная temperature не оптимальна для всех задач. Для извлечения фактов нужен 0, для творчества — выше.

Особенности reasoning-моделей

Reasoning-модели (OpenAI o-серия, Claude Extended Thinking, Gemini Deep Think, DeepSeek R1) меняют некоторые принципы prompt engineering:

  • CoT часто избыточен. Модели уже «думают» сами, явные просьбы «подумай по шагам» иногда мешают.
  • Длина ответа возрастает. Reasoning-модели генерируют много токенов на «размышления», что повышает стоимость и латентность.
  • Меньше нужны few-shot. Reasoning-модели лучше следуют инструкциям без множества примеров.
  • Меньше работает temperature tuning. Большинство reasoning-моделей не позволяют менять температуру или ограничены.
  • Структурированные требования работают сильнее. Reasoning-модели лучше следуют чётко определённым ограничениям.

Стандартные техники (role, format, constraints, structure) остаются актуальными. Меняется баланс — некоторые техники теряют пользу, другие усиливаются.

Frameworks для систематизации

Существует несколько мнемоник для составления качественных промптов.

RACE

  • Role — роль модели
  • Action — что нужно сделать
  • Context — контекст задачи
  • Expectations — ожидаемый формат и качество

CRISPE

  • Capacity and Role
  • Request
  • Insight (контекст)
  • Statement (конкретика)
  • Personality (тон)
  • Experiment (вариативность)

Anthropic’s recommended structure

  1. Task description
  2. Context and background
  3. Examples (few-shot)
  4. Constraints
  5. Output format
  6. Actual request

Конкретный framework — не главное. Главное — наличие в промпте всех ключевых элементов: что делать, в каком контексте, с какими ограничениями, в каком формате.

Часто задаваемые вопросы

Сколько времени нужно на освоение prompt engineering?

Базовые техники — день или два практики. Уверенное применение под разные задачи — несколько недель. Эксперт-уровень для production-систем — годы опыта с разными моделями.

Работают ли промпты одинаково на разных моделях?

Нет. Промпт, отлично работающий на Claude, может давать средний результат на GPT и наоборот. При смене модели промпты нужно перетестировать и часто переформулировать.

Стоит ли использовать сложные техники для простых задач?

Нет. Для простой классификации не нужен Tree of Thoughts. Выбор техники зависит от сложности задачи и требований к качеству. Принцип минимальной сложности.

Можно ли автоматизировать prompt engineering?

Частично. Meta-prompting, A/B-тестирование промптов, инструменты типа DSPy автоматизируют поиск оптимальной формулировки. Но базовое понимание задачи и контекста всё равно требует человека.

Каковы лучшие источники для углубления?

Документация Anthropic (Prompt Engineering Guide), OpenAI Cookbook, Learning prompting (learnprompting.org), сабреддит r/PromptEngineering. Главный источник — практика с реальными задачами.

Заменит ли AI prompt engineers?

Парадоксально, но скорее усилит. С развитием моделей prompt engineering становится не «искусством обхода ограничений», а проектированием системных взаимодействий с AI. Это инженерная дисциплина, спрос на которую растёт.

Заключение

Prompt engineering — навык, который определяет, насколько полезным окажется AI в конкретной задаче. Те же модели, те же возможности, но один пользователь получает посредственные ответы, а другой — экспертные решения. Разница — в умении формулировать запросы. 20 техник из этой статьи — не догма, а инструменты в арсенале. Их освоение даёт преимущество, которое сложно догнать без практики. Команды, в которых каждый специалист владеет prompt engineering на хорошем уровне, в 2026 году обходят конкурентов с теми же AI-инструментами на десятки процентов производительности.