Агентная система — это несколько ИИ-моделей, которые делят задачу: планировщик, исполнитель, критик. Нужна, когда один вызов LLM не справляется: многошаговые процессы, поиск по нескольким источникам, принятие решений. Реализуется через LangChain, CrewAI, LangGraph. В РФ применяется с YandexGPT и GigaChat. Не используйте агентов там, где достаточно простого промпта.
Что такое агентная система
Обычный ИИ-ассистент работает по схеме «один вопрос — один ответ». Этого достаточно для FAQ и поддержки. Но реальные бизнес-задачи часто сложнее: нужно собрать данные из трёх систем, проверить факты, составить план и выполнить действия. Один промпт такое не осилит.
Агентная система — это когда ИИ:
- сам разбивает задачу на шаги;
- вызывает инструменты (CRM, базу знаний, API);
- проверяет промежуточные результаты;
- решает, что делать дальше;
- возвращает финальный ответ.
Главное отличие — агент принимает решения в цикле, а не один раз. Подробности про «простой» случай — в статье про ИИ-ассистентов.
Когда нужны агенты
| Задача | Подходит ли |
|---|---|
| Ответ на FAQ | Нет, обычный ассистент |
| Сложная заявка с проверкой | Да |
| Многошаговая аналитика | Да |
| Поиск в нескольких системах | Да |
| Составление договора по реквизитам | Да |
| Перевод текста | Нет |
| Сборка дашборда из сырых данных | Да |
Правило простое: если задача умещается в один промпт — агент не нужен. Если требует цикла «подумал → действие → проверка → следующий шаг» — нужен.
Архитектура
Типовая агентная система состоит из ролей:
| Роль | Что делает |
|---|---|
| Планировщик | Разбивает задачу на шаги |
| Исполнитель | Вызывает инструменты, ищет данные |
| Критик | Проверяет результат шага |
| Координатор | Решает, переходить к следующему шагу |
| Отвечающий | Формирует финальный ответ |
В простых системах роли объединены (одна модель в разных промптах). В сложных — каждая роль отдельная модель или отдельный сервис.
Схема
Запрос пользователя
↓
Планировщик (LLM)
↓
Шаг 1 → Исполнитель (LLM + tool)
↓
Критик (LLM или правило)
↓
Координатор: успех?
нет → повтор / план Б
да → Шаг 2
↓
...
↓
Отвечающий → ответ пользователю
Цикл может содержать 3–10 шагов. Каждый шаг — это вызов LLM плюс, возможно, внешний API. Стоимость растёт линейно, поэтому важно ограничивать число итераций.
Инструменты (tools)
Агент может вызывать:
- поиск по базе знаний (RAG);
- запрос в CRM или ERP;
- калькулятор, конвертер валют;
- отправку письма или сообщения;
- генерацию документа по шаблону;
- web-поиск (для РФ — через российские поисковые API).
Каждый инструмент описывается короткой функцией с описанием входа и выхода. Модель выбирает инструмент на основе описания.
Технологии в РФ
| Инструмент | Что это | Уровень зрелости |
|---|---|---|
| LangChain / LangGraph | Фреймворк для агентов на Python | Зрелый |
| CrewAI | Декларативная orchestration ролей | Растёт |
| LlamaIndex | Сильная RAG-часть + агенты | Зрелый |
| YandexGPT / GigaChat API | Модели, доступные в РФ | Стабильные |
| Qwen, Llama on-premise | Для чувствительных задач | Зрелые |
Готовых российских SaaS-агентов на рынке мало — чаще собирают в коде на перечисленных фреймворках, подключая отечественные модели. Это вписывается в требования 152-ФЗ — подробнее в «ИИ и персональные данные».
Кейс: обработка сложной заявки
Заявка приходит в свободной форме. Агент:
- Извлекает реквизиты клиента и потребность.
- Проверяет по CRM, есть ли уже клиент и активные сделки.
- Ищет в базе знаний релевантное предложение.
- Считает стоимость по прайсу.
- Генерирует КП и отправляет в CRM с задачей менеджеру.
Каждый шаг — отдельный промпт, между шагами — проверка качества. Если что-то не получилось, агент передаёт человеку, а не финализирует брак.
Такая система стоит 400–600 тыс. ₽ за пилот и окупается за 4–8 месяцев на компании с 300+ заявок в месяц. На меньшем объёме — не окупится.
Риски и ограничения
- Стоимость. Каждый цикл — 5–20 вызовов LLM. На больших объёмах счёт за API может быть 100+ тыс. ₽/мес.
- Latency. Цепочка из 5 шагов занимает 20–60 секунд. Для поддержки клиентов это много.
- Сложность отладки. Когда агент ошибся, трудно понять, на каком шаге.
- Расходимость. На сложных задачах агент может уйти в сторону и не прийти к ответу. Нужны ограничения числа шагов.
Когда не внедрять
- Малый объём (меньше 100 задач в месяц) — ручная обработка дешевле.
- Задача умещается в один промпт — это обычный ассистент, не агент.
- Высокие требования к скорости ответа (секунды) — агенты медленнее.
- Низкая зрелость процессов — без чистых данных и API агент работает плохо.
Архитектурные принципы
- Минимум шагов. Чем короче цикл, тем надёжнее и дешевле.
- Чёткие роли. Каждый промпт делает одну вещь.
- Ограничение итераций. Жёсткий лимит, иначе расходимость.
- Логирование каждого шага. Без логов невозможна отладка.
- Передача человеку на сомнениях. Лучше перестраховаться, чем довести брак до клиента.
Главное правило агентных систем: сложность — это стоимость. Внедряйте агентов там, где один промпт объективно не справляется, и закладывайте бюджет на отладку и сопровождение, а не только на разработку. Хорошая методология тестирования — в материале «Промпт-инжиниринг для бизнес-задач».
Комментарии · 0