AI‑агенты: переход от инструментов к автономным исполнителям в бизнесе
Прорыв в области больших языковых моделей изменил технологический и бизнес‑ландшафт. Если раньше AI преимущественно выполнял роль мощного, но пассивного инструмента, то в 2025 году на первый план вышли AI‑агенты.
28 октября 2025 г.
20 минут чтения
Краткий пересказ YandexGPT
AI-агенты — это автономные системы, которые способны понимать сложные цели, планировать шаги для их достижения и взаимодействовать с цифровой средой.
По прогнозам Gartner, к 2028 году 33% корпоративных программных приложений будут включать агентный AI, а не менее 15% рабочих решений будут приниматься автономно.
AI-агенты классифицируются по архитектуре, сложности и способностям: простые рефлекторные, модельно-ориентированные, целеориентированные, полезностно-ориентированные, обучающиеся и мультиагентные системы.
Yandex AI Studio — платформа, которая объединяет модели и инструменты для разработки и внедрения AI-агентов в бизнес-процессы. Она включает в себя компоненты для ядра рассуждений, памяти и поиска, инструментов, планирования и разработки, интеграции и выполнения.
Среди компонентов Yandex AI Studio — Model Gallery (каталог моделей), AI Search (поиск по корпоративным файлам и интернет-источникам), MCP Hub (для создания и подключения MCP-серверов), Agent Atelier (среда для создания AI-агентов) и Yandex Workflows (конструктор рабочих процессов).
Внедрение AI-агентов связано с рисками и вызовами, такими как качество и точность ответов, безопасность и уязвимости, технологическая сложность. Для снижения рисков необходимо проводить тестирование, верификацию, валидацию, мониторинг метрик, использовать изолирование кода и инструментов, наблюдаемость и аудит.
AI-агенты уже применяются в различных отраслях: клиентский сервис и поддержка, персонализация и маркетинг, HR и внутренние помощники, разработка и эксплуатация ПО, аналитика и поиск.
AI‑агенты — это не просто улучшенные боты, а автономные системы, обладающие агентностью — способностью понимать сложные цели, самостоятельно планировать шаги для их достижения и активно взаимодействовать с окружающей цифровой средой.
Этот переход знаменует сдвиг от автоматизации отдельных задач к автоматизации целых процессов. По прогнозам Gartner, к 2028 году 33% корпоративных программных приложений будут включать агентный AI, а не менее 15% рабочих решений будут приниматься автономно. Интерес к агентным системам растёт, что подтверждает резкое увеличение количества научных статей, опенсорс‑проектов и вакансий в этой области с середины 2023 года.
Меняются и архитектурные подходы. По данным Menlo Ventures, в 2024 году RAG стал доминирующим паттерном (51% проектов), а AI‑агенты стали самым быстрорастущим направлением, поднявшись с 0 до 12% за год.
При этом базовые технологии (сами LLM) постепенно коммодитизируются — открытые модели догоняют проприетарные по качеству. Основная гонка перемещается на более высокие уровни: платформы, продукты и конкретные бизнес‑применения. В ответ на этот запрос технологии эволюционируют.
В статье разберём, что такое AI‑агенты и как они устроены, а также подробно рассмотрим Yandex AI Studio — нашу платформу, которая объединяет все необходимые модели и инструменты для разработки и внедрения интеллектуальных агентов в бизнес‑процессы.
Что такое AI‑агенты и зачем они нужны
В основе концепции лежит классическое определение из области искусственного интеллекта: агент — это сущность, которая способна воспринимать окружающую среду через сенсоры и воздействовать на неё через актуаторы — исполнительные механизмы.
В технологическом контексте AI‑агент — это система, которая автономно выполняет многоэтапные задачи, используя рассуждения, память и доступные инструменты для достижения цели, которую задаёт пользователь.
Ключевое отличие агента от традиционного программного обеспечения или систем роботизации процессов (RPA) заключается в его гибкости и автономности. Обычное ПО работает по жёстко заданному алгоритму («если произошло А, сделай Б») и не справляется с неопределённостью. AI‑агент, напротив, получает высокоуровневую цель, например «обработать заказ клиента», и самостоятельно определяет последовательность действий, адаптируясь к ситуации в процессе.
Важно отличать AI‑агентов от классических ML‑моделей. Разница заключается в способности действовать:
Агент действует сам: ставит цель, планирует шаги и запускает нужные инструменты.
Модель предсказывает результат, а решает, что делать дальше, человек или другая система.
Три подхода к автоматизации: традиционное ПО, ML‑модель и AI‑агент
Традиционное ПО
ML‑модель
AI‑агент
Основная функция
Автоматизация рутинных, повторяющихся задач.
Анализ данных, прогнозирование, классификация.
Выполнение сложных, многоэтапных задач, требующих рассуждений.
Автономность
Низкая. Работает строго по сценарию.
Низкая. Предоставляет результат анализа, но не действует.
Высокая. Самостоятельно планирует и выполняет действия.
Адаптивность
Отсутствует. Не справляется с исключениями.
Средняя. Может переобучаться на новых данных.
Высокая. Адаптируется к контексту и новым инструкциям.
Принятие решений
На основе жёстких правил.
На основе статистических закономерностей.
На основе рассуждений, контекста и поставленной цели.
Взаимодействие с системами
Ограниченное, жёстко заданное.
Пассивное (получение данных).
Активное (использование инструментов и API).
Тренд на AI‑агентов обусловлен качественным скачком в возможностях языковых моделей. LLM обеспечили необходимую базу для рассуждений и понимания контекста. Это позволяет автоматизировать не просто рутинные операции, а сложные когнитивные процессы, ранее требовавшие человеческого интеллекта.
Типы AI‑агентов
AI‑агенты классифицируются по их архитектуре, сложности и способностям. Понимание этих типов помогает архитекторам и продакт‑менеджерам выбрать подходящее решение для конкретной задачи.
Классификация агентов
Классическую систематизацию в 1995 году предложили профессор информатики UC Berkeley Стюарт Рассел и директор по исследованиям Google Питер Норвиг. Она делит агентов по их сложности и возможностям:
Простые рефлекторные агенты. Действуют только на основе текущего восприятия, игнорируя историю. Работают по принципу «условие — действие». Пример: спам‑фильтр.
Модельно‑ориентированные агенты. Поддерживают внутреннюю модель мира, отслеживая изменения в среде. Это позволяет им работать в условиях частичной наблюдаемости. Пример: продвинутая система мониторинга IT‑инфраструктуры.
Целеориентированные агенты. Обладают информацией о цели и планируют последовательность действий для её достижения. Большая часть практических LLM‑агентов в бизнесе работает по этой схеме.
Полезностно‑ориентированные агенты. Используются, когда нужно выбрать оптимальный способ достижения цели среди нескольких вариантов. Руководствуются функцией полезности. Пример: агент для управления инвестиционным портфелем.
Обучающиеся агенты. Способны модифицировать своё поведение и улучшать производительность на основе прошлого опыта. Многие современные агенты на базе LLM меняют поведение за счёт опыта.
Мультиагентные системы
Отдельно выделяют мультиагентные системы (Multi‑Agent Systems, MAS). Это среды, в которых несколько агентов взаимодействуют друг с другом для решения задач, слишком сложных для одного агента. Взаимодействие может быть кооперативным (например, команда ботов, совместно пишущих отчёт) или конкурентным — например, когда агенты ведут переговоры о цене поставки или соревнуются в поиске уязвимостей.
Устройство и разработка AI‑агентов на базе Yandex AI Studio
Современные AI‑агенты строятся из модулей. В основе — четыре компонента: ядро рассуждений на базе LLM или VLM, инструкция промта, память с контекстом и инструменты для действий во внешнем мире.
Создание такой системы требует связать разные технологии и процессы: от развёртывания моделей и эффективного инференса до поиска по документам, безопасности и контроля качества. Мы развиваем платформу Yandex AI Studio, чтобы собрать эти элементы в одной экосистеме и дать удобные интерфейсы для разработки и исполнения агентов.
Внутреннее состояние модели, включающее её текущие параметры и историю предыдущих сообщений или действий.
AI Studio совместима с OpenAI‑совместимыми интерфейсами. Для текста используется Responses API, для голоса — Realtime API. Для работы с корпоративной базой знаний ассистенты подключают инструменты VectorStore и WebSearch.
Как архитектура агента собирается из сервисов Yandex AI Studio
Компонент агента
Функция
Сервисы Yandex AI Studio
Ядро рассуждений
Языковая или визуально‑лингвистическая модель. Понимание задачи, рассуждение, принятие решений.
Agent Atelier — среда для сборки и тестирования AI‑агентов на базе API и low‑code.
Yandex Workflows — графический конструктор процессов и интеграций.
Интеграция и выполнение
Встраивание агента в приложения и управление стейтом.
Responses API — текстовые агенты по OpenAI‑совместимому интерфейсу.
Realtime API — голосовые агенты по WebSocket с потоковыми событиями.
Теперь разберём каждый компонент Yandex AI Studio подробнее.
Команда ML‑сервисов Yandex Cloud
Развиваем Al‑платформу в Yandex Cloud — создаём сервисы и инструменты для разработчиков, которые внедряют ML в свои продукты. Наша цель — построить лучшую публичную облачную Al‑платформу в России.
Модели для сортировки, преобразования, уточнения и разделения текста.
Llama создана компанией Meta. Meta признана экстремистской организацией, её деятельность в России запрещена.
Небольшой фрагмент текста.
Приведение слова к начальной форме.
Reciprocal Rank Fusion — метод комбинирования ранжирования результатов.
Model Gallery
Model Gallery — каталог моделей в Yandex AI Studio. Доступны собственные модели YandexGPT 5 Lite, YandexGPT 5.1 Pro и YandexART, а также актуальные опенсорс‑модели и специализированные модели: классификаторы, эмбеддеры, реранкеры и токенизаторы. В галерее представлены текстовые и мультимодальные варианты для работы с изображениями.
Варианты использования моделей в Model Gallery: базовый инстанс, выделенный инстанс, пакетная обработка:
Базовый инстанс. Быстрый старт с оплатой за потреблённые токены. Подходит для прототипов и нерегулярной нагрузки. К моделям можно обращаться в AI Playground, по API и через Yandex Cloud ML SDK.
Выделенный инстанс. Нужен для продакшн‑сценариев с гарантированными параметрами работы и стабильным временем ответа. Инстанс разворачивается и управляется в Yandex AI Studio, платформа обеспечивает устойчивый и эффективный инференс. Функциональность находится на стадии Preview.
Пакетная обработка. Массовая обработка датасетов одним запуском, когда строгих требований по времени нет. Результат формируется в течение часов и сохраняется в виде датасета. Доступен широкий набор текстовых и мультимодальных опенсорс‑моделей, включая линейки Qwen, Gemma и DeepSeek. Запуск возможен из консоли, через Yandex Cloud ML SDK и Batch API.
Эксплуатация крупных моделей требует внимательной работы с производительностью и устойчивостью. AI Studio решает эту проблему: для базового инстанса ничего дополнительно настраивать не нужно, а для выделенного инстанса платформа оптимизирует инференс и изолирует пользователя от чужого трафика. Для выделенных инстансов фиксируются метрики производительности — TTFT — время до первого токена от момента запроса, Latency — время до полного ответа, TPS — число токенов в секунду при генерации.
Модели можно адаптировать под задачи бизнеса через Tuning API. Поддерживается метод LoRA для YandexGPT 5 Lite и Llama 8B, а также дообучение классификаторов и модели эмбеддингов. Функциональность находится на стадии Preview.
AI Search
Агенту нужна память. Краткосрочная хранит контекст диалога в треде — модель опирается на неё, когда отвечает в рамках текущего разговора. Долгосрочная собирает знания компании и «кормит» RAG‑контур, чтобы ответы оставались точными и актуальными. В Yandex AI Studio такой контур строится вокруг AI Search.
Что относится к AI Search
База знаний состоит из двух сущностей — файлов‑источников и поисковых индексов. Файлы загружают через Files API или Yandex Cloud ML SDK, затем из них строят индекс нужного типа: текстовый, векторный или гибридный. Индексация идёт асинхронно: при создании индекса возвращается идентификатор операции. После завершения построения можно удалить исходные файлы, если не нужны ссылки на источники.
Retrieval для ассистента
Ассистент подключает инструмент Retrieval. Инструмент берёт из индекса релевантные фрагменты и подмешивает их в контекст перед генерацией ответа. В конфигурации ассистента задают стратегию обращения к индексу — всегда или по решению модели — и ограничение на число фрагментов, которые попадут в подсказку модели. Сейчас ассистент поддерживает один индекс за раз.
Настройки индекса
Для разбивки текста доступна статическая стратегия с управлением размером чанка и перекрытием, значения задаются в токенах. Для текстового поиска настраивают токенизацию — n‑граммы через NgramTokenizer или словарный разбор через standardTokenizer — и выбирают анализатор: стандартный или Yandex Lemmer для лемматизации. В гибридном поиске доступны стратегии нормализации оценок релевантности и объединения ранжирований — среднее с весами или RRF. Эти параметры помогают согласовать влияние текстового и векторного поиска.
Метаданные и фильтры
Метаданные задают и у файлов, и у индексов. Их используют для фильтрации результатов и для понятных ссылок на источники в ответах ассистента. Если файлы после построения индекса удалены, ссылки на источники недоступны — индекс продолжает работать, но блок с источниками будет пустым.
Зачем это всё агенту
Сценарий RAG подтягивает факты из корпоративной базы знаний и снижает вероятность галлюцинаций — модель отвечает, опираясь на найденные фрагменты, а не только на общее обучение.
MCP Hub и WebSearch: инструменты для действий
Это набор готовых инструментов и API, через которые агент выходит во внешний мир. С ними он получает данные из корпоративных систем и интернета и может выполнять действия по правилам сценария.
WebSearch
Инструмент WebSearch встроен в Yandex AI Studio. Он позволяет агенту искать информацию в поиске Яндекса, а также ограничивать область и задавать фильтры по дате, языку и формату. Использование инструмента тарифицируется как генеративный ответ сервиса Yandex Search API.
MCP Hub
MCP Hub — часть Yandex AI Studio для создания, подключения и мониторинга MCP‑серверов. Один MCP‑сервер может содержать до двадцати инструментов. Типовые сценарии — интеграции с CRM и ERP, подключение внутренних хранилищ и внешних API, автоматизация бизнес‑процессов. Функциональность находится на стадии Preview.
Что можно делать в MCP Hub:
Подключать существующие внешние MCP‑серверы и использовать их инструменты в агентах. Допускаются серверы на smithery.ai, из Yandex Cloud Marketplace или развёрнутые в собственной инфраструктуре.
Создавать собственные MCP‑серверы с нуля и добавлять инструменты трёх типов: HTTPS‑запросы к внешним API, функции Yandex Cloud Functions и рабочие процессы Yandex Workflows.
Преобразовывать имеющийся API в инструменты MCP прямо в консоли AI Studio, чтобы модель могла вызывать нужные методы.
Подключение к MCP‑серверу выполняет компонент MCP Connector. Сами серверы создаются и настраиваются в MCP Hub.
Agent Atelier и Yandex Workflows: среда разработки и планирование
В Yandex AI Studio агенты проектируются и настраиваются в Agent Atelier, а сложные цепочки действий и интеграций удобно оркестровать в Yandex Workflows. Этот тандем закрывает и «кодовые» сценарии через OpenAI‑совместимые API, и визуальную сборку процессов через конструктор шагов.
Agent Atelier — среда для создания текстовых и голосовых AI‑агентов. Агенты подключают модели, инструменты и память, могут автоматически вызывать Retrieval и WebSearch, а к внешним системам выходят через MCP Connector. Для разработки доступны OpenAI‑совместимые Responses API для текста и Realtime API для голоса. Поддерживаются фреймворки OpenAI SDK, LangChain и LangGraph.
Yandex Workflows — low‑code‑конструктор рабочих процессов. Сценарии собирают из готовых интеграционных и управляющих шагов, настраивают сеть выполнения и сервисный аккаунт, а запуск возможен из консоли, CLI или по API. Для экспериментов и дообучения моделей под задачи бизнеса удобно использовать Yandex DataSphere.
Responses API: интеграция и выполнение
Чтобы встроить агентов в приложения, Yandex AI Studio предлагает два OpenAI‑совместимых API:
Responses API
Движок текстового агента. Он держит контекст переписки, управляет вызовами инструментов и собирает финальный ответ. Агент может автоматически вызывать Retrieval и WebSearch, а к внешним системам выходит через MCP. Подключение MCP выполняется напрямую — указывается адрес MCP‑сервера и ключ доступа в описании инструмента типа mcp. Поддерживается потоковая выдача — это важно для интерфейсов с живым откликом. В режиме совместимости с OpenAI поток включается параметром stream.
Realtime API
Используется для голосовых сценариев. Интерфейс событийный поверх WebSocket. Клиент отправляет аудио или текст, сервер возвращает частичные и финальные ответы в виде текста и синтезированной речи, а сессии держат историю диалога до завершения соединения. Поддерживаются инструменты, включая Retrieval и WebSearch.
Оба API подключают инструменты и память и сохраняют состояние между запросами, так что агент умеет продолжать разговор и опираться на контекст.
Текстовые агенты на Responses API и инструменты Vector Store — в статусе GA. Голосовые агенты и Realtime API — в статусе Preview.
Риски, вызовы и как их снижать
Внедрение ИИ‑агентов открывает новые возможности, но требует дисциплины в качестве, безопасности и комплаенсе.
Преимущества
Риски и вызовы
Как снижать
Гиперавтоматизация сложных процессов. Агенты берут на себя анализ данных, составление ответов, координацию задач и работу с клиентами.
Качество и точность. LLM могут выдавать уверенные, но неверные ответы. RAG снижает риск за счёт опоры на внешние источники, но не устраняет его полностью. Нужны регулярные процедуры тестирования и валидации качества.
Приземлять ответы на источники через RAG, а не только промт‑инженерию.
Выстраивать тесты, верификацию, валидацию и непрерывный мониторинг метрик.
Добавлять трассировку цепочек подсказок и A/B‑эксперименты, чтобы «ловить» деградации.
Повышение эффективности и снижение затрат. Агенты работают параллельно и стабильно выдерживают пики нагрузки.
Безопасность и уязвимости. Риски несанкционированных действий, утечки данных и инъекций, в том числе через внешние источники. Особенно критично это при доступе к инструментам и API.
Подробно о том, как безопасно разрабатывать AI‑агентов и мультиагентные системы, мы рассказывали в отдельной статье.
Масштабируемость операций. «Цифровая рабочая сила» растёт быстрее и дешевле, чем штат.
Технологическая сложность. Сборка и эксплуатация агентных систем требуют зрелых практик разработки и безопасности для моделей и интеграций.
Изолировать выполнение кода и инструментов в управляемых средах.
Использовать наблюдаемость, централизованные логи и аудит.
Облачные платформы снимают часть рисков за счёт готовых сервисов безопасности и наблюдаемости. В нашей экосистеме за это отвечают управление секретами в Yandex Lockbox, журналы в Yandex Cloud Logging и аудит на уровне организации в Yandex Audit Trails. Также доступна платформа Yandex Security Deck — CNAPP c модулями прозрачности доступа и DSPM для контроля данных и соответствия требованиям.
Эти инструменты повышают видимость действий, упрощают расследования и позволяют выполнять требования внутренних и внешних проверок.
Применение Yandex AI Studio в бизнесе
AI‑агенты уже меняют ключевые процессы в компаниях разных отраслей. Платформа AI Studio и наши сервисы дают готовую инфраструктуру для быстрого запуска — от прототипов до устойчивых продакшн‑нагрузок.
Клиентский сервис и поддержка
Агенты берут на себя рутину в контакте с клиентом и помогают держать стабильное качество даже при всплесках обращений. Это не скриптовые боты, а системы, которые понимают контекст и умеют действовать.
Skyeng обрабатывает до 10–30 тыс. обращений в неделю на базе омниканального контакт‑центра и технологий распознавания и синтеза речи Yandex SpeechKit. Автоматизация сократила расходы на исходящие звонки примерно на 90%, а конверсия выросла с 39% до 56% и выше в отдельных сценариях.
Kolesa Group автоматизировала обзвон для актуализации объявлений: робот на SpeechKit дозванивается до 80% «молчащих» пользователей, конверсия в целевое действие — 20%, затраты на обзвон снизились вдвое.
«Актион» вместе с Just AI за год запустили 45 голосовых роботов. Нагрузка — 700–800 тыс. минут разговоров в месяц, до 25% операторов получают «подогретые» лиды от роботов, локально по направлениям конверсия доходила до 45%.
SalesAI ускорила контроль качества звонков: с Yandex SpeechKit поток обрабатывается в 15 раз быстрее, семиминутный звонок анализируется за минуту. Архитектура построена на управляемых сервисах Yandex Cloud.
Эти примеры показывают, как голосовые и текстовые агенты снимают нагрузку с операторов и ускоряют реакции системы без просадки в качестве общения.
Персонализация и маркетинг
ИИ позволяет говорить с покупателем на его языке — от контента карточек на маркетплейсах до уникального визуала. Персонализация работает, когда она массовая, быстрая и при этом бережная к бренду. Эти кейсы как раз об этом.
Яндекс Маркет подключил YandexGPT для генерации описаний. За полгода создано более 2 млн текстов — порядка 10 тыс. в день. 52% описаний продавцы приняли в работу, что дало плюс 1,1% к заказам без дополнительных затрат. Для изображений используется YandexART.
«Золотое Яблоко» запустило персонализацию электронных подарочных карт с YandexART. Доля карт с нейродизайном достигла 18%, конверсия выросла на 5 п. п., средний чек по таким картам — на 8%. В пиковые дни система выдерживала до 150 генераций в минуту при времени ответа до 15 секунд.
VINO.RU создала «цифрового сомелье» на YandexGPT и встроила его в телеграм‑бота. В августе 2024 года 12% заказов пришли после общения с ботом. За первые месяцы им воспользовались более 9 тыс. клиентов. Персонализированные письма, сгенерированные ИИ, прибавили 70% к конверсии.
ИИ помогает закрывать вакансии быстрее и делает корпоративные знания доступными. Внутренние ассистенты разгружают бэкофис и ускоряют принятие решений, а рекрутинговые выравнивают спрос и предложение труда без расширения штата.
Fix Price с партнёром Vocamate автоматизировали массовый наём: роботы обработали свыше 1,5 млн резюме, совершили более 1 млн звонков и ежемесячно приглашают на собеседование около 2,5 тыс. кандидатов. Доля приглашений — 23%, среднее время реакции — около минуты. Платформа работает в Yandex Cloud и использует Yandex SpeechKit.
Банки.ру развернули чат‑бота на базе YandexGPT для поиска по внутренней базе знаний объёмом 135 Гб и более 630 тыс. страниц. Время ответа — около 1,3 секунды. Инфраструктура — управляемые сервисы Kubernetes®, PostgreSQL и OpenSearch в Yandex Cloud.
ML‑инструменты в облаке помогают масштабировать сервисы без потерь в качестве и бюджете. Когда ML‑среда и вычисления управляемые, команда быстрее экспериментирует и переносит модели в продакшн.
«Леруа Мерлен Восток» в 2022 году обучила модели авторазметки заявок Service Desk в Yandex DataSphere. Результат — время классификации сократилось в 20 раз, точность достигла 96%, расходы на процесс снизились более чем на 50%, ROI проекта — 126%.
Данные двигают продукт вперёд. Когда сбор и поиск настроены, бизнес быстрее получает ответы, а продукт увереннее закрывает пользовательские запросы.
Rush Analytics интегрировала Yandex Search API и ускорила сбор данных в пять раз — до 2 млн ключевых слов в час — с нулём сбоев за полгода и ощутимым экономическим эффектом в несколько миллионов рублей в год.
Smile Tech транскрибировала 44 Тб аудиолекций в текст за три недели с Yandex SpeechKit и затем автоматизировала конспектирование с помощью YandexGPT. Хранилище, базы данных, CDN и вычисления — также в Yandex Cloud.
По данным отчёта Stanford AI Index 2025, внимание рынка смещается от выбора базовой модели к платформам, продуктовой интеграции и надёжности систем на базе агентов.
Прогнозы и тенденции в области AI‑агентов:
Коммодитизация базовых LLM. Стоимость инференса на сопоставимых задачах падает на порядки, а открытые модели сокращают разрыв с закрытыми по ряду бенчмарков. Это переводит конкуренцию с уровня «модель против модели» на уровень платформ и пользовательского опыта.
Рост возможностей к рассуждению при сохраняющемся запросе на надёжность. Новые рассуждающие модели — например YandexGPT 5.1 Pro и DeepSeek‑R1 — показывают прогресс на сложных задачах математики, кода и естественных наук. При этом тема фактологичности и методов её оценки остаётся ключевой.
Многоагентные системы. Команды специализированных агентов становятся рабочим паттерном. Координацию берёт на себя отдельный агент-координатор, или супервайзер: он распределяет задачи, выбирает следующего исполнителя, сводит результаты и останавливает выполнение, когда условия цели выполнены.
Специализация и экспертные агенты. Растёт использование связок из нескольких специалистов (Mixture-of-Agents): это могут быть отдельные агенты, разные модели или один и тот же движок в разных ролях и с разными инструментами. Такой подход в ряде работ даёт прирост качества итоговых ответов и решений по метрикам:
AlpacaEval 2.0 — автооценка моделей на задачах следования инструкциям с LLM-судьёй,
MT-Bench — мультидиалоговый бенчмарк с вопросами из восьми доменов,
FLASK — тонкая оценка по навыкам выравнивания.
Мультимодальность. Агенты работают не только с текстом и голосом, но и с изображениями, видео и аудио в одном потоке.
Влияние AI‑агентов на занятость людей
Из‑за генеративных технологий изменится состав рабочих задач. По оценке McKinsey, уже существующие решения способны автоматизировать 60–70% видов деятельности по времени выполнения, хотя речь идёт о долях задач, а не о полном замещении профессий. Параллельно меняется структура востребованных навыков: на первом плане остаются аналитическое и критическое мышление, креативность, обучаемость, лидерство и умение работать с AI как с инструментом.
На какие навыки растёт спрос
В верхней части списков остаются аналитическое и критическое мышление, креативность, способность учиться, лидерство и социальное влияние. Организации также ждут технологической грамотности и умения работать с AI как с инструментом.
Новая роль — менеджер агентов
Появляется управленческая роль, которая ставит цели, задаёт правила, следит за безопасностью и работает с метриками качества. Такой специалист распределяет задачи между агентами и останавливает выполнение по заданным условиям. В продакшне это помогает соблюдать требуемую скорость реакции системы при нужной наблюдаемости и контроле.
Что это значит для бизнеса:
Базовая модель становится менее критичным выбором, чем архитектура агентной системы, качество данных и управляемость процессов. Это требует внимания к оркестрации, инструментам, RAG‑контурам и мониторингу.
Планирование внедрения лучше строить от задач и метрик: скорости реакции, доли автоматизированных шагов, точности и воспроизводимости. По мере зрелости кейсов полезно переходить к многоагентным схемам и специализированным ролям.
Инвестиции в «человеческие» компетенции не обесцениваются. Критическое мышление, коммуникация, творчество и лидерство усиливаются в связке с AI и дают более устойчивый эффект, чем ставка только на автоматизацию.
Дмитрий Рыбалко
Продуктовый менеджер Yandex AI Studio
AI‑агенты: переход от инструментов к автономным исполнителям в бизнесе