Антон Курилов 15 586 317

В «Яндекс Браузере» появился ИИ-агент. Как он работает?

И что это вообще такое — ИИ-агент?

Чат-ботами вроде ChatGPT или «Алисы» давно никого не удивишь. Сочинение стихов и исправление ошибок в текстах — это, конечно, хорошо и полезно. Но следующий шаг развития искусственного интеллекта — агенты, то есть системы, способные на автономные действия.

В России первым на рынок ИИ-агентов вышел «Яндекс»: в «Яндекс Браузере» запустилось альфа-тестирование «Алисы» в режиме ИИ-агента. Мы успели протестировать технологию — рассказываем, какие повседневные задачи можно переложить на плечи алгоритма.

Чат-бот ограничен перепиской — он лишь может объяснить, как что-то сделать. Зато ИИ-агент способен сам выполнить нужные действия. Например, заполнить форму на сайте или собрать корзину в интернет-магазине.

Боты, которые выполняют задачи по заранее написанному алгоритму, существуют давно. Агент же адаптируется к окружающей ситуации: ищет нужные кнопки, в случае ошибки делает шаг назад, запрашивает данные у пользователя, если необходимо. Проще говоря, идёт к заданной цели, самостоятельно планируя шаги.

Есть множество специализированных ИИ-агентов, которые обучены на больших массивах данных в конкретной узкой области и благодаря этому отлично справляются с отдельными задачами — порой лучше живых экспертов. Или по крайней мере сильно дешевле, ведь драгоценное время человека можно перенаправить на более важные или сложные дела.

Из агентов общего характера стоит выделить ChatGPT Agent, представленный в июле этого года. Помощник способен запустить внутри себя браузер и выполнить задачу, делегированную пользователем: записаться на стрижку, обновить электронную таблицу свежими данными или суммаризировать содержимое входящих писем за прошедшую ночь.

Ещё есть браузерные агенты: например, Dia от The Browser Company и Comet от Perplexity. Оба продукта не обладают той же степенью свободы, что и ChatGPT Agent, но зато способны собирать и анализировать информацию с текущей страницы.

Что-то похожее появилось в «Яндекс Браузере» ещё в мае. А новый агент по способностям напоминает ChatGPT Agent. Хотя он живёт в браузере, инструмент может оперировать не только уже открытыми вкладками, но и самостоятельно открывать сайты или поиск. Важное преимущество агентной «Алисы» перед зарубежными конкурентами — она работает в России без ограничений и отлично понимает русский язык.

По сути, агентная «Алиса» — это интерфейс для интерфейса. Вместо того, чтобы тратить когнитивный и временной ресурс на то, чтобы найти интересующий сайт, разобраться, где у него искомая кнопка или пункт меню, параллельно прочитав массу ненужного текста и пару раз столкнувшись с баннерами на половину экрана, достаточно описать агенту задачу в свободной форме — и идти отдыхать.

Чтобы протестировать «Алису» в роли агента, необходимо подать заявку на сайте. В рамках альфа-режима доступно до 10 поручений ежедневно.

После того, как вы попадёте в пул тестирования, рядом с адресной строкой «Яндекс Браузера» появится иконка ИИ-агента — красная стрелочка. По клику открывается интерфейс чата: достаточно описать поручение и нажать на кнопку «Отправить».

Агент может спросить у вас что-то по ходу выполнения задачи: например, если у него нет ваших данных для регистрации на сайте. Но проще сразу описать задачу как можно подробнее. Допустим, если вы собираетесь поручить «Алисе» запись к барберу, укажите, какой конкретно салон вас интересует и в каком городе, перечислите желаемые услуги и имя мастера.

После запуска поручения «Яндекс Браузер» открывает отдельное окно, где можно наблюдать за процессом исполнения: «Алиса» «размышляет» над текущим этапом, бегает курсором по странице и нажимает нужные кнопки в реальном времени. Агент имеет доступ к вашим сессиям, то есть входить в интернет-магазин для заказа еды заново не придётся.

И да: учитывайте, что агентная «Алиса» пока на стадии альфа-тестирования. Перепроверяйте результаты её работы.

Проверим агента внутри «Яндекс Браузера» на четырёх типовых задачах, которые отнимают много времени, но при этом вполне по силам «Алисе».

Заполнение формы. Начнём с самого простого и проверим — удастся ли алгоритму заполнить форму на случайном сайте? В качестве эксперимента попробуем зарегистрироваться на забег.

Агент просканировал указанную страницу и запросил в чате необходимые данные, указав, в каком формате они требуются. Если проигнорировать одно из требований, «Алиса» вернётся и укажет на проблему.

Перед отправкой формы ассистент запросил подтверждение: можно сразу оценить, не закралась ли где ошибка.

Запись в ближайший сервис-центр. Промпт такой: «Найди автосервис недалеко от Предмостной площади в Красноярске с записью как можно раньше и забронируй визит». Посмотрим, справится ли «Алиса» с поиском СТО в конкретной локации, найти форму онлайн-записи и запросить данные для заполнения.

Агент успешно нашёл подходящий автосервис — правда, не стал заморачиваться перебором вариантов, чтобы найти окошко как можно раньше. В нужный момент алгоритм запросил данные для заполнения заявки и отдельно — разрешение на её отправку. Заявка ушла, «Алиса» даже собрала сводку с точным адресом и номером телефона для связи.

Интересно, что в процессе заполнения формы «Алиса» периодически упоминала название другого СТО — оно фигурировало в результатах поиска на предыдущем этапе. Впрочем, на результат это не повлияло.

Составление маршрута. Задачу составить план путешествия не очень хочется поручать агентам и ассистентам: откуда алгоритм знает, что какие места я хочу увидеть? Но если уже определились с маршрутом, финальную частью подготовки — перенос точек в навигатор — вполне можно поручить агентной «Алисе».

Промпт: «Возьми точки маршрута с этой страницы [ссылка на путеводитель] и расставь их на Яндекс Картах». «Алиса» открыла нужную ссылку, в соседней вкладке запустила «Карты» и постоянно сверялась с источником.

В процессе ассистент указал верное название одной из точек, но «Карты» этот объект не нашли. В ответ агент попытался ввести координаты, но не стёр название — поэтому сервис выдал ошибку. Вместо того, чтобы отреагировать и исправить текст, «Алиса» просто пошла дальше. Но эту оплошность легко устранить вручную. В остальном поручение выполнено успешно.

Сбор корзины в интернет-магазине. Вместо того, чтобы вводить кучу запросов в поиске любимого онлайн-супермаркета, можно просто скопировать «Алисе» список покупок. Останется только выбрать период доставки и оплатить.

При поиске молока сайт «Пятёрочки» поставил на первую строчку вариант на два литра — но «Алиса» не поддалась и выбрала бутылку нужного объёма. А когда в магазине не нашлось нужного мне чая, агент переспросил в чате, какую альтернативу я готов взять. Но и без ошибок не обошлось: вместо нарезки в корзине оказался обычный сыр.

На эту задачу «Алисе» потребовалось больше всего времени. Видимо, агент боролся с сайтом «Пятёрочки», который не отличается отзывчивостью.

Пока преждевременно ожидать, что ИИ-агенты способны выполнить за вас всю работу. Скорее стоит воспринимать инструмент как помощника-стажёра: он сделает то, что для вас слишком скучно.

Как и любой стажёр (и как любой ИИ-агент), «Алиса» потратит на исполнение поручения заметно больше времени, чем вы. Зато освободившиеся силы вы сможете посвятить более интересным или важным задачам. Или просто отдохнуть.

Несмотря на статус альфа-тестирования, агентная «Алиса» способна приносить пользу уже сейчас. Да и выглядит процесс захватывающе: алгоритм сам разбирается в сути задачи, планирует её выполнение и… действительно выполняет! Кто-то скажет — чудо, а мы ответим — искусственный интеллект. А ведь это пока начальный этап развития ИИ-агентов. Что будет дальше?

В «Яндекс Браузере» появился ИИ-агент. Как он работает?

Что такое ИИ-агент

Как устроен агент в «Яндекс Браузере»

Тестируем агента

Впечатления и выводы