К нам приехала новая фича от OpenAI. Имя ей – Operator. Умный ассистент, который сделает все за нас 🤖. Ну почти. Используя собственный браузер, Operator заходит на веб-страницы и контактирует с ними – смотрит, выбирает, вводит и набирает. Может закинуть в корзину самый рейтинговый тур, заказать продукты, завести аккаунт. Вы даете задание, а он выполняет. Кофе не приготовит ☕, но в интернете чувствует себя как кот в коробке – уютно, уверенно, с чувством собственного превосходства.

Operator работает на базе Computer-Using Agent (CUA) – модели, которая понимает, как взаимодействовать с визуальными интерфейсами. Ничего принципиально нового в этой модели нет. Просто специально обученный и расширенный GPT-4o, который хорошо разбирается (как человек) в кнопках, меню и текстовых полях. Не просто «смотрит» и «видит», а понимает логику: «здесь жмем, тут вводим, а там ждем ответ» 🧠.

Мозгов у него хватает быть критичным к себе. Когда ошибается, занимается самокоррекцией. Если застрял и нуждается в помощи, сливает управление вам. Мол, «сам разбирайся, я не справляюсь». Работу агента можно настраивать, добавляя инструкции: эти авиалинии – да, те – категорически нет. Кстати, агент – мультизадачник. Может одновременно заказывать еду, бронировать отель и писать электронные письма.

А ведь нас предупреждали, что веб-агенты станут частью реальности в 2025 году. Мы не верили, но прогнозы – штука серьезная, как оказалось. В свете чего стоит прислушаться и к другим «предсказаниям». В их числе – потеря контроля над искусственным интеллектом (что-то вроде «восстания машин») ⚠️. Тоже, на минуточку, в этом году.

Защита – на максималках. Operator обучен быть проактивным при заполнении платежных и паспортных данных, вводе пароля и логина и в других ситуациях, связанных с рисками. Проактивным – значит вызывать в таких ситуациях вас. Сам не сольет ваши деньги на шопинг и не возьмет в банке кредит. Безопасности разработчики уделили много внимания. Обошли все острые углы, чтобы ни у кого не осталось вопросов.

Если вы отключаете функцию «Улучшить модель для всех» в настройках ChatGPT, данные, которые обрабатывает Operator, не будут использованы для обучения. Если хочется большей приватности – тоже пожалуйста. В разделе «Конфиденциальность» можно удалить информацию о просмотрах и работе агента одним щелчком.

Чтобы никакой вредоносный ресурс не мог перехитрить Operator через скрытые команды и коды, ввели дополнительные меры. Во-первых, система сама выявляет такие «инъекции» и игнорирует их. Во-вторых, специальная «monitor model» следит за всем, включая действия ИИ-агента, и может приостанавливать процесс выполнения задачи.

Звучит надежно, но насколько бесперебойно это работает, говорить еще рано. ИИ-агент пока в режиме «исследовательского предпросмотра» 🔍. Доступен в США и только для Pro. Остальные, увы, пока все делают сами. Запустили, чтобы посмотреть, как это работает, и понять, где надо докрутить. Пообещали, что скоро раскатают для всех и добавят API, чтобы любой разработчик мог прикрутить ассистента в свое приложение.