Все компании начинают активно внедрять технологию ИИ-агента: OpenAI, Microsoft, Salesforce. Только вот никто из Кремниевой долины не может четко ответить на вопрос: что такое ИИ-агент?
Кремниевая долина очень оптимистично настроена в отношении новой технологии — ИИ-агента. Генеральный директор OpenAI Сэм Альтман заявил, что агенты «присоединятся к рабочей силе» в этом году. Генеральный директор Microsoft Сатья Наделла считает, что в будущем агенты заменят некоторые интеллектуальные виды деятельности. Генеральный директор Salesforce Марк Бениофф заявил, что их цель — стать «ведущим поставщиком цифровых услуг в мире» с помощью различных «агентских» сервисов компании. Самые крупные игроки стремятся внедрить новинку в свои продукты.
Разговоров вокруг темы полно, но ключевой момент остается неясным. Что же такое ИИ-агент? И на этот вопрос ведущие исследователи не могут дать единодушного ответа.
Все только и говорят о том, что «агенты ИИ» изменят будущее индустрии. Точно так же, как чат-боты ИИ, такие как ChatGPT от OpenAI, показали новый способ поиска информации, агенты коренным образом изменят наш подход к работе. По крайней мере, в этом абсолютно уверены такие руководители, как Альтман и Наделла.
Может быть, все именно так. А может, нет. Все зависит от того, как вы определяете ИИ-агента. Сфера ИИ развивается с колоссальной скоростью, а потому термины не успевают толком закрепиться и значение их остается размытым, что мы видим на примере «мультимодальный», «AGI» и сам «ИИ». Вот то же самое происходит со словами «агент» и «агентный» / «агентский».
Эта неопределенность грозит OpenAI, Microsoft, Salesforce, Amazon, Google и всех прочих грозит определенными проблемами всем этим компаниям, создавая целые линейки продуктов на основе агентов. У всех них «агент» будет чем-то иным: у Amazon свой, у Google свой. А когда пользователь не может быть на 100% уверен, что он покупает, он может быть очень разочарован своей покупкой.
Райан Сальва, старший директор по продуктам в Google и бывший руководитель GitHub Copilot, выразил альтернативное мнение о ситуации и сказал, что стал «ненавидеть» слово «агенты».
Проблема определения понятия появилась не вчера, но сейчас вопрос встал ребром.
На этой неделе OpenAI опубликовал пост в блоге, в котором определил агентов как «автоматизированные системы, способные самостоятельно выполнять задачи от имени пользователей». Но последовательностью они не отличились, потому что на этой же неделе компания выпустила документацию для разработчиков, в которой агенты определяются как «большие языковые модели, оснащенные инструкциями и инструментами». Ай-ай-ай, нужно лучше следить за своими словами. Чтобы запутать всех до конца, Лиер Патак, руководитель отдела маркетинга API-продуктов OpenAI, позже заявила в посте на X, что «агент» и «помощник» — это, вообще-то, одно и то же.
Сейчас блоги Microsoft пытаются найти различие между агентами и помощниками с искусственным интеллектом. Первых они назвали «новыми приложениями» для «мира, управляемого искусственным интеллектом». Они легко адаптируются под выполнение разных задач. Вторые, в то же время, подходят для общих задач, как написание письма. Таково мнение Microsoft по вопросу понятий.
Лаборатория ИИ Anthropic в терминологическом лабиринте оказалась более прямолинейна в своих выводах. Они просто сказали в сообщении в блоге, что ИИ-агент — это и «полностью автономные системы, которые работают независимо в течение длительного времени», и «предписывающие реализации, которые следуют заранее заданным рабочим процессам».
Среди других у Salesforce смотрит шире всех на определение ИИ-агента. Компания считает, что агенты — это «тип […] системы, которая может понимать запросы клиентов и отвечать на них без участия человека». Они еще и классифицировали агентов на шесть различных категорий, от «простых рефлекторных агентов» до «агентов на основе полезности».
Сложно, сложно, непонятно. А все потому, что абстрактная технология агента еще и постоянно видоизменяется. Гиганты индустрии только-только начали выпускать своих первых агентов — Operator от OpenAI, Project Mariner от Google и торгового агента от Perplexity. При этом они еще и все жутко различаются по своим возможностям. Ладно, не только в этом дело. По словам Эндрю Нга, основателя платформы для обучения ИИ DeepLearning.ai, в этом также в значительной степени виноват маркетинг.
Джим Роуэн, руководитель отдела искусственного интеллекта в Deloitte, называет сложившуюся ситуацию и возможностью, и вызовом. На одной чаше весов у нас неопределенность, обеспечивающая гибкость. Гибкость, в свою очередь, позволяет компаниям адаптировать агентов под любую задачу. На второй чаше весов — «несовпадение ожиданий» и трудности в оценке инвестиций в агентские проекты.
К сожалению, раз мы до сих пор — а сколько лет уже прошло? — так и не пришли к единому мнению по поводу того, что такое «искусственный интеллект», то ждать какого-то единогласия в вопросе определения «агента» в ближайшее время не стоит.