OpenAI начали год с фокуса на «агентах» 🤖. Недавно релизнули Operator, вслед за ним представили Deep Research. Еще один «умный помощник», который умеет все сам. Поговорим, чем новый «агент» отличается от предыдущего, кому это надо и, главное, зачем 🤔.
Deep Research — агентный ИИ, который проводит многоэтапные исследования в интернете для решения сложных задач. Примерно за полчаса делает то, на что мы, когда беремся, тратим несколько суток ⏳. Работает самостоятельно без резиновой палки. Даешь задание, а ChatGPT выполняет — ищет, находит, изучает и обобщает сотни источников, чтобы выкатить по итогу отчет 📑.
Не «вот тебе 10 ссылок, дальше сам», а документ, сопоставимый по качеству с работой профессионального аналитика. Да, может копаться 30 минут, прежде чем разразиться отчетом, зато реально агрегирует и анализирует большие объемы, а потом собирает всю суть в структурированное исследование с фактами и аргументами.
«Мозги» у помощника — на базе o3 🧠. Напомним, o3 — генеративная модель (GPT), разработанная OpenAI как преемница o1. Относится к категории «думающих». Разрабатывалась для задач, требующих пошагового логического рассуждения.
Потрогать o3 в урезанной mini-версии могут все. Бесплатные пользователи — включительно 🆓. Говорят, что мощная в математике, кодировании, естественных науках. Кнопка «Reason» («Обоснуй») в строке для ввода промпта в ChatGPT позволяет попробовать и сделать выводы на основе личного опыта, а не стороннего мнения.
Deep Research пока еще платный. Доступен для Pro. Скоро выкатят для Plus и Team. Штука серьезная, поэтому не для всех. Тем, кто ищет «что посмотреть» или «как провести выходные», Deep Research, наверное, ни к чему. Другое дело, если запрос про финансы, науку, политику и жизненно важно получить очень точный, детальный отчет 💡.
В быту тоже можно, конечно. Например, если нужно выбрать квартиру или машину не на эмоциях. Даешь агенту задание и не роешься сам на форумах и в обзорах. Deep Research залезет туда, куда сам никогда не дойдешь. «Поиск неочевидных данных» (на 158 странице поисковика и между строк) — его талант.
Предыдущий агент Operator в этом смысле намного проще. Максимум — секретарь. Под капотом — ChatGPT-4o. Тоже ходит в интернет, но по другому поводу — смотрит, выбирает, бронирует и т.д. Может кинуть продукты в корзину, подобрать подходящий тур, напомнить. Его компетенции — это рутина.
Deep Research — аналитик. Работает просто. В ChatGPT выбираешь режим «Deep Research» и вводишь запрос («Лучший городской велосипед под мои параметры»). Можно кинуть файлы для контекста 📂. Запускаешь, и система начинает копаться. Пока она копается (5-30 минут), сам спокойно занимаешься своими делами. По факту придет сообщение о готовности документа со всеми ссылками, пояснениями и логикой 📧. В ближайшее время OpenAI добавит в отчеты графики, таблицы и визуал.
Кстати, в Humanity’s Last Exam агент показал рекордный для нейронок результат — 26,6% точности. Это масштабное тестирование ИИ на 3000+ вопросах. Не просто «что такое квантовая механика», а действительно сложные задачи по 100+ предметам, от лингвистики до ракетостроения, от философии до экологии. На минуточку, GPT-4o набрал в этом тесте 3,3%, а Claude 3.5 Sonnet — 4,3% 🤔.
Если вспомнить, что OpenAI движется в сторону «сверхразума», то верным путем идут товарищи. Еще один шаг в сторону автономного ИИ — done ✅. А вообще, все по плану. Эксперты предрекали, что 2025-й будет годом ИИ-агентов, так пока и идет. Куда по итогу приедем, покажет время.