На календаре — зима. На рынке ИИ — жаришка 🔥. Вот вам еще одна горячая новость с пометкой «срочно в печать» ⚡. В ChatGPT привезли модель o3-mini. Для всех. Это значит — для бесплатных пользователей тоже. Чего не сделаешь, чтобы стереть с новостных порталов прорыв китайцев DeepSeek. Правда, OpenAI 😉?

Семейство новых «рассуждающих» моделей o3 и o3-mini компания анонсировала в рамках рождественского Shipmas в декабре на последнем (двенадцатом) стриме. Все в тот день прильнули к экранам, позабыв про Sora, чтобы узнать — это AGI или пока еще спим спокойно.

Оказалось, что не AGI, но тоже крутая штука. «Мозги» — как у доктора наук по нашим человеческим меркам. Нам тогда показали бенчмарки и все 📊. Отметили, что o2 пропустили не потому, что семимильными шагами развиваются, а чтобы избежать конфликта с британским мобильным оператором O2.

o3-mini — это следующая после o1-mini модель с примерно тем же функционалом, только лучше (умнее, быстрее, мощнее) 🚀. Суть аналогичная: «думает» при решении задач, требующих последовательного логического рассуждения. Сильна в естественных науках, кодировании, математике.

Из недостатков — не работает с визуальными данными (пока) и не такой широкий, как у предшественницы, кругозор. Если o1 — универсал, o3 — специалист технического профиля. Ну и ладно. Зато впервые reasoning-модель стала доступной бесплатным подписчикам 🆓.

Почти во всех бенчмарках (кому интересно и кто еще верит в достоверность внутренних тестов) модель показала результаты, сопоставимые с o1. В математике, науке и кодировании — такая же умная, только более быстрая. Есть возможность не принимать все на веру, а попробовать самому. Просто жмите «Reason» (в русском варианте «Обоснуй») в строке для ввода промпта.

Есть лимиты на количество запросов. С подпиской Plus — 150 сообщений в сутки, бесплатно — примерно 10, как выяснили пользователи (официальной информации нет). У Pro — no limits, потому что $200 в месяц. Помимо интеграции в ChatGPT, модель доступна через API по очень приятным ценам во всех трех режимах — low, medium, high.

Режимы между собой отличаются качеством «думания». Если нужно оперативно и не обязательно выжимать из модели все соки – это low. Medium, соответственно, золотая середина. High — это максимум, при котором модель задействует все ресурсы для анализа и генерации. Кстати, High в тесте по программированию Codeforces показала результат 2073. Для сравнения: у «полной» o1 — 1891, у «компактной» o1-mini — 1650.

Эту же High могут выбрать подписчики Plus в выпадающем меню. В бесплатной версии — только Medium, но и за это спасибо. Ну а мы затаили дыхание и ждем — ну конечно — DeepSeek R3. Китайцы вряд ли сдадутся в этой технологической гонке. Может, прямо сегодня допилят очередную «сенсацию», которая уделает OpenAI. Запасаемся попкорном 🍿.