По традиции подводим итоги. Пока не свои, а OpenAI. Рождественский адвент-календарь, в рамках которого компания 12 рабочих дней анонсировала новые фичи, модели и тарифные планы – done ✔️. С 5 по 20 декабря нам показали столько, что переваривать будем долго. Из главного – дождались Sora, подписку «всего» за 200 долларов и самую умную в мире нейронку o3, которая если еще не AGI, то что-то на это похожее 🧠. В общем, много громких событий, но обо всем по порядку 📅.

День первый: полная версия o1 и подписка Pro

На старте адвента зарелизили full o1 – полную версию той самой «рассуждающей» модели, которую раньше можно было потрогать как o1-mini или o1-preview. Чтобы мало не показалось, в довесок прилетела o1 pro mode 🚀. Модель тренили на каком-то загадочном «ризонинг-пайплайне», и теперь она думает долго, глубоко и (в теории) продуктивно.

В общем, теперь – картинки на вход, +30% к скорости, +100% к стабильности. Цена вопроса – $200 в месяц за Pro подписку. В комплекте безлимитный доступ к voice mode (голосовому режиму), предыдущим моделям и видео-генератору (да, Sora, но об этом позже).

День второй: файнтюнинг моделей o1 и o1-mini

На второй день адвента OpenAI объявила о возможности файнтюнить o1 и ее mini версию. Да, скромнее, чем в первый. Но функционально ⚙️. Благодаря файнтюнингу можно дообучить модель в любой области. Может стать супер экспертом в медицине. Или гуру в маркетинге. Главное – быстро и просто.

В компании утверждают, что данных нужно всего ничего – в разы меньше, чем для стандартного файнтюнинга. На демке показали, как модель учится на 100 сэмплах. А вообще хватит пары десятков примеров. Все это дело доступно на кастомной платформе OpenAI (жать кнопку «reinforcement», грузить датасет и готово). Пока фича для избранных – университетов и крупных компаний. Дешевым этот праздник не будет. Зато какой потенциал.

День третий: Sora и прощание с киноиндустрией

Случилось оно – явление Sora народу 🎬. Официально представили долгожданный генератор видео. Коротко о главном. Ролики до 20 секунд безлимитно, если есть подписка на Pro. Ну или 50 генераций на Plus. Режимы генерации (заявлено): text-to-video, text+image-to-video, text+video-to-video. Говорят, раскатают до целой минуты.

Первые тесты показали, что детализация, моушен и согласованность промптов на уровне. Физика иногда лагает, но для теста идей и экспериментов с видео – самое то. На сайт завезли кастомный редактор. Целая студия на минималках. Редактируй, добавляй, твори. Рендер до 1080p. Пока что.

День четвертый: «холст» вместо «простыней»

Порадовали тех, кто любит порядок и удобство 📂. Canvas (это отдельное окно для работы с кодом и текстами), который был beta, стал доступен всем, включая Free. Canvas умеет больше, чем чат. Например, запоминает больше контекста. Удобен для задач, где нужно много раз исправлять или дорабатывать. Слева – чат («болталка»), справа – «холст» (рабочее пространство). GPT в холсте выделяет и комментирует 💬. Примерно как в Google Docs. И ничего не утонет в «простынях» из текста. И не надо скроллить до головокружения. Все важное перед глазами.

День пятый: «яблочные» интеграции ChatGPT

В этот день компания порадовала преданных поклонников Apple 🍏. Интегрировала ChatGPT в экосистему «Apple Intelligence». Это значит, что, например, Siri, персональный ассистент Apple, может обращаться к чат-боту (в принудительном порядке через «working with chatgpt»). Расширение ChatGPT появится в Visual Intelligence: камера показывает видео, а GPT-4o объясняет. Для Mac аналогичные фишки: ChatGPT доступен для генерации текста как инструмент «Writing tools». Ну и умный анализ документов в Finder.

День шестой: поддержка видео в Advanced Voice

Завезли новые фичи для Advanced Voice Mode («продвинутого голосового режима») 🎙️. Теперь можно не только болтать с моделью, но и показывать ей видео с экрана или в реальном времени через камеру. Для любителей атмосферы добавили голос Санты (нажать на «снежинку») 🎅. Чисто для праздников, конечно. Доступно не всем и не сразу. Пока для Plus, Team и Pro.

День седьмой: главное – порядок в документах

Выкатили то, чего не хватало всем тем, кто ищет «покоя и умиротворения». К ChatGPT прикрутили «Проекты» (Projects) 📚. Можно хранить все чаты и файлы по теме, от текстовых документов до презентаций и кода, в отдельной куче. И это не только, чтобы все в одном месте. «Куча» позволяет ChatGPT анализировать проект в целом и генерировать более точные и контекстуализированные ответы. Пока – конкурентное преимущество платных подписчиков.

День восьмой: апдейтнули поисковик SearchGPT

Анонсировали летом, релизнули осенью, а теперь – рождественский апдейт. Встроенный в ChatGPT поисковик 🔍, с помощью которого чат-бот собирает информацию в интернете, стал быстрее, умнее и доступным в голосовом режиме. То есть теперь запросы можно не только писать, но и проговаривать вслух 📢. Спрашиваете – ChatGPT «серчит» и отвечает тоже голосом. При этом ссылки на источники выкатит в чате. Можно кликнуть и отсмотреть «превью» без помощи браузера. Главное – open для всех.

День девятый: упростили жизнь разработчикам

Говорили на стриме, в основном, про API 🛠️. В частности, представили API для полной версии o1, куда завезли, наконец, работу с картинками. Самой интересной фичей дня стала «reasoning effords» – можно самим контролить процесс, как долго модель должна «думать» ⏳. В общем, «многа букав» об этом на сайте. Кому надо – идем и читаем.

День десятый: интеграция ChatGPT с WhatsApp

В OpenAI решили, что тексты, коды, API и вот это все – слишком скучно для 2024 года. Почему бы не пообщаться с ChatGPT в самом WhatsApp. Или просто по телефону ☎️. Записывайте номер чат-бота: 1-800-ChatGPT (1-800-242-8478). Учетная запись в ChatGPT не нужна. В России, конечно же, недоступно. Точно работает в США и Канаде. Раздали по 15 бесплатных минут (ежемесячно), если звонить по телефону. Звонить можно с любого, хоть кнопочного. На переписку в WhatsApp тоже лимиты.

День одиннадцатый: «пронырливый» ChatGPT

Еще немного полезных мелочей для разработчиков и не только. Сделали возможной интеграцию ChatGPT с десктопными приложениями 🖥️. Просто даешь доступ, и чат-бот идет туда и работает. Например, берет данные из ваших таблиц и закатывает их в эффектные графики 📊. Что-то вроде агентного ИИ 🕵️‍♂️. Все это дело можно активировать без рук, а просто голосом: «иди сюда». Полный контроль остается за вами. Никакой самодеятельности, не волнуйтесь.

День двенадцатый: крышесносная финалочка – o3

Накануне финального стрима поползли слухи о том, что надо пристегнуться. Мол, собираются релизить o3 🚀. Адепты апокалиптических сценариев сразу предположили: прогресс стал таким стремительным, что перескочили через одну модель и едва ли не влетели в AGI 🤯.

20 декабря все точки расставили. Да, o2 пропустили. Но причина другая – в Британии есть «o2». И это мобильный оператор. Модель – самая умная в мире, но пока не AGI. Доступна узкому кругу лиц – тестировщикам. На стриме показали демку и бенчмарки. Выглядит сногсшибательно. По интеллекту – практически человек. Выбивает во всех абсолютно тестах свою предшественницу. Мы посвятили этому релизу статью. Открывать и читать внимательно, чтобы не паниковать.

В комментариях можно пофантазировать, каким будет рождественский адвент в финале 2025-го 🎄. Вариантов, кажется, два – или рванем еще 🚀, или «плато». Ян Лекун сказал, что до AGI как до Луны, так что можно расслабиться. Но это не точно 🙂.