По традиции подводим итоги. Пока не свои, а OpenAI. Рождественский адвент-календарь, в рамках которого компания 12 рабочих дней анонсировала новые фичи, модели и тарифные планы – done ✔️. С 5 по 20 декабря нам показали столько, что переваривать будем долго. Из главного – дождались Sora, подписку «всего» за 200 долларов и самую умную в мире нейронку o3, которая если еще не AGI, то что-то на это похожее 🧠. В общем, много громких событий, но обо всем по порядку 📅.
Содержание
- — День первый: полная версия o1 и подписка Pro
- — День второй: файнтюнинг моделей o1 и o1-mini
- — День четвертый: «холст» вместо «простыней»
- — День пятый: «яблочные» интеграции ChatGPT
- — День шестой: поддержка видео в Advanced Voice
- — День седьмой: главное – порядок в документах
- — День восьмой: апдейтнули поисковик SearchGPT
- — День девятый: упростили жизнь разработчикам
- — День десятый: интеграция ChatGPT с WhatsApp
- — День одиннадцатый: «пронырливый» ChatGPT
- — День двенадцатый: крышесносная финалочка – o3
День первый: полная версия o1 и подписка Pro
На старте адвента зарелизили full o1 – полную версию той самой «рассуждающей» модели, которую раньше можно было потрогать как o1-mini или o1-preview. Чтобы мало не показалось, в довесок прилетела o1 pro mode 🚀. Модель тренили на каком-то загадочном «ризонинг-пайплайне», и теперь она думает долго, глубоко и (в теории) продуктивно.
В общем, теперь – картинки на вход, +30% к скорости, +100% к стабильности. Цена вопроса – $200 в месяц за Pro подписку. В комплекте безлимитный доступ к voice mode (голосовому режиму), предыдущим моделям и видео-генератору (да, Sora, но об этом позже).
День второй: файнтюнинг моделей o1 и o1-mini
На второй день адвента OpenAI объявила о возможности файнтюнить o1 и ее mini версию. Да, скромнее, чем в первый. Но функционально ⚙️. Благодаря файнтюнингу можно дообучить модель в любой области. Может стать супер экспертом в медицине. Или гуру в маркетинге. Главное – быстро и просто.
В компании утверждают, что данных нужно всего ничего – в разы меньше, чем для стандартного файнтюнинга. На демке показали, как модель учится на 100 сэмплах. А вообще хватит пары десятков примеров. Все это дело доступно на кастомной платформе OpenAI (жать кнопку «reinforcement», грузить датасет и готово). Пока фича для избранных – университетов и крупных компаний. Дешевым этот праздник не будет. Зато какой потенциал.
День третий: Sora и прощание с киноиндустрией
Случилось оно – явление Sora народу 🎬. Официально представили долгожданный генератор видео. Коротко о главном. Ролики до 20 секунд безлимитно, если есть подписка на Pro. Ну или 50 генераций на Plus. Режимы генерации (заявлено): text-to-video, text+image-to-video, text+video-to-video. Говорят, раскатают до целой минуты.
Первые тесты показали, что детализация, моушен и согласованность промптов на уровне. Физика иногда лагает, но для теста идей и экспериментов с видео – самое то. На сайт завезли кастомный редактор. Целая студия на минималках. Редактируй, добавляй, твори. Рендер до 1080p. Пока что.
День четвертый: «холст» вместо «простыней»
Порадовали тех, кто любит порядок и удобство 📂. Canvas (это отдельное окно для работы с кодом и текстами), который был beta, стал доступен всем, включая Free. Canvas умеет больше, чем чат. Например, запоминает больше контекста. Удобен для задач, где нужно много раз исправлять или дорабатывать. Слева – чат («болталка»), справа – «холст» (рабочее пространство). GPT в холсте выделяет и комментирует 💬. Примерно как в Google Docs. И ничего не утонет в «простынях» из текста. И не надо скроллить до головокружения. Все важное перед глазами.
День пятый: «яблочные» интеграции ChatGPT
В этот день компания порадовала преданных поклонников Apple 🍏. Интегрировала ChatGPT в экосистему «Apple Intelligence». Это значит, что, например, Siri, персональный ассистент Apple, может обращаться к чат-боту (в принудительном порядке через «working with chatgpt»). Расширение ChatGPT появится в Visual Intelligence: камера показывает видео, а GPT-4o объясняет. Для Mac аналогичные фишки: ChatGPT доступен для генерации текста как инструмент «Writing tools». Ну и умный анализ документов в Finder.
День шестой: поддержка видео в Advanced Voice
Завезли новые фичи для Advanced Voice Mode («продвинутого голосового режима») 🎙️. Теперь можно не только болтать с моделью, но и показывать ей видео с экрана или в реальном времени через камеру. Для любителей атмосферы добавили голос Санты (нажать на «снежинку») 🎅. Чисто для праздников, конечно. Доступно не всем и не сразу. Пока для Plus, Team и Pro.
День седьмой: главное – порядок в документах
Выкатили то, чего не хватало всем тем, кто ищет «покоя и умиротворения». К ChatGPT прикрутили «Проекты» (Projects) 📚. Можно хранить все чаты и файлы по теме, от текстовых документов до презентаций и кода, в отдельной куче. И это не только, чтобы все в одном месте. «Куча» позволяет ChatGPT анализировать проект в целом и генерировать более точные и контекстуализированные ответы. Пока – конкурентное преимущество платных подписчиков.
День восьмой: апдейтнули поисковик SearchGPT
Анонсировали летом, релизнули осенью, а теперь – рождественский апдейт. Встроенный в ChatGPT поисковик 🔍, с помощью которого чат-бот собирает информацию в интернете, стал быстрее, умнее и доступным в голосовом режиме. То есть теперь запросы можно не только писать, но и проговаривать вслух 📢. Спрашиваете – ChatGPT «серчит» и отвечает тоже голосом. При этом ссылки на источники выкатит в чате. Можно кликнуть и отсмотреть «превью» без помощи браузера. Главное – open для всех.
День девятый: упростили жизнь разработчикам
Говорили на стриме, в основном, про API 🛠️. В частности, представили API для полной версии o1, куда завезли, наконец, работу с картинками. Самой интересной фичей дня стала «reasoning effords» – можно самим контролить процесс, как долго модель должна «думать» ⏳. В общем, «многа букав» об этом на сайте. Кому надо – идем и читаем.
День десятый: интеграция ChatGPT с WhatsApp
В OpenAI решили, что тексты, коды, API и вот это все – слишком скучно для 2024 года. Почему бы не пообщаться с ChatGPT в самом WhatsApp. Или просто по телефону ☎️. Записывайте номер чат-бота: 1-800-ChatGPT (1-800-242-8478). Учетная запись в ChatGPT не нужна. В России, конечно же, недоступно. Точно работает в США и Канаде. Раздали по 15 бесплатных минут (ежемесячно), если звонить по телефону. Звонить можно с любого, хоть кнопочного. На переписку в WhatsApp тоже лимиты.
День одиннадцатый: «пронырливый» ChatGPT
Еще немного полезных мелочей для разработчиков и не только. Сделали возможной интеграцию ChatGPT с десктопными приложениями 🖥️. Просто даешь доступ, и чат-бот идет туда и работает. Например, берет данные из ваших таблиц и закатывает их в эффектные графики 📊. Что-то вроде агентного ИИ 🕵️♂️. Все это дело можно активировать без рук, а просто голосом: «иди сюда». Полный контроль остается за вами. Никакой самодеятельности, не волнуйтесь.
День двенадцатый: крышесносная финалочка – o3
Накануне финального стрима поползли слухи о том, что надо пристегнуться. Мол, собираются релизить o3 🚀. Адепты апокалиптических сценариев сразу предположили: прогресс стал таким стремительным, что перескочили через одну модель и едва ли не влетели в AGI 🤯.
20 декабря все точки расставили. Да, o2 пропустили. Но причина другая – в Британии есть «o2». И это мобильный оператор. Модель – самая умная в мире, но пока не AGI. Доступна узкому кругу лиц – тестировщикам. На стриме показали демку и бенчмарки. Выглядит сногсшибательно. По интеллекту – практически человек. Выбивает во всех абсолютно тестах свою предшественницу. Мы посвятили этому релизу статью. Открывать и читать внимательно, чтобы не паниковать.
В комментариях можно пофантазировать, каким будет рождественский адвент в финале 2025-го 🎄. Вариантов, кажется, два – или рванем еще 🚀, или «плато». Ян Лекун сказал, что до AGI как до Луны, так что можно расслабиться. Но это не точно 🙂.