Google продолжает апгрейдить свою нейросеть. Gemini, тот самый чат-бот, который топит за легализацию кражи картинок со стоков, получил две полезные фичи — Canvas и Audio Overview. Первая — что-то вроде «цифровой песочницы», где можно возиться с текстом и кодом, пока не выйдет что-то толковое. Вторая — превращает документы в подкасты с ИИ-ведущими 🎧. Поговорим, кому, кроме Google, это надо, где лежит и сколько стоит.

Начнем с Canvas — интерактивного пространства для совместной работы с документами и кодом. Да, вы и искусственный интеллект, как партнеры, создаете и редактируете вместе 🤝. Это бесплатно. Просто грузите документ, жмете «Canvas» в строке для ввода промпта, и откроется («дивный новый мир») редактор, где в левой части экрана вы даете команды — например, «Отожми до сути», а справа — ИИ кивает головой (ну почти) и делает 📋. Так же быстро и беспрекословно, как другая модель семейства — генератор Gemini 2.0 Flash — стирает watermark с платных стоковых картинок.

Результат (в правом поле) — не просто кусок кода или текста, а «живой» («…и светится») материал, с которым можно работать в режиме реального времени. Выделяешь кусок и командуешь, что нужно сделать — «Перепиши», «Добавь», «Удали», «Представь в виде графика или таблицы» 🗨️. Управлять результатом (до идеального) можно с помощью обычных текстовых промптов в левой части экрана или кнопками на панели быстрого редактирования в правой нижней части холста, меняя длину, тон и стиль одним кликом мыши 🖱️. Изменения производятся в режиме реального времени тут же, в пространстве Canvas. На ваших глазах команды превращаются в действия, а черновик/прототип — в готовый к экспорту файл.

Canvas — это еще и IDE 💻. Ну почти. Gemini и раньше помогал программистам с кодом, но теперь, с интерактивным пространством Canvas, это стало удобнее. Принцип работы такой же, как при создании текстов. Два поля: слева — «болталка» с чат-ботом 🗨️, справа — процесс создания кода (прототипов веб-сайтов, приложений, игр, симуляторов и т.д.). Как обычно — любые правки Gemini итеративно вносит в код. И тут же, в пространстве холста, можно своими глазами увидеть 👀, как выглядит код «для людей» — визуальную форму и функционал — активируя кнопку «Preview» в правой верхней части холста.

Кодирование с использованием Canvas в Gemini

Audio Overview — менее заковыристая штука, но тоже полезная. Для тех, кто любит подкасты и не выдерживает «много букаф». Если коротко: загружаете документы, а Gemini создает диалог между двумя ИИ-ведущими, которые обсуждают загруженный материал 🎙️. Они: анализируют, дискутируют, разбирают по запчастям сложные моменты, объясняют ключевые идеи и делают выводы. Вы: просто слушаете — в дороге 🎧, во время тренировки, за завтраком. Пока доступно на английском для подписчиков, но скоро языковая панель станет шире 🌍. Хватит ли «широты» у компании Google, чтобы добавить русский, скоро узнаем, а пока переходим на сайт gemini.google.com, тестируем и жалуемся в комментариях, что в РФ не работает 😡.