Компания Google представила обновлённую версию своей языковой модели Gemma 3, которая стала легче и быстрее благодаря специальной технологии сжатия — квантованию.

Источник фото: digitaltrends.com

Quantization-Aware Training (QAT) позволила уменьшить требования к оперативной памяти и сделать модель доступной для более широкого спектра устройств, утверждают в Google.​

Теперь расширенная версия Gemma 3 способна запускаться даже на обычной игровой видеокарте типа RTX 3090. При этом потеря точности оказалась минимальной: новый способ квантования позволил сохранить почти половину изначального уровня качества модели.

Эти усовершенствования Gemma 3 оценят разработчики, которые хотят внедрять современные ИИ-технологии, не вкладываясь в дорогое оборудование.