Китайский технологический гигант Alibaba анонсировал выход Qwen3 — семейства языковых моделей ИИ. Они, по заявлению компании, не уступают топовым решениям от OpenAI и Google, а в некоторых аспектах даже превосходят их. Модели доступны для скачивания на платформах Hugging Face и GitHub, их размер варьируется от 0,6 до 235 миллиардов параметров.

Источник фото: bsmedia.business-standard.com

Открытый исходный код и гибридный подход

Qwen3 использует гибридный режим работы: модели могут либо быстро отвечать на простые запросы, либо «размышлять» над сложными задачами, повышая точность ответов. Некоторые версии также построены на архитектуре «смешанных экспертов» (MoE), что делает их более эффективными в вычислениях.

Модели поддерживают 119 языков и обучены на 36 триллионах токенов данных, включая учебники, вопросы и ответы, фрагменты кода и сгенерированный ИИ-контент. По сравнению с предыдущей версией, Qwen2, новые модели демонстрируют значительный прогресс в точности и функциональности.

Сравнение с конкурентами

Флагманская модель Qwen3-235B-A22B показала результаты, близкие к OpenAI o3-mini и Google Gemini 2.5 Pro, в тестах на программирование и математику. Однако она пока недоступна для широкого использования. Более компактная версия, Qwen3-32B, превосходит OpenAI o1 в некоторых тестах, включая LiveCodeBench.

Рост китайских ИИ-разработок, таких как Qwen3, усиливает конкуренцию с американскими компаниями и провоцирует ужесточение экспортных ограничений на чипы. Тем не менее, открытые модели Alibaba позволяют локальным разработчикам создавать собственные решения без зависимости от зарубежных технологий.

Эксперты отмечают, что Qwen3 подтверждает тренд: открытые модели постепенно догоняют коммерческие аналоги. «Это показывает, что компании могут развивать собственные ИИ-решения, не полагаясь только на закрытые системы», — отметил Тухин Шривастава, CEO Baseten.