Китайский технологический гигант Alibaba анонсировал выход Qwen3 — семейства языковых моделей ИИ. Они, по заявлению компании, не уступают топовым решениям от OpenAI и Google, а в некоторых аспектах даже превосходят их. Модели доступны для скачивания на платформах Hugging Face и GitHub, их размер варьируется от 0,6 до 235 миллиардов параметров.
Источник фото: bsmedia.business-standard.com
Открытый исходный код и гибридный подход
Qwen3 использует гибридный режим работы: модели могут либо быстро отвечать на простые запросы, либо «размышлять» над сложными задачами, повышая точность ответов. Некоторые версии также построены на архитектуре «смешанных экспертов» (MoE), что делает их более эффективными в вычислениях.
Модели поддерживают 119 языков и обучены на 36 триллионах токенов данных, включая учебники, вопросы и ответы, фрагменты кода и сгенерированный ИИ-контент. По сравнению с предыдущей версией, Qwen2, новые модели демонстрируют значительный прогресс в точности и функциональности.
Сравнение с конкурентами
Флагманская модель Qwen3-235B-A22B показала результаты, близкие к OpenAI o3-mini и Google Gemini 2.5 Pro, в тестах на программирование и математику. Однако она пока недоступна для широкого использования. Более компактная версия, Qwen3-32B, превосходит OpenAI o1 в некоторых тестах, включая LiveCodeBench.
Рост китайских ИИ-разработок, таких как Qwen3, усиливает конкуренцию с американскими компаниями и провоцирует ужесточение экспортных ограничений на чипы. Тем не менее, открытые модели Alibaba позволяют локальным разработчикам создавать собственные решения без зависимости от зарубежных технологий.
Эксперты отмечают, что Qwen3 подтверждает тренд: открытые модели постепенно догоняют коммерческие аналоги. «Это показывает, что компании могут развивать собственные ИИ-решения, не полагаясь только на закрытые системы», — отметил Тухин Шривастава, CEO Baseten.