Китайская ИИ-модель Qwen3-Coder бросает вызов GPT-4 и Claude
Qwen, входящая в состав корпорации Alibaba, представила новую разработку — Qwen3-Coder, интеллектуального помощника для программистов с открытым исходным кодом. Эта модель продемонстрировала выдающиеся результаты в ходе тестирования: по ряду параметров она превосходит другие open-source-решения и вплотную приближается к показателям коммерческой модели Claude Sonnet 4 и обошла даже GPT-4.1.
Одним из ключевых достоинств Qwen3-Coder стало ее умение выполнять задачи агентного программирования.
Qwen3-Coder-480B-A35B-Instruct – флагманская версия модели, ее основой стала архитектура Mixture-of-Experts. В данной конфигурации задействуются 35 миллиардов из общего числа в 480 миллиардов параметров. Модель способна воспринимать входные данные длиной до 256 тысяч токенов, а при необходимости может расширять этот лимит до одного миллиона токенов. Это открывает широкие возможности для анализа больших объёмов кода, включая целые репозитории и комплексные программные решения.
В процессе обучения Qwen3-Coder активно применялись методы обучения с подкреплением. Специалисты компании создали систему генерации тестов для широкого спектра задач и построили инфраструктуру, позволяющую запускать одновременно до 20 тысяч изолированных тренировочных сред, что обеспечивало масштабную и разнообразную тренировку модели.
Общий объем обучающего корпуса составил 7,5 триллиона токенов, причем около 70% этой информации составляли фрагменты программного кода. Дополнительно использовались синтетические данные, которые были предварительно переработаны и очищены с использованием предыдущей версии модели.
Дополнительно представлена Qwen Code — инструмент для командной строки, который обеспечивает удобный и легкий доступ к возможностям модели. Этот интерфейс предназначен для автоматизации задач программирования и был разработан на базе Gemini Code. Он может быть интегрирован с популярными средами разработки.
Источник: Reuters

