Alibaba выпустила обновленную версию Qwen, которая превосходит модели OpenAI и DeepSeek

Китайский интернет-гигант Alibaba Group Holding разработал новую версию собственной ИИ-модели Qwen, которая, по его мнению, превосходит конкурентов, в том числе модель DeepSeek.

Гонка ИИ продолжается. И снова вперед вырывается Китай. Alibaba выпустила восемь вариантов Qwen3: 2 модели «смеси экспертов» и 6 классических моделей разных размеров — от 600 миллионов до 32 миллиардов параметров. Это позволяет использовать их на устройствах с различной вычислительной мощностью — от домашних ноутбуков до крупных серверов.

Нейросети обучены на большом объёме данных, который вырос в два раза по сравнению с предыдущим поколением Qwen2.5. Для обучения китайские разработчики использовали около 36 триллионов токенов текста, в том числе интернет-страницы, документы PDF и синтетические данные, созданные предыдущими версиями моделей. После основного обучения модели прошли дополнительные этапы настройки, что дало возможность улучшить качество ответов.

Qwen3 будет полезен для бизнес-аналитики, автоматизации клиентской поддержки, генерации рекламных и новостных текстов. Также он способен сделать мгновенный перевод и локализацию контента.

Представители Alibaba Group Holding заявляют, что Qwen3 по качеству работы опережает модели OpenAI и DeepSeek и приближается к лучшим закрытым разработкам от Google. Также чат-бот выгодно отличается сниженной стоимостью развертывания. При этом Qwen3 поддерживает 119 языков и работает по гибридному принципу: от детальной аналитики до молниеносных ответов на простые вопросы.

Одним из ключевых преимуществ Qwen3 остаётся полная открытость кода и лицензии на небольшие модели. Это дает возможность интегрировать ИИ в коммерческие решения без ограничений. Модели предыдущего поколения Qwen2.5 уже лежат в основе ИИ-решений ряда крупных российских компаний. Теперь же можно ожидать появления «российских ChatGPT-конкурентов» на базе Qwen3.

Отечественные соцсети также стараются быть в тренде. Так, в середине марта Сбер представил GigaChat 2.0 – сильнейшую нейросетевую модель на русском языке. Чат-бот способен распознавать голосовые аудиофайлы, обрабатывать больший объем текста и распознавать изображения. Модель внедрена в умные колонки Sber, что позволяет им поддерживать продолжительные и содержательные беседы.

GigaChat 2.0 улучшил знания в различных дисциплинах и навыки программирования, а также научился работать с запросами до двухсот страниц А4. Новые модели в два раза точнее следуют инструкциям пользователя и на 25% лучше отвечают на вопросы: соблюдают заданные форматы и условия, формируют ответы в определённом стиле, что помогает эффективнее решать рабочие задачи: готовить сопроводительную правовую документацию, анализировать обращения клиентов и так далее.

В свою очередь в приложении «Яндекс Маркета» появился чат с ассистентом на основе искусственного интеллекта. Он поможет пользователям решать задачи, связанные с выбором товаров, без необходимости искать информацию в других источниках. ИИ-ассистент помогает подбирать продукцию по запросам, предоставлять информацию о преимуществах и сравнивать несколько позиций. Ассистент функционирует в бета-режиме на базе нейросети YandexGPT 5 Pro, дообученной с использованием данных о товарах маркетплейса, включая отзывы пользователей. ИИ-помощник научился разбираться в характеристиках продукции, предлагать альтернативы и объяснять различия между товарами. При этом он персонализирует рекомендации, учитывая предпочтения покупателя.

Фото: Kandinsky

#искусственный интеллект

Telegram Стратегии

07.05.2025

анонсы
мероприятий

инновации