Китайский DeepSeek презентовал нейросеть Janus Pro для генерации картинок
Стартап DeepSeek выпустил нейросеть Janus Pro 7B, которая умеет как анализировать имеющиеся картинки, так и создавать новые согласно заданным описаниям. Новинка способна составить мощную конкуренцию DALL-E от OpenAI.
Первые пользователи Janus Pro 7B уже отметили впечатляющие возможности модели, так как она может обрабатывать как промпты, так и готовые картинки. Нейросеть дает широкие возможности для творчества и креатива и может на равных конкурировать с OpenAI DALL-E 3 в генерации изображений.
Разработчики нейросети отмечают, что Janus Pro — улучшенная версия Janus, который стартап выпустил ранее. В обновлении инженеры оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой модели. Всё это дало возможность выйти на новый уровень в задачах генерации картинок по текстовому описанию и анализу изображений. В бенчмарках GenEval и DPG-Bench нейросеть превосходит открытую Stable Diffusion 3 Medium и коммерческую DALL-E 3 от OpenAI.
Эксперты отмечают, что успех нейросети обусловлен масштабированием модели и оптимизацией вариантов обучения, что означает, что программисты учли предыдущие ошибки и ошибки конкурентов. Китайские разработчики заявляют, что семейство Janus вмещает от 1 до 7 млрд параметров, а их количество влияет на точность распознавания и качество результата. Модели с объёмом более 5 млрд параметров лучше анализируют детали и создают более точные изображения. Авторы уверены, что этот баланс производительности и размера позволит внедрить Janus Pro в проекты, где требуется компактная и быстрая нейронная сеть.
DeepSeek открыла код Janus-Pro-7B на платформе Hugging Face и предоставила доступ к детальной инструкции для локального запуска. Это является важным шагом, учитывая растущий тренд открытых технологий и стремление к сотрудничеству с исследовательским сообществом. Открытость технологий позволяет айтишникам по всему миру участвовать в улучшении модели, а также способствует быстрому темпу её развития.
Эксперты уверены, что разработки, подобные Janus-Pro-7B, будут активно внедряться в различные сферы, включая маркетинг, образование, медиа и развлечения. С учетом растущего интереса к искусственному интеллекту, разработчики будут пытаться интегрировать аналогичные решения в свои продукты.
Фото: Freepik - Rawpixel.com
мероприятий