Компания DeepSeek выпустила новую мультимодальную нейросеть Janus-Pro-7B, способную не только распознавать, но и генерировать изображения. Разработчики утверждают, что их модель демонстрирует лучшие результаты в бенчмарках по сравнению с DALL-E 3 от OpenAI и Stable Diffusion.
Что нового в Janus-Pro-7B?
Janus-Pro-7B — это усовершенствованная версия предыдущей модели Janus, которая получила улучшенный процесс обучения, расширенный датасет и масштабированную архитектуру. Это позволило значительно повысить качество работы при создании изображений по текстовому описанию, а также при их анализе.
Основные особенности новой модели:
- Улучшенная генерация изображений на основе текстовых запросов
- Высокая точность распознавания визуальных данных
- Открытый код и лицензия MIT, что делает модель доступной для разработчиков
Несмотря на впечатляющий прогресс, Janus-Pro-7B пока ограничена разрешением 384 × 384 пикселей, что уступает возможностям других современных моделей.
Где доступна модель?
Janus-Pro-7B опубликована на платформе Hugging Face, и команда DeepSeek приглашает разработчиков и исследователей к тестированию и дальнейшему совершенствованию нейросети.
Кроме того, в этом месяце DeepSeek выпустила приложение для iOS и Android с бесплатным чат-ботом, который по функционалу не уступает ChatGPT. Он помогает в обработке запросов, обучении, творческих задачах, планировании и организации процессов.
Развитие мультимодальных ИИ-моделей продолжается, и Janus-Pro-7B — еще один шаг вперед в создании доступных и мощных инструментов искусственного интеллекта.