Хотя конкретные подробности об обучающих данных не разглашаются, Pixtral 12B предназначен для того, чтобы пользователи могли загружать изображения и запрашивать подробности об их содержании с помощью текстовых запросов.
София Янг, руководитель отдела по работе с разработчиками Mistral, отметила отличительную особенность модели: ее способность обрабатывать произвольное количество изображений любого размера. Первые тестеры сообщили, что Pixtral 12B может похвастаться сложной архитектурой. Зрительный компонент включает специальный софт, поддерживающий разрешение изображения 1024×1024, и 24 скрытых слоя для расширенной обработки изображений.
Вскоре Pixtral 12B станет доступен через API.