Black Forest Labs, разработчик генератора изображений Grok от xAI, представила свой API

Стартап Black Forest Labs, финансируемый Andreessen Horowitz и разработавший компонент генерации изображений для помощника Grok от xAI, представил бета-версию своего API и новую модель. Данный API предлагает пользователям набор моделей генерации изображений под названием Flux в удобном управляемом пакете. Разработчики могут выбирать, какую модель Flux встроить в свои приложения или сервисы. Также доступны дополнительные функции, такие как модерация контента и ограничения по разрешению изображений.

Black Forest Labs представила свою новую модель для генерации изображений — Flux1.1 Pro. По утверждению компании, она обеспечивает создание изображений в шесть раз быстрее, чем предшествующая версия, Flux1 Pro. Модель поддерживает изображения с разрешением до 2k (2048 × 1080), и эта функция вскоре станет доступна в API. Кроме того, Black Forest Labs отметила улучшение качества изображений, а также точности и разнообразия запросов. Flux1.1 Pro можно использовать не только на самой платформе Black Forest Labs, но и через сотрудничество с партнерами, такими как Together AI, Replicate, Fal.AI и Freepik.

Black Forest Labs, расположенная в Германии и недавно вышедшая из режима секретности с финансированием в размере $31 млн, была основана инженерами, разработавшими технологии для Stability AI, среди которых Андреас Блаттман, Патрик Эссер, Доминик Лоренц и генеральный директор Робин Ромбах.

Стартап оказался в центре споров после соглашения с xAI о внедрении Flux в Grok без дополнительных мер безопасности, что привело к появлению множества шокирующих и неприемлемых изображений. Black Forest Labs не раскрывает, какие данные были использованы для обучения Flux, но изображения, представленные на xAI, предполагают, что в обучающий набор могли попасть защищенные авторским правом материалы, что может стать проблемой в случае, если правообладатели решат подать иск.

Black Forest Labs, среди прочих инвесторов поддерживается генеральным директором Y Combinator Гарри Таном и бывшим главой Oculus Брэндоном Ирибе. Компания разрабатывает модели для генерации видео и, как сообщается, планирует привлечь $100 млн при оценке в $1 млрд, что является значительным увеличением по сравнению с предыдущей оценкой в $150 млн. API играет решающую роль в этом процессе, так как обучение и запуск моделей требует значительных затрат. Инвесторы обычно хотят видеть отдачу своих вложений или, по крайней мере, четкий план для получения положительных результатов.

Тем не менее, Black Forest Labs предстоит столкнуться с серьезными трудностями на пути к лидерству в области медиагенерации, особенно с учетом сильной и растущей конкуренции. На рынке действуют такие компании, как Ideogram, Pika, Luma, Runway, Stability и Midjourney, не говоря уже о крупных игроках, таких как OpenAI и Google.

Ранее сообщалось, что компания Илона Маска Grok представила новую функцию генерации изображений с помощью ИИ, которая, как и сам чат-бот компании, имеет очень мало средств защиты. Это означает, что вы можете генерировать фальшивые изображения Дональда Трампа, курящего марихуану, или загружать их прямо на социальную платформу X. Но за этим инструментом стоит не компания Илона Маска, а новый стартап — Black Forest Labs.