Как пользоваться нейросетью Nano Banana — «убийцей фотошопа» от Google
Что за Nano Banana
Вообще, это Gemini 2.5 Flash Image — модель для генерации изображений от Google. Название Nano Banana к ней прочно прилипло, когда в начале августа, за пару недель до официального анонса, в таблице лидеров на LMArena появилась загадочная модель nano-banana, которая вышла на первое место в категории нейронок для обработки изображений. Если пропустили: LMArena — это платформа, позволяющая генерировать текст и изображения рандомными нейронными сетями и сравнивать результат вслепую. Так пользователи получают и результат генерации, и рейтинг лучших нейронок в разных категориях, созданный непредвзятым голосованием.
Связь nano-banana с Google установили довольно быстро, но официальный анонс случился только 26 августа. Причём название Nano Banana в итоговом варианте нигде не указывается: официально это просто Gemini 2.5 Flash Image. Но интернет предпочитает это игнорировать, и «банановая» кличка прилипла к нейронке намертво.
Преимущество новой модели заключается в том, что она очень хорошо сохраняет портретное сходство. А потому подходит для редактирования существующих изображений: по возможности она не трогает ничего, кроме того, что её попросили исправить. С нуля, впрочем, тоже генерирует. Ещё один плюс: Nano Banana работает бесплатно и без лимитов (по крайней мере, на момент написания этой статьи).
Как получить доступ к Nano Banana
Модель Gemini 2.5 Flash Image добавили во множество сервисов вроде Krea и Higgsfield, но там они доступны только по подписке. Официальный чат-бот Google Gemini и проще в использовании, и даёт, похоже, неограниченное количество попыток бесплатно. По крайней мере, при тестировании мы так и не смогли упереться в потолок, хотя сгенерировали и отредактировали десятки изображений. Но есть нюанс: список регионов, где Gemini доступен, пока сильно ограничен — и с российским IP он не работает.
Если вы можете получить доступ, то пользоваться Gemini очень легко: интерфейс идентичен обычным чат-ботам, а для авторизации достаточно войти в Google-аккаунт. Главное — убедитесь, что в верхнем левом углу выбрана модель 2.5 Flash. На момент публикации это вариант по умолчанию, но в мире нейронок всё меняется очень быстро.
Для чего можно использовать Nano Banana
Рассмотрим несколько популярных и не очень сценариев — с промптами и примерами результатов.
Замена лица и деталей
Мы уже отмечали фишку, которая выделяет Nano Banana среди других моделей: она очень круто сохраняет портретное сходство, позволяя модифицировать отдельные детали фотографий. В отличие от того же ChatGPT, при запросе поменять шапку на фото Gemini не будет трогать ничего, кроме шапки. То есть по действию она ближе к Photoshop, чем к генеративной нейросети.
При этом с промптингом можно вообще не заморачиваться: большая языковая модель принимает даже разговорную речь и переводит её в запрос для генератора картинок.

К готовой картинке можно добавить ещё правки — и как минимум первые две-три итерации точно ничего не испортят.

Фото из примера выше поближе:

С одеждой и аксессуарами это тоже работает.

Полная замена лица работает не очень стабильно. Если подгрузить два фото, обычно нейронка просто выдаёт ту же картинку, что была исходно. Причём вне зависимости от того, кто на ней: знаменитость или обычный человек, которого вы сфотографировали либо нашли на стоке. Иногда отказывается генерировать вовсе.

А вот запрос с именем известного человека по какой-то причине проходит нормально. Просто загружаете изображение и пишете, чьё лицо подставить, как в примере выше.
Примерка одежды
Nano Banana поможет примерить конкретные предметы одежды или аксессуары, причём получается так ловко, будто именно это и было надето на человеке изначально. Совпадение текстур не всегда стопроцентное, но при этом само фото вопросов о реалистичности не вызывает.

кадр из сериала «Уэнсдей» / Лайфхакер / Gemini
При этом заставить именно эту функцию работать непросто: нейронка часто возвращает исходное изображение или говорит, что не может справиться с запросом. И знаменитостей почему-то переодеть сложнее, чем обычных людей или моделей со стоков. Чтобы упростить задачу, лучше убрать с фото одежды всё лишнее и оставить только нужные предметы: так не будет вопросов, где какой реф.
Дизайн интерьера
Можно загрузить фото помещения и добавить на него конкретную мебель или декор, либо сделать оформление в интересном вам стиле.

До и после поближе:

При таком сценарии в промпте важно указывать, что вы хотите оставить — например, окно, пол или обои. А ещё всегда хорошей идеей будет попросить не менять размеры комнаты.
Генерация фото товаров
Благодаря сохранению деталей и портретного сходства Gemini здорово справляется с обработкой фото товаров, причём разных категорий.
С его помощью можно вычленить с обычного снимка конкретную вещь — убрать всё лишнее и подсветить только её. Сработает, даже если на фото предмет видно лишь частично или он расположен под странным углом.

О возможности примерки одежды или аксессуаров мы уже рассказывали, но можно поступить и наоборот: взять фото с моделью и сделать чистое фото с нейтральным фоном и освещением.

Размещать предмет в воздухе необязательно: для мелочей можно запросить подставку или подарочную упаковку, для шапки — голову манекена или статуи и так далее.
Коллажирование
Можно не ограничиваться заменой только цвета волос или позы: Nano Banana в состоянии слепить картинку из огромного количества элементов. Например, на таком фоне такая модель в такой юбке и такой блузке на фото этого здания с таким напитком в левой руке и с такой собакой у правой ноги.

Изображений можно подгрузить не более трёх, но никто не мешает сначала сколлажировать нужные элементы: вырезать интересующие детали с картинок и собрать их на одном листе — сделать это можно хоть в Paint.
Учитывайте, что чем сложнее запрос, тем легче сломать модель: она напомнит, что всего лишь машина и воспринять ваши изыскания ей тяжеловато.

Если столкнётесь с подобным, пытайтесь покрутить запрос, чтобы его было проще понять однозначно. Если есть возможность, самостоятельно вырежьте с картинок нужные детали, потому что при указании на номера фото нейросеть может путаться. Вероятно, порядок выбора изображений пользователем не гарантирует, что порядок загрузки на сервер будет таким же. Ещё один вариант — написать номер фото на самих картинках и просить ориентироваться на них.
Реставрация и колоризация фото
Нейросеть помогает восстановить повреждённые снимки и добавить цветов чёрно-белым изображениям. В промпт важно включать фразу «не меняй детали, ничего не добавляй и не убирай с исходного изображения», чтобы сохранить портретное сходство.
Я попробовала восстановить старую фотографию своего дедушки — цветную, но сильно повреждённую, из-за чего корректных цветов на ней почти не осталось. Как референс добавила фотографию формы для помощи с определением оттенков.

С промптом не заморачивалась: «Восстанови цвета первого изображения, второе фото — то, как эта форма выглядит на самом деле. Не меняй детали, ничего не добавляй и не убирай с исходного изображения».

Дальше произошла магия: результат получился хорошим, портретное сходство сохранилось с первого раза, без чрезмерной ИИ-шной смазанности и кривых деталей. Но с так называемым «мексиканским фильтром» — жёлтым тоном, который накладывают поверх картинок многие генераторы изображений.

Я попросила это исправить, и Gemini согласилась… а потом прислала абсолютно идентичный снимок.

Я не сдалась и попросила попробовать ещё раз, но коса нашла на камень окончательно: желтизна никуда не ушла, а вот лицо изменилось.

Пришлось всё-таки сдаться и поправить оттенок вручную. Да, эту работу можно было сделать аккуратнее и качественнее, но я специально действовала максимально быстро и просто: поправила только выбивающиеся цвета, причём сразу для всего изображения, без выделения области, частотного разложения и прочих инструментов. Назовём это попыткой имитировать среднего ленивого пользователя. Итоговый результат вышел таким:

Для сравнения: в коллаже ниже слева — то, как отреставрировал тот же снимок нейронный фильтр Colorize в Photoshop, справа — мои попытки докрасить детали. Суммарно на всё ушло около получаса, тогда как нейронка от Google справилась секунд за 30, плюс ещё минута на коррекцию оттенка лица в обычном фоторедакторе.

Не буду утверждать, что получилось идеально, но это огромный скачок в качестве по сравнению с другими ИИ-сервисами для реставрации фото. Мне всё ещё нравится нейронный фильтр в Photoshop как менее инвазивный метод, но как вариант для восстановления фотографий нажатием одной кнопки и без компьютера (!) Gemini очень и очень хороша. Хотя бы потому что людей, желающих посмотреть на своих близких в цвете, куда больше тех, кто может аккуратно и качественно восстановить и колоризовать снимки вручную.