Nano Banana od Google podbija sieć. Już nie odróżnisz prawdy od fikcji
To Google stoi za tajemniczym Nano Banana. Ilus.: Mike Dorner / Unsplash | INNPoland

Najnowsze narzędzie, które zyskało rozgłos w mediach społecznościowych, okazało się kolejnym systemem AI ze stajni Google. Nano Banana możecie używać przez chata z Gemini, a jego zdolności przekraczają dotychczasowe możliwości systemów generowania obrazu.

REKLAMA

Narzędzie do edycji obrazu znane pod roboczą nazwą Nano Banana, które w ostatnich dniach błyskawicznie zyskało popularność w internecie, okazało się projektem Google – potwierdziła we wtorek firma. Technologia zostanie zintegrowana z aplikacją Gemini, czyli flagowego systemu AI Google.

Nano Banana to najnowszy przykład narzędzia do edycji obrazu, które przykuło uwagę internautów, imponując nie tylko zdolnością tworzenia nowych obrazów, ale także ich precyzyjnego udoskonalania. Ta umiejętność, stanowiąca dotąd wyzwanie dla twórców sztucznej inteligencji, wyróżnia nową propozycję Google na tle konkurencji.

Dostępność i funkcje Gemini 2.5 Flash Image

Google ogłosiło, że model, który zyskał rozgłos pod nazwą kodową, jest dostępny od wtorku dla użytkowników darmowych i płatnych wersji Gemini – zarówno w przeglądarce internetowej, jak i w aplikacjach mobilnych.

Użytkownicy darmowi będą mogli wykonać do 100 edycji obrazów dziennie, natomiast subskrybenci płatnych pakietów otrzymają dziesięciokrotnie większy limit. Oficjalna nazwa narzędzia to Gemini 2.5 Flash Image.

Pod nazwą Nano Banana model ten już wcześniej przewyższał inne narzędzia na listach LMArena (to publiczne rankingi, które oceniają i porównują wydajność różnych modeli językowych i narzędzi do generowania obrazu, bazując na głosach i preferencjach użytkowników) w kategorii edycji obrazu.

Jak działa nowa technologia?

Nowe narzędzie umożliwia tworzenie zdjęć na podstawie tekstu lub modyfikację istniejących obrazów. Google zaprezentowało przykład zdjęcia młodej kobiety, które zostało przekształcone w wizerunek osoby w stroju matadora.

logo
Przykład działania Nano Banana. Ilus.: Blog Google

Google podkreśla, że model jest również znacznie lepszy od poprzednich wersji w obsłudze wieloetapowych edycji. W jednym z przykładów pokazano kolejne etapy wizualizacji renowacji pomieszczenia – począwszy od świeżej warstwy farby, a skończywszy na dodaniu różnych mebli.

Narzędzie potrafi także łączyć dwa obrazy. Google zademonstrowało przykład, w którym jedno zdjęcie zostało przekształcone we wzór, a następnie nałożone na kozaki widoczne na innym zdjęciu. Wszystkie obrazy generowane przez model są oznaczane jako stworzone przez sztuczną inteligencję za pomocą systemu SynthID firmy Google, który dodaje cyfrowy znak wodny.

Wyzwania i udoskonalenia w edycji AI

Choć sztuczna inteligencja okazała się niezwykle pomocna w generowaniu obrazów, często napotykała trudności na etapie edycji, zwłaszcza gdy dotyczyło to modyfikowania zdjęć prawdziwych osób. Google twierdzi, że jego nowe narzędzie lepiej niż wcześniejsze modele (zarówno własne, jak i konkurencji) dba o to, by główny obiekt zdjęcia nie zaczął wyglądać jak ktoś inny, zwłaszcza przy kumulacji edycji.

"Wiemy, że podczas edytowania zdjęć siebie lub osób, które dobrze znamy, subtelne niedoskonałości mają znaczenie – wizerunek, który jest 'podobny, ale nie do końca taki sam', nie sprawia wrażenia autentycznego" – napisało Google w poście na blogu. "Dlatego nasza najnowsza aktualizacja została zaprojektowana tak, aby zdjęcia przyjaciół, rodziny, a nawet zwierząt domowych, wyglądały konsekwentnie jak oni sami, niezależnie od tego, czy próbujesz fryzury w stylu lat 60., czy zakładasz tutu swojemu chihuahua."

Przypomnijmy, że OpenAI odnotowało gwałtowny wzrost pobrań i użytkowania ChatGPT po tym, jak w marcu udostępniło wysoce zaawansowany generator obrazów.