Blog
Kontakt os

Nano Banana (Google)

Nano Banana er Googles navn for billedgenereringsfunktionerne i Gemini-familien. Den foerste version lancerede i august 2025 som Gemini 2.5 Flash Image, og siden februar 2026 er Nano Banana 2 (Gemini 3.1 Flash Image) standardmodellen i Gemini-appen, Google Search AI Mode, Lens, AI Studio og Vertex AI. Modellen adskiller sig fra klassiske diffusionsmodeller ved at generere billeder autoregressivt, token for token, gennem den samme reasoning-pipeline som haandterer tekst.

Du kan give Nano Banana en tekstbeskrivelse og faa et billede tilbage paa 3-5 sekunder. Du kan ogsaa uploade et eksisterende foto, bede den om at fjerne en person, aendre baggrunden til et kontorlokale, tilfoeje tekst paa dansk og faa resultatet direkte i Gemini-chatten. Nano Banana 2 kan fastholde op til fem karakterer konsistent paa tvaers af flere billeder i samme samtale, hvilket goer den velegnet til serier og kampagnemateriale.

For virksomheder erstatter Nano Banana potentielt separate workflows til produktfotografering, billedredigering, lokalisering af visuelt materiale og generering af annoncevarianter. En marketingafdeling der i dag bruger en fotograf, en grafiker og et oversaettelsesbureau til at producere kampagnebilleder paa fire sprog kan i stedet generere og tilpasse materialet direkte i Gemini eller via Vertex AI-API'en.

Læsetid 7 minOpdateret maj 2026

Saadan fungerer Nano Banana teknisk

1. Autoregressive visuelle tokens i stedet for diffusion. De fleste AI-billedmodeller (Stable Diffusion, DALL-E 3, Midjourney) bruger en diffusionsproces, hvor modellen starter med stoej og gradvist fjerner den for at danne et billede. Nano Banana goer det anderledes. Hvert billede kodes som en sekvens af visuelle tokens, der forudsiges en efter en gennem den samme transformer-arkitektur som behandler tekst. Det betyder, at tekst- og billedforstaaelse deler den samme reasoning-pipeline, og modellen kan raesonnere om indholdet foer den renderer pixels.

2. Hybrid arkitektur: autoregressiv + diffusion-refinement. Tekniske analyser peger paa, at Nano Banana 2 kombinerer to trin. Foerst genererer en autoregressiv transformer en grov, tokeniseret repraesentation af billedet. Dernaest opsampler og forfiner en diffusionsbaseret proces resultatet til hoej oploesning. Denne todelte tilgang giver modellen baade den sprogsforstaaelse der kommer fra autoregressive modeller og den visuelle kvalitet der kommer fra diffusion.

3. Separate vaegtsaet for billede og tekst. Nano Banana 2 bruger dedikerede vaegtsaet til henholdsvis billed- og sprogrepraesentation. Det forklarer, hvorfor modellen er markant bedre til at gengive tekst i billeder end tidligere diffusionsmodeller. Naar du beder den om at skrive "Aabent hus loerdag kl. 10" paa et skilt, forstaar den bogstaverne som spragelementer, ikke bare pixelmonstre.

4. Plan-Evaluate-Improve-loop. Nano Banana 2 introducerer en flertrinsproces, hvor modellen foerst planlaegger kompositionen, dernaest evaluerer resultatet og til sidst forbedrer det foer de endelige pixels renderes. Det er denne loop der giver konsistent tekst, praecise rumlige arrangementer og teknisk korrekte detaljer som haender med fem fingre eller symmetriske ansigter.

5. Nativt multimodal: samme model til input og output. I modsaetning til systemer som DALL-E 3, hvor en separat model (GPT-4) skriver en prompt der sendes til en billedmodel, er Nano Banana en enkelt model der baade forstaar og genererer billeder. Det eliminerer latens fra handoffs mellem modeller og goer det muligt at redigere et billede iterativt i en samtale uden at miste kontekst.

6. Sammenligning med GPT Image og Flux. OpenAIs GPT Image 1.5 bruger separate encoder/decoder-pipelines, hvilket giver hoej kvalitet men laengere genereringstid (typisk 10-20 sekunder per billede). Flux 2 Pro v1.1 fra Black Forest Labs bruger en ren diffusions-transformer (DiT) der scorer hoejt paa fotorealisme men mangler den native tekstforstaaelse. Nano Banana 2 scorer hoejest paa LM Arena med en Elo-rating paa 1.360, mod GPT Image 1.5s 1.264 og Flux 2 Pros 1.265.

7. Hastighed og infrastruktur. Nano Banana 2 genererer et standardbillede paa 3-5 sekunder, hvilket er 2-4 gange hurtigere end Nano Banana Pro (8-12 sekunder) og markant hurtigere end GPT Image 1.5. Hastigheden kommer fra Flash-arkitekturen, Googles optimerede TPU-infrastruktur og den effektive tokenisering af visuelle elementer.

8. Oploesning og begraensninger. Modellen understotter op til 4K-oploesning i Nano Banana 2, men standardoutput er 1024x1024 pixels. Karakterkonsistens virker for op til fem personer og op til 14 objekter i en enkelt workflow. Videogenerering er ikke en del af Nano Banana, men Google har separate modeller (Veo) til det formaal.

Vil du bruge AI-billedgenerering strategisk i din virksomhed? Vi hjaelper med at vurdere, om Nano Banana, Midjourney eller en anden model passer bedst til jeres workflows, og med at integrere loesningen i jeres eksisterende processer via API eller Vertex AI.

Konkrete funktioner og B2B-anvendelser

Tekstgenerering i billeder
Nano Banana 2 kan gengive laesbar tekst paa flere sprog direkte i genererede billeder. En dansk e-handelsvirksomhed kan generere produktbilleder med danske prisskilte, kampagnetekst og CTA-knapper uden efterfoelgende billedredigering. Funktionen understotter ogsaa oversaettelse: upload et billede med engelsk tekst, og Nano Banana kan erstatte teksten med dansk.

Karakterkonsistens paa tvaers af billeder
Modellen fastholder op til fem karakterers udseende konsistent gennem en hel billedsekvens. Et reklamebureaus kreative team kan generere en serie paa 10-15 billeder til en social media-kampagne, hvor den samme persona optrcder i forskellige situationer, uden at ansigt, haar eller beklaedning aendrer sig mellem billederne.

Billedredigering via naturligt sprog
Du kan uploade et eksisterende foto og bede Nano Banana om specifikke aendringer: fjern baggrunden, tilfoej regn paa vinduet, goer billedet varmere i tonen, fjern en person fra gruppen. En ejendomsmaegler kan uploade fotos af en bolig og faa dem redigeret til at vise moeblerede rum, aendret dagslys eller fjernede personlige ejendele, alt sammen via tekstkommandoer i Gemini.

Produktvisualisering og varianter
Nano Banana kan generere et produkt i forskellige farver, vinkler og miljoeer ud fra et enkelt referencebillede. En moebelproducent der lancerer en ny stol kan generere 20 varianter i forskellige stoftyper og rumsettings paa minutter i stedet for at booke en fotograf til en hel dag.

Web-grounding for aktualitet
Nano Banana 2 har adgang til real-time web-grounding, hvilket betyder at den kan generere billeder af aktuelle begivenheder, kendte bygninger og specifikke produkter med hoejere praecision end modeller der kun kender deres traeningsdata. Beder du den om at generere et billede af Koebenhavns nye metro-station, bruger den aktuel viden om stationens udseende.

Batch-generering via API
Gennem Vertex AI og AI Studio kan udviklere kalde Nano Banana 2 programmatisk. Et SaaS-selskab der genererer personaliserede onboarding-materialer til nye kunder kan integrere API-kald i sin pipeline og generere 500 tilpassede velkomstbilleder paa under en time til en pris af ca. 34 kr. via Batch API.

Flersproget lokalisering af visuelt materiale
Nano Banana kan tage et kampagnebillede paa dansk og gengive det med tekst paa tysk, svensk og norsk. En nordisk virksomhed der koerer annoncer i fire lande kan generere alle sprogvarianter direkte i stedet for at sende filerne til en grafiker for hver oversaettelse.

Konkurrenter og markedsposition

Midjourney V7
Midjourney er kendt for aesthetisk kvalitet og kunstnerisk sammenhseng. V7-versionen producerer billeder med en karakteristisk visuel stil der ofte beskrives som "filmisk". Styrken er kreativ inspiration og konceptualisering. Svagheden er manglende officiel API, hvilket goer enterprise-integration besvaerlig. Prisen er $10-120/md afhsengig af abonnement, uden pay-per-image-mulighed.

GPT Image 1.5 (OpenAI)
OpenAIs billedmodel scorer hoejt paa prompt-praecision og realistisk gengivelse. Den er integreret i ChatGPT og tilgsengelig via API. Genereringstiden er 10-20 sekunder per billede, markant langsommere end Nano Banana 2. API-prisen ligger paa ca. $0.04-0.12 per billede afhsengig af oploesning. Styrken er den taette integration med GPT-4o til komplekse, flertrinsprompts.

Flux 2 Pro v1.1 (Black Forest Labs)
Flux bruger en ren diffusions-transformer-arkitektur og scorer paa niveau med GPT Image 1.5 paa fotorealisme (Elo 1.265). Modellen er open-weight, hvilket giver fleksibilitet til virksomheder der vil koere den on-premise. Prisen via fal.ai starter ved ca. $0.055 per billede. Svagheden er begrsenset tekst-rendering sammenlignet med Nano Banana 2.

Adobe Firefly 3
Adobes model er bygget specifikt til kommercielt brug med fuld IP-indemnification. Den integrerer direkte i Photoshop, Illustrator og Express. Prisen er inkluderet i Creative Cloud-abonnementet (ca. 450 kr./md for enkeltbruger). Styrken er juridisk sikkerhed og integration i eksisterende designworkflows. Svagheden er lavere benchmark-scores og langsommere iteration end Nano Banana 2.

Stable Diffusion 3.5 (Stability AI)
Den mest fleksible open-source-mulighed. Kan koeres lokalt paa egne GPU'er uden API-omkostninger. Styrken er fuld kontrol over modellen og mulighed for fine-tuning til specifikke brugscases. Svagheden er kravet om teknisk ekspertise og GPU-hardware (minimum 12 GB VRAM for acceptable resultater).

Hvor Nano Banana er staerkest. Modellen har den hoejeste Elo-score (1.360), den hurtigste genereringstid (3-5 sek.) og den bedste tekst-rendering af alle testede modeller. Den er desuden gratis tilgsengelig i Gemini-appen, hvilket saenker barrieren for adoption. Omvendt har Midjourney stadig overtaget paa aesthetisk kreativitet, Flux giver mere kontrol til tekniske teams via open-weight, og Adobe Firefly tilbyder bedre juridisk beskyttelse for kommercielt indhold.

Ofte stillede spoergsmaal om Nano Banana

Hvad er forskellen paa Nano Banana og Nano Banana Pro?

Nano Banana (Gemini 2.5 Flash Image) var den foerste version, lanceret i august 2025. Nano Banana Pro (Gemini 3 Pro Image) kom i november 2025 med hoejere kvalitet men langsommere generering (8-12 sek.). Nano Banana 2 (Gemini 3.1 Flash Image) fra februar 2026 kombinerer Pro-kvaliteten med Flash-hastigheden (3-5 sek.) og er nu standardmodellen i Gemini.

Kan Nano Banana erstatte vores fotograf og grafiker?

Til visse opgaver ja. Produktvisualisering, kampagnevarianter, social media-billeder og intern praesentationsgrafik kan genereres direkte. Til hoejkvalitets brandingmateriale, komplekse kompositioner og billeder der kraever pixel-perfekt kontrol er en grafiker stadig nødvendig. De fleste virksomheder oplever en reduktion i produktionstid paa 50-70% for rutinemateriale.

Hvad koster det at bruge Nano Banana via API?

Prisen starter ved $0.045 per billede i 512px via Google AI Studio. 1K-billeder koster $0.067, og 4K koster $0.151. Med Batch API faar du 50% rabat paa alle oploesninger. I Gemini-appen er grundlaeggende billedgenerering gratis, mens Gemini Advanced (149 kr./md) giver hoejere kvoter og 4K-adgang.

Er Nano Banana i overensstemmelse med EU AI Act?

Ja. Google implementerer C2PA Content Credentials og SynthID-vandmaerkning paa alle genererede billeder, hvilket opfylder AI Acts krav til transparens og maerkning af AI-genereret indhold (Artikel 50). Via Vertex AI kan data behandles i EU-regioner, hvilket understotter GDPR-compliance. Virksomheder skal dog selv sikre, at deres prompts ikke kraenker ophavsret.

Kan Nano Banana generere tekst paa dansk i billeder?

Ja, Nano Banana 2 understotter dansk tekstgenerering i billeder. Modellen kan skrive danske saetninger paa skilte, knapper og labels i genererede billeder. Kvaliteten er markant forbedret i version 2, men komplekse ord med ae, oe og aa kan i sjaeldne tilfaelde renderes forkert. Kontroller altid output for kritisk materiale.

Hvordan sammenligner Nano Banana sig med Midjourney?

Nano Banana 2 scorer hoejere paa tekniske benchmarks (Elo 1.360 vs. Midjourneys lavere score) og er hurtigere (3-5 sek. vs. 15-60 sek.). Midjourney V7 har til gengseld en mere karakteristisk aesthetisk stil og er foretrukket til kreativ konceptualisering. Nano Banana har officiel API-adgang, mens Midjourney kun tilbyder adgang via Discord eller deres webinterface uden enterprise-API.

Kan vi koere Nano Banana on-premise?

Nej. Nano Banana er kun tilgsengelig som cloud-tjeneste via Gemini-appen, Google AI Studio eller Vertex AI. Virksomheder der kraever on-premise billedgenerering kan overveje Flux (open-weight) eller Stable Diffusion (open-source). Via Vertex AI kan du dog sikre, at databehandlingen sker i specifikke EU-regioner.