GPT ImageGen 2 løser tekst i bilder

TL;DR

OpenAI sin nye bildegeneringsmodell kan nå generere tekst, lysbilder og akademiske figurer uten bokstavfeil. Modellen har krysset en kvalitetsgrense som lenge var umulig for AI.

OpenAI har lansert GPT ImageGen 2, og oppsummeringen er enkel: AI-genererte bilder med tekst fungerer nå. Tidligere var tekst i bilder et klassisk svakhetspunkt for alle bildegeneringsmodeller. Det er ikke lenger tilfelle.

Hva er nytt?

Modellen kan generere overbevisende lysbilder, tabeller, akademiske plakater og infografikk med korrekt tekst. Bokstavfeil og nonsens-ord som har preget AI-bilder i årevis er nå borte i de fleste tilfeller. Det er mulig å be om fullstendige presentasjoner og få et brukbart resultat uten manuell etterprosessering.

Nyttig, men ikke uten forbehold

Advarsel

Modellen kan generere troverdige grafer med oppdiktede tall. En pen visualisering er ikke nødvendigvis korrekt. Bruk kritisk blikk på datapunkter i AI-genererte figurer.

Redigering kan dessuten bli treg. Etter et par justeringsrunder har modellen en tendens til å bli sta og ignorere instrukser. En ny sesjon løser ofte problemet.

Hva betyr det i praksis?

For presentasjoner, markedsmateriell og kommunikasjonsarbeid åpner dette for raskere produksjon av visuelle hjelpemidler. Det er ikke lenger nødvendig å unngå tekst i bildeprompts eller planlegge ekstra tid til manuell redigering.

Tekst i AI-bilder er ikke lenger noe å jobbe rundt. Gjenbruk prompts som tidligere krevde manuell etterbehandling, og vær bevisst på risikoen for overbevisende men feil datavisualisering.