OpenAI har lansert GPT ImageGen 2, og oppsummeringen er enkel: AI-genererte bilder med tekst fungerer nå. Tidligere var tekst i bilder et klassisk svakhetspunkt for alle bildegeneringsmodeller. Det er ikke lenger tilfelle.
Hva er nytt?
Modellen kan generere overbevisende lysbilder, tabeller, akademiske plakater og infografikk med korrekt tekst. Bokstavfeil og nonsens-ord som har preget AI-bilder i årevis er nå borte i de fleste tilfeller. Det er mulig å be om fullstendige presentasjoner og få et brukbart resultat uten manuell etterprosessering.
Nyttig, men ikke uten forbehold
Redigering kan dessuten bli treg. Etter et par justeringsrunder har modellen en tendens til å bli sta og ignorere instrukser. En ny sesjon løser ofte problemet.
Hva betyr det i praksis?
For presentasjoner, markedsmateriell og kommunikasjonsarbeid åpner dette for raskere produksjon av visuelle hjelpemidler. Det er ikke lenger nødvendig å unngå tekst i bildeprompts eller planlegge ekstra tid til manuell redigering.