OpenAI lanceert ChatGPT Images 2.0
4.468 views door Patrick Petersen ·
OpenAI heeft met ChatGPT Images 2.0 een nieuwe generatie AI-beeldgeneratie geïntroduceerd. Deze update bouwt voort op eerdere systemen zoals DALL·E en combineert verbeterde beeldkwaliteit met geavanceerder redeneervermogen.
Wat is er nieuw?
Een van de belangrijkste vernieuwingen is de zogenaamde “thinking-modus”. Dit houdt in dat het model niet direct een afbeelding genereert, maar eerst de opdracht analyseert. Volgens inzichten van OpenAI en vergelijkbare ontwikkelingen in modellen zoals GPT-4 zorgt dit voor beter opgebouwde en logischere beelden. Een tweede belangrijke verbetering is de weergave van tekst in afbeeldingen. Waar oudere AI-modellen vaak moeite hadden met correcte spelling en leesbare letters, laat deze versie duidelijke vooruitgang zien. Dit sluit aan bij bredere ontwikkelingen in multimodale AI, zoals besproken door The Verge en VentureBeat.
Daarnaast is het nu mogelijk om meerdere afbeeldingen tegelijk te genereren. In plaats van één los beeld kan het systeem een reeks van maximaal acht samenhangende afbeeldingen maken, wat nuttig is voor bijvoorbeeld stripverhalen of visuele campagnes.
Ook de beeldkwaliteit is aanzienlijk verbeterd. De resolutie kan oplopen tot ongeveer 2K, en de beelden ogen realistischer en consistenter. Volgens analyses van Axios past dit binnen een bredere trend waarin AI steeds dichter bij professioneel design komt. Verder ondersteunt het model meer stijlen en formaten. Gebruikers kunnen kiezen uit stijlen zoals manga, pixel-art en fotorealisme, en verschillende beeldverhoudingen gebruiken afhankelijk van hun toepassing. Tot slot is de ondersteuning voor meerdere talen in afbeeldingen verbeterd. Teksten in talen zoals Japans, Chinees en Hindi worden duidelijker en correcter weergegeven.
Waarom is dit belangrijk?
Een belangrijke reden is dat AI nu complexere visuele content kan maken, zoals infographics, advertenties en presentaties. Volgens VentureBeat ontwikkelt AI zich hiermee tot een volwaardige creatieve tool. Daarnaast volgt het systeem instructies nauwkeuriger, waardoor resultaten beter aansluiten bij wat gebruikers willen. Ook gedraagt de AI zich meer als een ontwerper, doordat het eerst analyseert en plant voordat het een beeld genereert.
Nadelen en beperkingen
Een nadeel is dat de thinking-modus meer tijd kan kosten, omdat het systeem extra stappen uitvoert voordat het een afbeelding maakt. Daarnaast blijft de kwaliteit afhankelijk van de invoer. Onduidelijke opdrachten kunnen nog steeds minder goede resultaten opleveren.
ChatGPT Images 2.0 is een grote stap vooruit in AI-beeldgeneratie. Het biedt hogere kwaliteit, betere tekstweergave, ondersteuning voor meerdere afbeeldingen en een slimmere aanpak. Hierdoor komt AI steeds dichter bij professioneel ontwerp en creatieve productie.

