OpenAI lanceert algemeen toepasbare agent in ChatGPT

OpenAI lanceert een nieuwe AI-agent voor algemeen gebruik in ChatGPT, die volgens het bedrijf in staat is om een breed scala aan computertaken namens gebruikers uit te voeren. OpenAI stelt dat de agent automatisch de agenda van een gebruiker kan beheren, bewerkbare presentaties en diavoorstellingen kan genereren, en code kan uitvoeren.
De tool, genaamd ChatGPT agent, combineert meerdere functies van eerdere agent-tools van OpenAI, waaronder de mogelijkheid van Operator om te navigeren op websites en Deep Research’s capaciteit om informatie van tientallen websites samen te vatten in een beknopt onderzoeksrapport. Volgens OpenAI kunnen gebruikers eenvoudig met de agent communiceren via natuurlijke taal in ChatGPT.
ChatGPT agent wordt vanaf donderdag uitgerold voor abonnees van de Pro-, Plus- en Team-abonnementen van OpenAI. Gebruikers kunnen de tool activeren door “agentmodus” te selecteren in het dropdownmenu van ChatGPT.
De lancering van ChatGPT agent is OpenAI’s meest ambitieuze poging tot nu toe om van ChatGPT een agentisch product te maken dat daadwerkelijk taken kan uitvoeren in plaats van enkel vragen te beantwoorden. In de afgelopen jaren hebben bedrijven uit Silicon Valley, waaronder OpenAI, Google en Perplexity, tientallen AI-agenten gepresenteerd die dat beloven. Toch bleken eerdere versies moeite te hebben met complexe taken, en ze kwamen minder krachtig over dan de ambitieuze visies die techleiders presenteren. Dat gezegd hebbende, stelt OpenAI dat ChatGPT agent veel capabeler is dan eerdere versies.
De nieuwe agent van het bedrijf heeft toegang tot ChatGPT connectors, waarmee gebruikers apps zoals Gmail en GitHub kunnen koppelen zodat de agent relevante informatie kan opzoeken. OpenAI zegt dat de agent ook toegang heeft tot een terminal, en API’s kan gebruiken om bepaalde apps aan te sturen. OpenAI geeft voorbeelden zoals: “plan en koop ingrediënten om een Japans ontbijt voor vier personen te maken”, of “analyseer drie concurrenten en maak een slide deck”. Dit soort opdrachten vereisen dat ChatGPT agent websites doorzoekt, een plan van aanpak opstelt en hulpmiddelen inzet — veel complexere taken dan eerdere agentprojecten van OpenAI aankonden.
Tech- en investeringsgiganten op de Disrupt 2025-agenda
Netflix, ElevenLabs, Wayve, Sequoia Capital — slechts een paar van de zwaargewichten die aanwezig zijn op Disrupt 2025. Ze delen inzichten die startups helpen groeien en je concurrentiepositie versterken. Mis de 20e verjaardag van TechCrunch Disrupt niet, van 27-29 oktober 2025 in San Francisco.
REGISTREER NU en bespaar tot $675 voordat de prijzen stijgen.
Volgens OpenAI biedt het onderliggende model van ChatGPT agent state-of-the-art prestaties op verschillende benchmarks. Zo behaalt het model 41,6% op Humanity’s Last Exam (pass@1), een moeilijke test met duizenden vragen over meer dan honderd onderwerpen. Dat is ongeveer het dubbele van wat de o3- en o4-mini-modellen van OpenAI eerder behaalden. Op FrontierMath, een van de moeilijkste bekende wiskundige benchmarks, scoort ChatGPT agent 27,4% wanneer het gebruik mag maken van tools zoals een terminal om code uit te voeren. Ter vergelijking: het eerdere hoogst scorende model, o4-mini, behaalde slechts 6,3%.
Veiligheid speelde een grote rol bij de ontwikkeling van ChatGPT agent, aldus OpenAI, omdat de nieuwe mogelijkheden ook risico’s met zich meebrengen. In een veiligheidsrapport meldt het bedrijf dat het model als “high capability” is aangemerkt op het gebied van biologische en chemische wapens — wat volgens het OpenAI Preparedness Framework betekent dat het model bestaande paden naar ernstig letsel kan versterken. Er is geen direct bewijs dat dit gebeurt, maar OpenAI neemt een voorzichtige aanpak en heeft nieuwe veiligheidsmaatregelen ingevoerd.
Een van die maatregelen is een monitoringssysteem in realtime tijdens het gebruik. Elke prompt die een gebruiker invoert, wordt gescand op biologische inhoud. Als dat het geval is, wordt het antwoord van de agent door een tweede monitor gehaald om te beoordelen of het een biologisch risico vormt.
Daarnaast heeft OpenAI de geheugenfunctie van ChatGPT uitgeschakeld voor deze agent om misbruik te voorkomen. In andere delen van ChatGPT maakt deze functie het mogelijk om informatie uit eerdere gesprekken op te halen, maar bij agent-technologie zou dit kunnen leiden tot het uitlekken van gevoelige gegevens via zogenaamde prompt-injectie-aanvallen. OpenAI sluit niet uit dat deze functie in de toekomst terugkeert, maar voorlopig is ze gedeactiveerd. Hoewel ChatGPT agent indrukwekkend klinkt, moet nog blijken hoe goed het in de praktijk presteert. Tot nu toe bleek agenttechnologie nog vrij kwetsbaar bij interactie met de echte wereld. Toch zegt OpenAI dat het een krachtiger model heeft ontwikkeld dat dichter bij de belofte van AI-agenten komt.
