Anthropic houdt krachtigste AI achter: “Te gevaarlijk om los te laten”

Het AI-bedrijf Anthropic heeft een nieuw model ontwikkeld dat zo geavanceerd is dat het zelfstandig cyberaanvallen kan uitvoeren. Tijdens interne tests bleek de technologie in staat om kwetsbaarheden in software te vinden én direct te misbruiken — soms volledig zonder menselijke tussenkomst. Dat maakt het model fundamenteel anders dan bestaande AI-systemen. Waar huidige tools vooral ondersteunen, kan deze AI actief aanvallen uitvoeren en complexe hacks samenstellen.
Te krachtig voor het publiek
Volgens Anthropic is het risico simpelweg te groot om het model vrij beschikbaar te maken. De zorg is dat zelfs mensen zonder technische kennis met deze AI zware cyberaanvallen zouden kunnen uitvoeren.
We hebben een punt bereikt waarop het onverantwoord is om dit soort capaciteiten breed beschikbaar te maken.
Daarom heeft het bedrijf besloten het model voorlopig niet te publiceren. In plaats van een publieke release kiest Anthropic voor een gecontroleerde aanpak. Het model wordt alleen beschikbaar gesteld aan een kleine groep vertrouwde partijen, zoals cybersecurity-experts en grote technologiebedrijven. Het doel: systemen beter beveiligen voordat kwaadwillenden toegang krijgen tot vergelijkbare technologie. Venturebeat meldt:
All three vulnerabilities have been reported to the relevant maintainers and have since been patched. For many other vulnerabilities still in the remediation pipeline, Anthropic says it is publishing cryptographic hashes of the details today, with plans to reveal specifics after fixes are in place.
On the CyberGym evaluation benchmark, Mythos Preview scored 83.1%, compared to 66.6% for Claude Opus 4.6, Anthropic’s next-best model. The gap is even wider on coding benchmarks: Mythos Preview achieves 93.9% on SWE-bench Verified versus 80.8% for Opus 4.6, and 77.8% on SWE-bench Pro versus 53.4%.
Een voorproefje van de toekomst
De beslissing laat zien hoe snel AI zich ontwikkelt — en hoe dun de lijn wordt tussen nuttige innovatie en potentieel gevaar. Cybersecurity dreigt hierdoor een compleet nieuw speelveld te worden, waarin AI zowel de grootste verdediger als de grootste bedreiging kan zijn.
Anthropic trekt een duidelijke grens: niet alles wat technisch mogelijk is, moet meteen gedeeld worden.
De boodschap is helder:
Deze generatie AI is krachtig genoeg om echte schade te veroorzaken en vraagt om voorzichtigheid voordat ze wordt losgelaten.
