Microsoft: ‘AI-systeem beter dan artsen in het diagnosticeren’

Microsoft heeft een nieuw AI-systeem gepresenteerd dat beter presteert dan menselijke artsen bij het stellen van complexe diagnoses. Volgens het technologiebedrijf betekent deze ontwikkeling een stap richting wat het zelf noemt een “pad naar medische superintelligentie”. Het AI-team van Microsoft, onder leiding van de Britse techpionier Mustafa Suleyman, ontwikkelde een systeem dat het werk van een multidisciplinair panel van medisch specialisten nabootst. Het richt zich op diagnostisch complexe en intellectueel veeleisende medische casussen.
In combinatie met OpenAI’s geavanceerde o3-model bleek het systeem in staat om meer dan 80% van deze casussen – afkomstig uit de New England Journal of Medicine – correct te analyseren. Ter vergelijking: menselijke artsen, die zonder hulpmiddelen werkten, kwamen in slechts 20% van de gevallen tot de juiste diagnose.
Microsoft stelt dat het systeem niet alleen nauwkeuriger is, maar ook efficiënter omgaat met het aanvragen van diagnostische tests. Dat zou het op termijn ook kosteneffectiever maken dan traditionele medische diagnostiek. The Guardian meldt:
Explaining the rationale behind the research, Microsoft raised doubt over AI’s ability to score exceptionally well in the United States Medical Licensing Examination, a key test for obtaining a medical licence in the US. It said the multiple-choice tests favoured memorising answers over deep understanding of a subject, which could help “overstate” the competence of an AI model.
Kosten
Hoewel het bedrijf de potentiële kostenbesparingen benadrukt, nuanceert het de gevolgen voor werkgelegenheid in de sector. “Artsen hebben een veel bredere rol dan alleen het stellen van diagnoses. Ze moeten omgaan met onzekerheid en vertrouwen opbouwen met patiënten en hun families – iets wat AI (voorlopig) niet kan vervangen,” schrijft Microsoft in een toelichtende blogpost. De onderzoeksresultaten worden momenteel ingediend voor peer review. Toch wijst het gebruik van termen als “medische superintelligentie” op mogelijke disruptie in de zorgsector. Waar Artificial General Intelligence (AGI) verwijst naar systemen met het denkvermogen van mensen, doelt superintelligentie op AI die menselijke cognitieve capaciteiten in alle opzichten overtreft.
Volgens Suleyman zal het systeem binnen vijf tot tien jaar nagenoeg foutloos functioneren. “Het is duidelijk dat we op weg zijn naar vrijwel foutloze systemen. Dat zal wereldwijd de druk op zorgstelsels aanzienlijk verlichten,” aldus de CEO van Microsoft AI tegenover The Guardian.
Traditioneel
De aanleiding voor het onderzoek was volgens Microsoft onder meer twijfel over de relevantie van traditionele toetsen, zoals de Amerikaanse Medical Licensing Examination. Die zijn te sterk gericht op memorisatie, en minder op klinisch redeneren – wat AI-modellen een vertekend voordeel zou geven.
Daarom ontwikkelde Microsoft een methode die het denkproces van artsen nabootst: het systematisch stellen van vragen, het aanvragen van relevante tests en het op basis daarvan komen tot een diagnose. Zo kan bijvoorbeeld een patiënt met hoest en koorts worden doorgestuurd voor bloedonderzoek en een longfoto, voordat een diagnose zoals longontsteking wordt gesteld. Meer dan 300 casussen uit de NEJM zijn door Microsoft’s team omgezet naar interactieve cases, waarmee het systeem getest werd. De AI-oplossing werd opgebouwd rond bestaande modellen, waaronder die van OpenAI, Meta, Anthropic, Google (Gemini) en xAI (Grok), en gecombineerd met een speciaal ontwikkelde ‘diagnostische orkestrator’. Deze werkt als een coördinerende AI die bepaalt welke tests nodig zijn en welke diagnoses het meest waarschijnlijk zijn – vergelijkbaar met een overleg van specialisten.
Microsoft stelt dat het systeem een ongeëvenaarde breedte en diepgang van medische kennis kan inzetten, doordat het meerdere disciplines tegelijk kan combineren.
Het bedrijf voegt daaraan toe: “Het vermogen om dit niveau van klinisch redeneren op schaal toe te passen, kan de gezondheidszorg fundamenteel transformeren. AI kan patiënten ondersteunen in routinematige zorg en zorgverleners voorzien van krachtige beslissingsondersteuning bij complexe gevallen.”
Microsoft benadrukt dat het systeem nog niet klaar is voor klinische toepassing. Verdere validatie en testen, ook op meer voorkomende klachten, zijn noodzakelijk voordat brede inzet mogelijk is.

