HowTo: ‘Hoe werkt dat AI R1-taalmodel van DeepSeek?’

HowTo: ‘Hoe werkt dat AI R1-taalmodel van DeepSeek?’
Chinese technologie is steeds prominenter aanwezig is in ons dagelijks leven, maar ook hoe de invloed van de Chinese overheid zich manifesteert in digitale diensten. Chinese bedrijven hebben wereldwijd een stevige voet aan de grond, ondanks de geopolitieke spanningen en handelsoorlogen. Huawei mag dan grotendeels uit westerse markten zijn verdwenen, andere merken zoals Xiaomi, en OPPO domineren een groot deel van de smartphonemarkt. Zelfs als je een iPhone gebruikt, is de kans groot dat je toestel in China is geproduceerd. Jarenlang werkten iPhones samen met Huawei’s zendmasten, totdat providers deze onder druk van de overheid begonnen te vervangen. Lenovo blijft een grote speler op de laptopmarkt, en op tal van andere terreinen zijn Chinese bedrijven toonaangevend: DJI bij drones, BYD bij elektrische auto’s, en talloze andere techgiganten die achter de schermen een cruciale rol spelen.
Soms maak je iets mee waarvan je onmiddellijk weet: dit is een uniek moment. Iets dat je later nooit meer precies zo zult kunnen ervaren. Dit was zo’n moment. Gelukkig had ik een schermopname meelopen. De Chinese AI-dienst DeepSeek gaf een uitgebreid en gedetailleerd antwoord op mijn vraag—een vraag die onmiskenbaar politiek gevoelig ligt in China. Het hele betoog verscheen op het scherm, compleet met een onderbouwde redenering en een lange, goed geformuleerde tekst. Maar toen, in een fractie van een seconde, verdween alles. Wat overbleef was slechts een bericht: een verzoek om het over een ander onderwerp te hebben.
DeepSeek-R1 is een open-source AI-model, ontwikkeld door de Chinese startup DeepSeek en uitgebracht in januari 2025. Volgens het bedrijf biedt R1 vergelijkbare of zelfs betere redeneercapaciteiten dan de meest geavanceerde AI-modellen, maar tegen een fractie van de kosten. Het model is vrij beschikbaar onder een MIT-licentie voor zowel commercieel als academisch gebruik.
DeepSeek’s doorbraak
DeepSeek-R1 is een van de meest geavanceerde AI-modellen uit China, naast de modellen van Alibaba en Moonshot AI. Na de lancering werd DeepSeek’s chatbot de populairste AI-app in de Apple App Store, waarmee het ChatGPT van de troon stootte. Dit succes heeft de Amerikaanse techwereld wakker geschud: DeepSeek’s kostenefficiënte aanpak roept vragen op over de enorme investeringen van bedrijven als OpenAI en Nvidia. Zelfs voormalig president Donald Trump noemde de opkomst van DeepSeek een “wake-up call” voor de VS.
Wat kan DeepSeek-R1?
DeepSeek-R1 blinkt uit in diverse tekstgebaseerde taken in het Engels en Chinees, waaronder:
- Creatief schrijven, samenvatten en bewerken
- Vraag- en antwoordfuncties
- Coderen en foutopsporing
- Wiskundige berekeningen
- Uitleg van wetenschappelijke concepten
Door de open-source structuur kunnen gebruikers het model vrij aanpassen en integreren in hun eigen systemen.
Hoe werkt DeepSeek-R1?
DeepSeek-R1 maakt gebruik van een Mixture of Experts (MoE)-architectuur, waarbij meerdere gespecialiseerde submodellen samenwerken. Dit maakt het model efficiënter en minder rekenkracht-intensief. Daarnaast wordt het verbeterd via reinforcement learning en supervised fine-tuning, wat helpt bij het ontwikkelen van logische redeneringen en foutcorrectie.
DeepSeek-R1 versus andere AI-modellen: drie voordelen!
Vergeleken met toonaangevende modellen als GPT-4o en Claude 3.5 heeft R1 een paar opmerkelijke voordelen:
- Kosten: R1 is aanzienlijk goedkoper om te trainen en te draaien, deels omdat het op minder krachtige, goedkopere Nvidia H800-chips werkt.
- Prestaties: Het model scoort hoog op wiskunde en codering, en presteert beter op Chinese taaltests dan Amerikaanse concurrenten.
- Toegankelijkheid: In tegenstelling tot GPT-4o en Claude 3.5 is R1 volledig open source.
Een belangrijk nadeel is dat het model onderhevig is aan Chinese censuur en niet reageert op politiek gevoelige onderwerpen zoals de Tiananmen-protesten.
De impact
DeepSeek’s doorbraak kan de AI-industrie fundamenteel veranderen. De lage ontwikkelingskosten en hoge prestaties van R1 zetten vraagtekens bij de miljardeninvesteringen van Amerikaanse bedrijven. Dit roept speculaties op: heeft DeepSeek geheime toegang tot verboden Nvidia-chips? Heeft het onrechtmatig westerse modellen gebruikt?
Wat vaststaat, is dat AI’s toekomst niet langer exclusief in handen is van Silicon Valley. China’s DeepSeek-R1 markeert een nieuw tijdperk waarin goedkopere, efficiëntere AI-modellen het speelveld kunnen herdefiniëren.