Mistral AI is Europa’s antwoord op het krachtige DeepSeek AI-chat, maar boost de illegale AI-chatbots

Mistral AI is het Europese, snelle antwoord op de krachtige DeepSeek AI-chat
Mistral AI is een Franse startup op het gebied van kunstmatige intelligentie, het is opgericht in 2023 en kent werknemers die zijn weggeplukt bij Google en Meta. En dat lijkt geen toeval. Het bedrijf ontwikkelt zowel open-source als commerciële AI-modellen, waarvan sommige state-of-the-art prestaties hebben behaald op verschillende industriële benchmarks. Mistral duikt in Nederland op in een markante context. Stichting Brein haalt wederom een illegaal getrainde AI-chat offline, deze keer getraind met een open bestand vol met illegaal verkregen boeken en artikelen. Concreet was er grootschalige inbreuk op auteursrechten noemt men ook wel ‘piraterij’ in het bestand waarmee de illegale AI-chatbot is getraind.
Feit is dat met een open model zoals Mistral AI, dat weinig energie verbruikt, net als weinig geheugen, er redelijk eenvoudig een AI-chatbot kan worden gelanceerd op zomaar een webserver. Plak daar met Python een chat aan vast en de AI-chat is geboren. Vandaag en morgen is minister Dirk Beljaarts (Economische Zaken) samen met staatssecretaris Zsolt Szabó (Digitalisering en Koninkrijksrelaties) in Parijs om deel te nemen aan de internationale top over kunstmatige intelligentie (AI). Gelinkt aan dit Franse taalmodel en de ambitie van de Fransen om binnen Europa de koploper op gebied van AI te gaan worden. Het is vooral aan ASML-land Nederland.
Met aanzienlijke investeringen van bedrijven zoals Microsoft en Andreessen Horowitz, en een geschatte waardering van $6 miljard na de laatste financieringsronde, groeit Mistral uit tot een serieuze concurrent in de markt voor generatieve AI. Hun toonaangevende commerciële LLM presteert beter dan die van gevestigde bedrijven zoals Google en Anthropic en kan zich meten met OpenAI’s GPT-4. Ook Nvidia heeft onlangs een bedrag ge-investeerd. Markant zijn de overeenkomsten met DeepSeek.
Het beste taalmodel
Het “beste” taalmodel hangt af van je specifieke behoeften en gebruiksscenario’s, populaire taalmodellen hebben elk hun eigen sterke punten:
-
Mistral AI: Een krachtig model dat goed presteert in een breed scala aan taken, zoals tekstgeneratie, vertaling en samenvatting.
-
BERT (Bidirectional Encoder Representations from Transformers): Ontwikkeld door Google, is BERT uitstekend voor taken zoals tekstclassificatie, entiteit-herkenning en beantwoording van vragen.
-
RoBERTa (A Robustly Optimized BERT approach): Een verbeterde versie van BERT die betere prestaties biedt op verschillende NLP-taken.
-
T5 (Text-to-Text Transfer Transformer): Ook ontwikkeld door Google, is T5 bedoeld om een breed scala aan tekstgerelateerde taken te behandelen als tekst-naar-tekst-transformaties.
-
BLOOM (BigScience Large Open-science Open-access Multilingual Language Model): Een open-source model dat is ontworpen om meerdere talen te ondersteunen en toegankelijk te zijn voor de wetenschappelijke gemeenschap.
-
LLaMA (Large Language Model Meta): Een krachtig model ontwikkeld door Meta, dat goed presteert in tekstgeneratie en andere NLP-taken.
Mistral een reeks open-source modellen aan die gratis toegankelijk en aanpasbaar zijn. Dit maakt hen een tegenhanger van de grotere AI-bedrijven die hun technologieën gesloten houden. Het bedrijf stelt dat door open modellen te trainen en vrij beschikbaar te maken, ze een alternatief vormen voor de opkomende AI-oligopolies. Het vrij kunnen trainen was ook de aanleiding voor bijvoorbeeld GEITje-1 om een boeken AI-chat te maken dat dus recentelijk door Brein is offline gehaald.
Mistral AI is an artificial intelligence startup that makes open source large language models (LLMs). Based in Paris, France, and founded by former researchers at Google DeepMind and Meta, Mistral is known for its open, portable, customizable and cost-effective models that require fewer computational resources than other popular LLMs.
Net als andere grote taalmodellen (LLMs) worden de modellen van Mistral AI getraind op enorme hoeveelheden tekstdata van het internet. Hierdoor kunnen ze verschillende natuurlijke taalverwerkingstaken (NLP) uitvoeren. Enkele unieke kenmerken van Mistrals modellen zijn:
Sommige modellen, zoals Mixtral 8x7B en 8x22B, gebruiken een mixture of experts (MoE)-architectuur. Dit betekent dat het model meerdere kleinere submodellen (“experts”) bevat die alleen worden geactiveerd wanneer dat nodig is. Dit verbetert de prestaties en verlaagt de rekenkosten. Hoewel MoE-modellen kleiner en goedkoper zijn, leveren ze vergelijkbare of betere prestaties dan traditionele transformer-gebaseerde modellen.
Open Source
Veel van de modellen van Mistral AI zijn open-source. Dit betekent dat de code, data en parameters (gewichten) beschikbaar zijn voor iedereen die ze wil gebruiken of aanpassen. Dit biedt bedrijven en onderzoekers veel meer flexibiliteit dan gesloten modellen. Open-source LLMs zijn met name nuttig voor bedrijven in sterk gereguleerde sectoren, zoals banken en ziekenhuizen, omdat ze lokale, veilige implementaties mogelijk maken.
Function Calling mogelijkheden
Sommige modellen, zoals Mistral Large 2, Large, Small, 8x22B en NeMo, ondersteunen native function calling. Dit betekent dat ze kunnen integreren met andere platforms en taken kunnen uitvoeren buiten hun oorspronkelijke functionaliteit. Dit maakt ze efficiënter en veelzijdiger.
Meertaligheid
Terwijl veel LLMs zich beperken tot één taal, zijn de meeste modellen van Mistral AI vloeiend in Engels, Frans, Spaans, Duits en Italiaans. Dit stelt hen in staat om complexe meertalige taken uit te voeren, zoals tekstbegrip en vertaling. De befaamde Le Chat begrijpt ook gewoon Nederlands, iets dat nog maar weinig gebruikers weten.
Toepassingen van Mistral AI-modellen
Alle modellen van Mistral AI zijn fundamentele modellen en kunnen worden aangepast voor een breed scala aan NLP-taken:
- Chatbots: Verbeterde interactie en begrip in natuurlijke taal.
- Tekstsamenvatting: Samenvatten van lange artikelen en documenten.
- Contentcreatie: Genereren van teksten zoals e-mails, sociale media-posts en verhalen.
- Tekstclassificatie: Sorteren van tekst, zoals spamdetectie in e-mails.
- Code-completering: Aanvullen en optimaliseren van code.
Modellen van Mistral AI
Mistral AI biedt zowel commerciële als open-source modellen aan:
Commerciële Modellen (alleen beschikbaar via API)
- Mistral Large 2: Het meest geavanceerde model, met een contextvenster van 128k tokens en ondersteuning voor 80+ programmeertalen.
- Mistral Large: Geoptimaliseerd voor complexe tekst- en codegeneratie, contextvenster van 32k tokens.
- Mistral Small: Gericht op snelle en efficiënte verwerking, ideaal voor bulkverwerking.
- Mistral Embed: Zet tekst om in numerieke representaties voor analyse en classificatie.
Open-Source Modellen (gratis beschikbaar onder Apache 2.0-licentie)
- Mistral 7B: Klein maar krachtig, presteert beter dan sommige grotere modellen.
- Mixtral 8x7B: Gebruiksvriendelijke MoE-architectuur voor efficiënte prestaties.
- Mixtral 8x22B: Grotere versie van 8x7B, ideaal voor complexe taken.
- Codestral Mamba: Gericht op codegeneratie met een contextvenster van 256k tokens.
- Mathstral: Gespecialiseerd in complexe wiskundige berekeningen.
- Mistral NeMo: Ondersteunt meerdere talen en heeft sterke redeneervaardigheden.
Le Chat: Mistrals AI-chatbot
Naast LLMs biedt Mistral AI Le Chat, een chatbot vergelijkbaar met ChatGPT, Gemini en Claude. Gebruikers kunnen kiezen welk model de chatbot gebruikt, afhankelijk van hun behoeften (bijvoorbeeld snelheid vs. nauwkeurigheid). Le Chat heeft echter geen real-time internettoegang en kan soms verouderde of bevooroordeelde antwoorden geven. Het platform is gratis toegankelijk op chat.mistral.ai/chat, met een betaalde versie in ontwikkeling.
Hoe Gebruik je Mistral AI?
Alle modellen van Mistral AI zijn beschikbaar op hun website en via platformen zoals Amazon Bedrock, Databricks, Snowflake Cortex en Azure AI. Gebruikers kunnen hun modellen direct inzetten via La Plateforme, Mistrals AI-ontwikkelomgeving. Hier kunnen gebruikers parameters instellen en modellen integreren in hun toepassingen. De kosten variëren afhankelijk van het model.
Mistral AI vs. GPT-4o: Wie is de Beste?
Mistral Large 2 is het model dat het dichtst in de buurt komt van GPT-4o. Hoewel GPT-4o betere prestaties levert op codegeneratie, overtreft Mistral Large 2 GPT-4o op function calling en biedt het een beter prijs-prestatieverhouding. Kostenvergelijking:
- GPT-4o: $5 per miljoen inputtokens, $15 per miljoen outputtokens.
- Mistral Large 2: $3 per miljoen inputtokens, $9 per miljoen outputtokens.
Hoewel OpenAI’s GPT-4o nog steeds als superieur wordt beschouwd, sluit Mistral AI de kloof snel en biedt het een kostenefficiënter alternatief. Met de groeiende concurrentie in de AI-markt zullen prestaties en prijzen blijven verbeteren.
Mistral AI is een veelbelovende speler in de AI-industrie, met een sterke focus op open-source en efficiënte modellen. Hun innovatieve aanpak, gecombineerd met betaalbare en krachtige AI-oplossingen, maakt hen een geduchte concurrent voor bedrijven als OpenAI en Google. Met voortdurende verbeteringen en nieuwe modellen op de horizon, zal Mistral AI een belangrijke rol spelen in de toekomst van generatieve AI.