Drie nieuwe AI-modellen voor Microsoft (genereren van realistische stemmen en het maken van afbeeldingen)

Microsoft heeft drie nieuwe AI-modellen gelanceerd die volledig intern zijn ontwikkeld. Hiermee zet het bedrijf een belangrijke stap om minder afhankelijk te worden van externe partners en meer controle te krijgen over zijn eigen technologie. De nieuwe modellen richten zich op drie gebieden: spraak-naar-tekst, het genereren van realistische stemmen en het maken van afbeeldingen. Deze functies zijn vooral bedoeld voor zakelijk gebruik, waar automatisering en efficiëntie een grote rol spelen:
MAI-Transcribe-1 delivers state-of-the-art speech-to-text transcription across the top 25 most-used languages according to the industry-standard FLEURS benchmark. Built to deliver world class quality in messy, real-world environments, its batch transcription speed is 2.5x that of existing Microsoft Azure Fast offering. It’s also incredibly efficient, making MAI-Transcribe-1 not just the most accurate, but also lightning fast. It’s now available in Foundry at the best price-performance of any large cloud provider.
Strategische stap in de AI-race
Met deze ontwikkeling laat Microsoft zien dat het niet alleen AI wil integreren in bestaande producten, maar ook zelf geavanceerde modellen wil bouwen. Dit past in een bredere strategie om een grotere rol te spelen binnen de AI-sector.
MAI-Image-2 has turbocharged image generation performance and speed on Copilot after debuting as a top 3 model family on the Arena.ai leaderboard. Users experience at least 2x faster generation times on Foundry and Copilot with similar quality, based on real-world production traffic data. Phased rollouts are also underway in Bing and PowerPoint.
Concurrentie met grote spelers
Door eigen modellen te ontwikkelen, positioneert Microsoft zich sterker tegenover andere technologiebedrijven zoals OpenAI en Google. Het bedrijf wil zich daarmee profileren als een volwaardige concurrent in de snel groeiende AI-markt.
MAI-Image-2 was created with photographers, designers, and visual storytellers that demand natural lighting, accurate skin tones and texture, and clear in-image text for diagrams, layouts, and graphics. Once again, speed and quality don’t come at higher costs – MAI-Image-2 is offered at competitive price-to-performance.
