Op de Build-ontwikkelaarsconferentie van 2026 kondigde Microsoft een aanzienlijke uitbreiding aan van zijn zelfontwikkelde MAI-modelfamilie, gemaakt door het Microsoft AI Superintelligence-team, met de lancering van het eerste algemene inferentiemodel MAI-Thinking-1, een codemodel MAI-Code-1 voor GitHub Copilot en meerdere bijgewerkte versies van spraak-, transcriptie- en beeldgeneratiemodellen om het end-to-end AI-technologielandschap verder te verbeteren. Dit markeert de versnelde expansie van Microsoft op het gebied van basismodellen van spraak en beeld tot complexe redeneer- en productiviteitsscenario's voor ontwikkelaars.

Microsoft zei dat de MAI-modelfamilie het afgelopen jaar is blijven uitbreiden en eerder dit jaar MAI-Voice-1, MAI-1-preview en MAI-Transcribe-1 en MAI-Image-2 heeft uitgebracht, en vervolgens MAI-Image-2.5 heeft gelanceerd, dat de kwaliteit van tekstweergave, gestileerde illustraties en commerciële afbeeldingen heeft verbeterd. Deze keer worden op deze basis nieuwe redeneer- en codeermodellen toegevoegd en worden de productlijnen voor spraak, transcriptie en beeld tegelijkertijd geüpgraded om een completer productportfolio te vormen.
MAI-Thinking-1 is het eerste inferentiemodel dat officieel door Microsoft is aangekondigd. Het is helemaal opnieuw getraind door het Microsoft AI-team en is niet gedestilleerd uit andere modellen. Microsoft benadrukte dat het model is getraind met behulp van schone, commercieel gelicentieerde gegevens op bedrijfsniveau en is ontworpen om te voldoen aan de vereisten van zakelijke gebruikers op het gebied van gegevenscompliance en commercialiseerbaarheid. MAI-Thinking-1 is een middelgroot model met 35 miljard activeringsparameters en ondersteunt 128K contextvensters. Het is vooral gericht op scenario's zoals het uitvoeren van complexe meerstapsinstructies, redeneren in lange contexten en het genereren van code.
Hoewel Microsoft geen gedetailleerde benchmarkgegevens openbaar maakte in de aankondiging, citeerde het onafhankelijke beoordelingsresultaten op zijn blog en zei dat bij de blinde test de algemene voorkeur van de recensenten meer uitging naar MAI-Thinking-1 dan naar Claude Sonnet 4.6 van Anthropic. Bovendien verklaarde Microsoft ook dat MAI-Thinking-1 in de SWE-bench Pro-codetaaktest qua codeerprestaties vergelijkbaar was met Claude Opus 4.6, wat het potentieel van dit model voor ontwikkelaars en complexe technische taken aantoont. MAI-Thinking-1 is momenteel in privé preview voor geselecteerde klanten via Microsoft Foundry.
Wat het genereren van afbeeldingen betreft, zijn Microsoft's eerder uitgebrachte MAI-Image-2.5 en zijn "flash-variant" via Microsoft Foundry opengesteld voor ontwikkelaars. Volgens Arena's laatste artikellijstgegevens, geciteerd door Microsoft, heeft MAI-Image-2.5 Google's Nano Banana Pro overtroffen in de taak om tekstafbeeldingen te genereren en kwam het in de top drie van de lijst terecht. Dit model is geïntegreerd in PowerPoint en wordt geleidelijk uitgerold naar OneDrive, waardoor mogelijkheden voor het genereren van afbeeldingen van hogere kwaliteit voor het Office-ecosysteem worden geboden.
Op het gebied van spraaktranscriptie heeft Microsoft in april van dit jaar MAI-Transcribe-1 uitgebracht, dat spraak-naar-tekst-transcriptie ondersteunt in de 25 meest gebruikte talen op basis van de eigen productgebruiksgegevens. Deze keer lanceerde Microsoft de geüpgradede versie MAI-Transcribe-1.5, die het toonaangevende niveau in de nauwkeurigheid van spraakherkenning heeft bereikt en het aantal gedekte talen heeft uitgebreid tot 43. Het is van plan binnenkort streaming-transcriptiemogelijkheden aan het model toe te voegen om aan de behoeften van realtime scenario's te voldoen.
Op het gebied van spraaksynthese heeft Microsoft, na de aankondiging dat MAI-Voice-1 in april van dit jaar algemeen beschikbaar was, deze keer MAI-Voice-2 en de bliksemversie uitgebracht. Het spraakgeneratiemodel van de nieuwe generatie ondersteunt meer dan 15 extra talen en biedt meer stemstijlopties om aan te passen aan rijkere toepassingsscenario's, zoals meertalige klantenservice, nasynchronisatie van inhoud en slimme assistenten.
Voor de codeerscenario's van ontwikkelaars lanceerde Microsoft tegelijkertijd MAI-Code-1, een efficiënt inferentiecodemodel dat is geoptimaliseerd voor GitHub-workloads. Dit model is gelanceerd in GitHub Copilot en Visual Studio Code en biedt ondersteuning voor dagelijkse codering, refactoring, code-voltooiing en andere scenario's. Hoewel Microsoft de specifieke benchmarkresultaten van MAI-Code-1 niet openbaar heeft gemaakt, wordt deze release gezien als een belangrijk signaal: Microsoft vertrouwt voor het onderliggende model van GitHub Copilot niet meer volledig op OpenAI en Anthropic, maar introduceert geleidelijk aan zelfontwikkelde modellen.
Wat de distributiekanalen betreft, heeft Microsoft, naast het leveren van diensten aan bedrijven en ontwikkelaars via Microsoft Foundry, ook aangekondigd dat zijn modellen uit de MAI-serie zullen worden gelanceerd op platforms van derden, zoals Fireworks AI, Baseten en OpenRouter. Tegelijkertijd is Fireworks AI ook algemeen beschikbaar gemaakt binnen Microsoft Foundry, waardoor zakelijke klanten meer architectuur- en implementatieopties krijgen. Door met meerdere platforms samen te werken hoopt Microsoft de toegangsdrempel verder te verlagen en de implementatie van MAI-modellen in verschillende cloud- en tool-ecosystemen te versnellen.
Vanuit de algemene lay-out bouwt Microsoft een complete AI-capaciteitsmatrix op ondernemingsniveau met behulp van meerdere soorten modellen, zoals MAI-redenering, codering, spraak, transcriptie en afbeeldingen. Met de toevoeging van MAI-Thinking-1 en MAI-Code-1 is de stem van Microsoft op het gebied van complex redeneren en de productiviteit van ontwikkelaars aanzienlijk verbeterd, en heeft het ook een meer competitieve technische basis geboden voor GitHub Copilot, Office-series en samenwerkingsplatforms.