
Microsoft vil eje mere af AI-stakken selv
Microsoft har lanceret tre nye MAI-modeller og sender dermed et ret klart signal: selskabet vil ikke kun være vært for andres AI. Det vil også levere egne modeller til tale, stemme og billeder. De nye modeller hedder MAI-Transcribe-1, MAI-Voice-1 og MAI-Image-2, og de er nu tilgængelige i Microsoft Foundry. Transcribe- og Voice-modellerne kan også prøves i MAI Playground.
💡 Nøgletal fra lanceringen
MAI-Transcribe-1 starter ved 0,36 dollar i timen. MAI-Voice-1 starter ved 22 dollar per 1 million tegn. MAI-Image-2 starter ved 5 dollar per 1 million input-tokens og 33 dollar per 1 million output-tokens til billeder.
Det mest interessante er ikke navnene. Det er retningen. Microsoft forsøger at bygge en mere komplet AI-stak, hvor kunder kan blive i samme økosystem fra infrastruktur og styring til modeller og produktintegration. Det giver mening for virksomheder, der allerede lever i Microsoft 365, Azure og Entra. Jo mere der kan samles samme sted, jo nemmere bliver det at styre adgang, compliance og økonomi.
Samtidig lægger Microsoft vægt på pris og fart. Ifølge selskabet transskriberer MAI-Transcribe-1 på tværs af 25 sprog og er 2,5 gange hurtigere end Azure Fast. På FLEURS-målingen siger Microsoft, at modellen ligger nummer ét i 11 kernesprog og slår Whisper-large-v3 i de resterende 14 blandt de 25 mest brugte sprog i Microsofts egne produkter. Den slags detaljer betyder noget for virksomheder, der arbejder med møder, support, callcenter og dokumentation.
💡 Hvad danske teams kan bruge det til
Tale til tekst, stemmegenerering og billedproduktion kan nu købes mere samlet. Det gør det lettere at bygge interne værktøjer uden at sprede data og styring over fem forskellige leverandører.
Det betyder ikke, at OpenAI pludselig er ude af billedet. Microsoft siger stadig, at partnerskabet består. Men når Microsoft både investerer milliarder i OpenAI og samtidig bygger egne modeller, er pointen enkel: man vil have en plan B og helst også en plan A, man selv kontrollerer.
For danske virksomheder og offentlig sektor er læringen lige til. Hvis man allerede bygger på Microsoft, er det nu tid til at teste, om nogle af de nye multimodale opgaver kan løses billigere og mere samlet dér. Ikke fordi én leverandør skal gøre alt, men fordi færre løse ender ofte giver mindre bøvl i drift.
🤖 Denne artikel er skrevet af kunstig intelligens og kan indeholde fejl.
Læs original kilde →Fandt du en fejl?