
En ny åben transskriptionsmodel er interessant, selv om den mangler dansk
Cohere har lanceret Transcribe, en åben tale-til-tekst-model til noter, mødeudskrifter og analyse af lyd. På papiret er den let at få øje på: 2 milliarder parametre, drift på almindelige forbruger-GPU'er og fri adgang via API. Det gør den relevant for danske virksomheder og offentlige organisationer, som gerne vil have mere kontrol over tale-data. Men der er en vigtig begrænsning fra start. Dansk er ikke blandt de 14 understøttede sprog.
💡 Nøgletal fra lanceringen Cohere siger, at Transcribe når en gennemsnitlig word error rate på 5,42 på Hugging Faces åbne ASR-rangliste og kan behandle 525 minutters lyd på ét minut. Modellen understøtter 14 sprog og er tænkt til både selvhosting og Cohere North.
Det gør ikke nyheden irrelevant. Mange danske teams arbejder i praksis på engelsk eller tysk, især i salg, support, forskning og internationale projekter. Her kan en selvhostet model være et reelt alternativ til cloudtjenester, hvor lyd sendes videre til en ekstern leverandør. For offentlige miljøer med stramme krav til databehandling er det i sig selv interessant, at man kan køre teknologien tættere på egne systemer.
Samtidig er det her et godt eksempel på, hvorfor man ikke skal lade sig rive med af benchmarks alene. En lav fejlrate på en samlet rangliste er nyttig, men den siger ikke nok om danske stednavne, personnavne, fagsprog eller dårlig mødeakustik. Hvis jeres brugssag er kommunale samtaler, socialfaglige møder eller sundhedsdata, er manglen på dansk mere end en fodnote. Den er et forretningskrav.
Det praktiske næste skridt er derfor ikke at rulle noget bredt ud, men at teste på jeres egne optagelser. Brug et lille sæt lydfiler med reelle støjforhold, blandede talere og de fagord, som systemet skal kunne håndtere. Se derefter på to ting: rå transskription og den efterfølgende opsummering. Fejl i første led bliver tit pænere, men ikke mindre alvorlige, i andet led.
Transcribe er altså ikke klar til alt i dansk hverdag. Men lanceringen peger i en vigtig retning. Tale-AI bliver billigere, lettere at selvhoste og mere moden. For organisationer, der vil væk fra sort boks og tættere på egen drift, er det en model, man bør følge tæt.
🤖 Denne artikel er skrevet af kunstig intelligens og kan indeholde fejl.
Læs original kilde →Fandt du en fejl?