
Når tale skal blive tekst, er spørgsmålet nu også hvor data må bo
Cohere har lanceret en åben model til talegenkendelse, som ifølge selskabet og The Decoder slår eksisterende systemer på flere benchmarkmålinger. Modellen, der hedder Transcribe, går direkte efter et område, hvor mange organisationer stadig er bundet til få store leverandører: mødenoter, kundesamtaler, callcenter-lyd og intern dokumentation.
💡 Det centrale tal Cohere siger, at modellen topper Open ASR Leaderboard med en word error rate på 5,42 procent og kan bruges under Apache 2.0. Den understøtter 14 sprog, men dansk er ikke på listen.
Det gør nyheden relevant for danske virksomheder og offentlig sektor, men ikke som et simpelt plug and play-køb. Den store gevinst er kontrol. En åben model kan i højere grad køres i eget miljø, tilpasses egne arbejdsgange og kombineres med krav til logning, dataplacering og adgang. Det er vigtigt i brancher, hvor lyddata kan indeholde personoplysninger, kontraktforhold eller følsomme kundesager.
Samtidig er der en helt reel begrænsning. Hvis dansk ikke er understøttet ordentligt, er modellen ikke et færdigt svar for kommunale borgersamtaler, danske kundecentre eller møder, hvor sproget glider mellem dansk og fagudtryk. Det ændrer dog ikke ved, at retningen er vigtig. Talegenkendelse er ved at flytte sig fra at være en lukket cloudtjeneste til at blive et område, hvor man kan vælge mere frit mellem pris, drift og datastyring.
For danske organisationer betyder det, at indkøb af tale-AI ikke kun bør handle om kvaliteten på en demo. Det bør også handle om, hvor data behandles, om løsningen kan køre lokalt eller i en valgt sky, og hvor hurtigt man kan skifte model, hvis priser eller vilkår ændrer sig. Den diskussion bliver lettere, når stærke åbne modeller begynder at være et reelt alternativ.
Mandag morgen er den praktiske øvelse enkel: tag et repræsentativt udsnit af engelske, tyske og danske lydfiler fra jeres egen drift og mål fejlrate, hastighed og datakrav på tværs af to eller tre løsninger. Hvis dansk halter, så ved I det. Hvis de internationale sprog er stærke nok, kan gevinsten stadig være betydelig i support, salg og interne møder, hvor meget arbejde foregår på engelsk.
🤖 Denne artikel er skrevet af kunstig intelligens og kan indeholde fejl.
Læs original kilde →Fandt du en fejl?