Skip to content
AI Ordbog / Model Router (Modelrouter)

Model Router (Modelrouter)

En model router sender hver AI-forespørgsel til den rette model baseret på kompleksitet, pris og hastighed. Forstå hvordan det sparer 30-70% på AI-omkostninger.

Model Router (Modelrouter)
Frame 4
Frame 3
Frame 2
Frame 1
Frame 5
Model Router (Modelrouter)
AI ORDBOG

Hvordan virker en Model Router?

En model router opererer i tre faser: analyse, selektion og eksekvering. Når en forespørgsel ankommer, undersøger routeren flere signaler for at forstå opgavens karakter. Det kan være promptens længde og kompleksitet, det ønskede outputformat, brugerkontekst eller foruddefinerede regler. Hele denne analyse tager typisk under et millisekund.

I selektionsfasen matcher routeren opgaven med den bedst egnede model. Nogle routere anvender regelbaseret logik: "Hvis opgaven er simpel klassificering, brug Model A. Hvis den kræver nuanceret ræsonnement, brug Model B." Andre benytter en LLM eller et specialtrænet klassificeringsnetværk til at foretage valget intelligent. De mest avancerede routere kombinerer begge tilgange og lærer løbende af resultaterne.

Eksekvering betyder, at forespørgslen sendes til den valgte model, svaret returneres til brugeren, og routeren logger resultatet. Denne logning er afgørende: den giver data til at forbedre fremtidige routingbeslutninger og til at overvåge, om kvaliteten holder det aftalte niveau.

En vigtig distinktion er forskellen mellem en model router og en AI gateway. En gateway håndterer autentificering, failover og observability via et samlet API-lag. En router træffer den intelligente beslutning om, hvilken model der skal bruges. I praksis kombinerer de fleste moderne platforme begge funktioner i ét system.

Det er værd at bemærke, at model routing ikke kun handler om at vælge mellem forskellige udbydere (OpenAI, Anthropic, Google). Det handler i lige så høj grad om at vælge den rette modelstørrelse og -type inden for samme udbyder, fx at bruge en mindre model til rutineopgaver og reservere den største til de opgaver, der reelt kræver det.

Model Router i erhvervslivet

Virksomheder, der ruller AI ud bredt, opdager hurtigt, at omkostningerne løber op, når alle forespørgsler sendes til den samme kraftfulde model. Forskning viser, at organisationer, der bruger én LLM til alle opgaver, betaler 40-85% mere end nødvendigt. En model router løser dette ved at matche hver opgave med den billigste model, der leverer acceptabel kvalitet. Besparelserne ligger typisk på 30-70%, og i visse tilfælde op til 98% på specifikke workloads.

Kundesupport er et oplagt anvendelsesområde. En Conversational AI-løsning kan bruge en hurtig, billig model til at besvare standardspørgsmål om åbningstider eller ordrestatus, mens komplekse reklamationer eller tekniske forespørgsler automatisk eskaleres til en mere kapabel model. Brugeren oplever konsekvent kvalitet, og virksomheden betaler kun for den kapacitet, der reelt bruges.

Et andet voksende use case er agentic AI, hvor en AI-agent kæder flere modeller og handlinger sammen for at nå et mål. Her fungerer routeren som dirigent: den sikrer, at hvert deltrin i agentens arbejdsgang håndteres af den optimale model. Planlægningsfasen kan kræve en stærk reasoning-model, mens dataformateringen klares af en langt billigere model.

Interne vidensplatforme, rapporteringsværktøjer og AI-drevne marketingflows drager også fordel af routing. En virksomhed med en intern AI-assistent til HR, finans og jura har brug for forskellige modeller, der er finjusteret til hvert domæne. Routeren sørger for, at juridiske forespørgsler sendes til den juridisk specialiserede model, mens HR-spørgsmål går til en anden.

Endelig er model routing en forudsætning for robust drift. Hvis en models API er nede, kan routeren automatisk failover til en alternativ model. Det giver næsten uafbrudt oppetid, hvilket er afgørende for produktionssystemer.

Hvad en Model Router ikke er

En model router er ikke det samme som en load balancer. En load balancer fordeler trafik jævnt for at undgå overbelastning. En model router vælger intelligent baseret på opgavens indhold. Forvekslingen er forståelig, fordi begge sidder mellem brugeren og backend-systemet, men formålet er fundamentalt forskelligt: load balanceren optimerer kapacitet, routeren optimerer kvalitet og pris.

Model routing er heller ikke fine-tuning. Fine-tuning ændrer en models parametre for at forbedre dens adfærd. Routing vælger mellem eksisterende modeller uden at ændre nogen af dem. De to tilgange udelukker ikke hinanden: man kan finjustere domænespecifikke modeller og derefter bruge en router til at dirigere forespørgsler til den rette finjusterede model.

Det er også vigtigt at forstå, at en model router ikke automatisk løser kvalitetsproblemer. Hvis ingen af de tilgængelige modeller kan håndtere en bestemt opgave godt, vil routeren stadig vælge den bedste tilgængelige mulighed, men resultatet vil afspejle modellernes begrænsninger. Routing er et optimeringsværktøj, ikke en erstatning for gode modeller og prompt engineering.

Relaterede termer

AI Orchestrering: Den bredere disciplin at koordinere flere AI-komponenter, hvor model routing er en central byggesten.

Inference: Processen hvor en model genererer et svar. Routeren bestemmer, hvilken model der udfører inference for hver forespørgsel.

AI Gateway: Det tekniske lag, der håndterer API-adgang, autentificering og failover. Ofte kombineret med routing i samme platform.

LLM: De store sprogmodeller, som routeren vælger imellem.

AI FinOps: Disciplinen der styrer AI-omkostninger. Model routing er et af de mest effektive værktøjer i AI FinOps-praksis.

Agentic AI: AI-systemer der handler autonomt og ofte bruger model routing til at vælge den rette model til hvert deltrin.

Foundation Model: De basismodeller, som routeren dirigerer trafik imellem.