Blog
Kontakt os

Hvad er RAG?

RAG, eller Retrieval-Augmented Generation, er en teknik, der giver en AI-sprogmodel adgang til ekstern viden, inden den svarer. I stedet for udelukkende at trække på det, modellen lærte under træning, henter RAG relevant information fra en vidensbase i realtid og bruger den som kontekst, når svaret genereres.

Resultatet er en AI, der kan svare præcist på spørgsmål om din virksomheds egne dokumenter, produkter, politikker eller processer, uden at du behøver at træne en ny model fra bunden.

Læsetid 2 minOpdateret marts 2026

Hvordan virker RAG i praksis?

Et RAG-system fungerer i tre trin, hver gang en bruger stiller et spørgsmål:

Hentning (Retrieval): Brugerens spørgsmål konverteres til en matematisk repræsentation (et embedding), som sammenlignes med alle dokumenter i en vector database. De mest relevante uddrag hentes frem.

Kontekstualisering (Augmentation): De hentede uddrag sendes sammen med brugerens spørgsmål til sprogmodellen som kontekst. Modellen ved nu, hvad der er relevant for det konkrete spørgsmål.

Generering (Generation): Modellen genererer et svar, der er forankret i de hentede data, ikke i tilfældig viden fra træningen.

Eksempel: En medarbejder spørger virksomhedens interne AI-assistent: 'Hvad er vores afskrivningspolitik for biler?' RAG-systemet finder det relevante afsnit i regnskabspolitikken, og modellen svarer præcist, selvom politikken er opdateret for tre måneder siden.

Consile er specialiseret i enterprise RAG-arkitektur og AI-agenter. Kontakt os for en uforpligtende snak om, hvad RAG kan gøre for jeres organisation.

Hvornår giver RAG mening?

RAG er den rigtige tilgang, når svaret afhænger af information, der ændrer sig over tid, som priser, politikker og produkter. Det giver også mening, når du vil begrænse AI-systemets svar til kun at omhandle din virksomheds data, når du har brug for sporbarhed (RAG kan vise, hvilke dokumenter svaret er baseret på), og når du vil reducere hallucinationer.

RAG er derimod typisk ikke den bedste løsning, hvis du vil ændre modellens stil, tone eller adfærd. Der er fine-tuning mere relevant.

Hvad RAG ikke er

RAG er ikke det samme som at give en AI adgang til internettet. RAG arbejder udelukkende med den vidensbase, du selv definerer og vedligeholder.

RAG er heller ikke det samme som fine-tuning. Hvor fine-tuning ændrer selve modellens viden permanent og er dyrt og tidskrævende, er RAG et dynamisk lag ovenpå modellen, der kan opdateres løbende uden at røre modellen.

RAG eliminerer heller ikke hallucinationer helt, men reducerer dem markant i de use cases, hvor systemet er designet til at svare på baggrund af kendte dokumenter.

Ofte stillede spørgsmål om RAG

Hvad er forskellen på RAG og fine-tuning?

Fine-tuning ændrer selve modellens viden permanent og kræver dataindsamling og træning. RAG er et dynamisk lag, der henter information i realtid uden at røre modellen. RAG er typisk hurtigere, billigere og lettere at opdatere.

Kan RAG bruges med hvilken som helst LLM?

Ja. RAG er et arkitekturmønster, ikke en specifik model. Det kan implementeres med OpenAI, Anthropic Claude, Azure OpenAI, open-source modeller som Mistral og mange andre.

Er RAG sikkert i forhold til GDPR?

RAG kan implementeres på en GDPR-compliant måde, forudsat at vidensbasen kun indeholder data, du har rettighed til at behandle, og at systemet er hostet i overensstemmelse med din databehandleraftale.

Hvad koster det at bygge et RAG-system?

En simpel RAG-prototype kan bygges på få uger. Et fuldt produktionssystem med sikkerhed, skalering og integration tager typisk 2 til 4 måneder. Consile hjælper gerne med en indledende vurdering.