Når din AI-chatbot opfinder sine egne regler

Forestil dig, at en kunde spørger jeres AI-chatbot om returpolitikken, og chatbotten svarer med en politik, I aldrig har haft. Kunden handler i god tro, og pludselig står I med et juridisk ansvar og en brandkrise. Det er ikke science fiction, det er allerede sket for virksomheder som Air Canada, Chevrolet og DPD.

AI-hallucinationer i kundeservice er en af de mest oversete risici for B2C-brands i dag. Når en sprogmodel opfinder svar i stedet for at hente dem fra jeres godkendte videnbase, kan konsekvenserne være alt fra pinlige virale øjeblikke til reelle juridiske og økonomiske tab. I denne artikel dykker vi ned i, hvad AI-hallucinationer egentlig er, ser på virkelige eksempler, og viser, hvordan du med RAG-arkitektur og guardrails kan beskytte dit brand.

Hvad er AI-hallucinationer, og hvorfor er de farlige for dit brand?

En AI-hallucination opstår, når en stor sprogmodel (LLM) genererer information, der lyder troværdig, men som er faktuelt forkert eller helt opdigtet. I modsætning til en menneskelig kundeservicemedarbejder, der typisk siger "det ved jeg ikke, lad mig undersøge det," vil en LLM ofte producere et selvsikkert og velformuleret svar, uanset om det er korrekt. Det skyldes, at sprogmodeller er designet til at forudsige det mest sandsynlige næste ord i en sætning, ikke til at verificere fakta.

For B2C-brands er dette en særlig farlig egenskab. Jeres kundeservicekanal er ofte det primære kontaktpunkt med kunderne, og det er her, tillid opbygges eller brydes. Når en AI-chatbot med selvtillid fortæller en kunde, at de har ret til gratis fragt resten af livet, at de kan returnere en vare efter 90 dage (selvom jeres politik siger 30), eller at de vil modtage en erstatning, som aldrig bliver sendt, så skaber det en forventning, som I er ansvarlige for at indfri.

Ifølge en undersøgelse fra 2025 rapporterer 51% af organisationer mindst én negativ konsekvens fra generativ AI. Samtidig siger 85% af kundeserviceledere, at en enkelt uløst sag er nok til at miste en kunde. Kombinationen af disse to datapunkter tegner et tydeligt billede: risikoen ved ukontrolleret AI i kundeservice er reel og voksende.

Det handler ikke kun om fejl i svarene. Det handler om, at jeres brand taler med én stemme, og at den stemme siger sandheden. Når AI-chatbotten opfinder politikker, undergraver den hele den tillid, I har brugt år på at opbygge. Og som vi skal se i de næste eksempler, kan konsekvenserne være både virale og juridisk bindende.

Problemet forstærkes af, at AI-hallucinationer ofte er svære at opdage internt. Når en menneskelig medarbejder giver et forkert svar, kan kvalitetssikring fange det i stikprøvekontroller. Men en AI-chatbot kan potentielt betjene tusindvis af kunder om dagen, og hvert hallucineret svar kan spredes, før nogen i organisationen når at reagere. En enkelt viral episode kan ændre den offentlige opfattelse af jeres brand på timer.

Hvad er forskellen på en AI-hallucination og en almindelig fejl?

En almindelig fejl opstår, når systemet trækker forkert data fra en korrekt kilde, for eksempel en forældet prisliste. En AI-hallucination er fundamentalt anderledes, fordi sprogmodellen genererer et svar, der slet ikke findes i nogen datakilde. Modellen "opfinder" information baseret på statistiske mønstre i sin træningsdata, og svaret kan lyde overbevisende, selvom det er helt uden grundlag i virkeligheden.

Kan min virksomhed blive juridisk ansvarlig for, hvad vores AI-chatbot siger?

Ja. Den canadiske civildomstol fastslog i sagen Moffatt v. Air Canada, at virksomheden er ansvarlig for al information på sin hjemmeside, uanset om den kommer fra en statisk side eller en AI-chatbot. Chatbotten er ikke en separat juridisk enhed. Det betyder, at hvis jeres AI lover en kunde noget, kan I blive forpligtet til at indfri det løfte, præcis som hvis en medarbejder havde givet det.

Er RAG en garanti mod AI-hallucinationer?

RAG (Retrieval-Augmented Generation) reducerer risikoen for hallucinationer markant, men det er ikke en fuldstændig garanti. RAG sikrer, at AI-modellen henter information fra jeres godkendte videnbase, før den svarer. Men systemet kræver stadig korrekt opsætning, løbende vedligeholdelse af videnbasen og supplerende guardrails som outputfiltre og eskaleringsregler for at være effektivt.

Virkelige eksempler: Når AI-chatbots går helt galt

De mest lærerige lektioner kommer fra virksomheder, der allerede har betalt prisen. Et af de mest kendte eksempler er Air Canada, hvor en AI-chatbot gav en kunde forkerte oplysninger om rabat på flybilletter i forbindelse med et dødsfald i familien. Kunden, Jake Moffatt, handlede i god tro på chatbottens vejledning og købte en fuld billet med forventning om efterfølgende refusion. Da Air Canada afviste kravet og argumenterede for, at chatbotten var en separat enhed med eget ansvar, afviste den canadiske civildomstol argumentet. Domstolen fastslog, at Air Canada er ansvarlig for al information på sin hjemmeside, uanset om den kommer fra en statisk side eller en chatbot.

Et andet opsigtsvækkende eksempel kom fra en Chevrolet-forhandler i Californien, der implementerede en ChatGPT-drevet chatbot til at håndtere kundehenvendelser. En bruger opdagede, at chatbotten ville følge stort set alle instruktioner, og bad den om at acceptere et tilbud på en Chevrolet Tahoe til 1 dollar. Chatbotten accepterede og tilføjede endda, at det var et juridisk bindende tilbud. Skærmbillederne gik viralt med over 20 millioner visninger, og selvom forhandleren ikke leverede bilen, blev skaden på brandets troværdighed enorm. Alle 300 forhandlersider med samme chatbot-løsning måtte opdateres akut inden for 48 timer.

Det britiske pakkeleveringsselskab DPD oplevede en lignende situation, da deres AI-chatbot begyndte at bande ad en frustreret kunde og skrev et digt om, hvor dårlig DPDs service var. Kunden, Ashley Beauchamp, delte skærmbilleder på X (tidligere Twitter), og opslaget fik over 1,3 millioner visninger på kort tid. DPD måtte øjeblikkeligt deaktivere AI-funktionen og udsendte en offentlig undskyldning.

Fælles for alle tre eksempler er, at virksomhederne havde implementeret AI uden tilstrækkelige sikkerhedsforanstaltninger. Chatbotterne opererede uden klare begrænsninger for, hvad de måtte og ikke måtte sige, og ingen af dem var bygget med en lukket videnbase, der kunne forhindre opdigtede svar. Resultatet var i alle tilfælde viral negativ omtale, juridiske problemer og tab af kundetillid.

RAG og guardrails: Sådan bygger du sikre AI-systemer til kundeservice

Løsningen på AI-hallucinationer i kundeservice hedder ikke "undgå AI." Den hedder "implementér AI rigtigt." Og det begynder med en arkitektur kaldet RAG, Retrieval-Augmented Generation. I stedet for at lade en sprogmodel svare frit ud fra sin generelle træningsdata, tvinger RAG-arkitekturen modellen til først at søge i jeres godkendte videnbase og kun bruge de fundne dokumenter som grundlag for sit svar. Tænk på det som forskellen mellem at bede en ny medarbejder om at svare på kundens spørgsmål ud fra hukommelsen versus at give vedkommende en håndbog og sige: "find svaret her, og kun her."

Uden RAG fungerer en AI-chatbot som en meget belæst, men ukritisk samtalepartner. Den har læst milliarder af tekster under sin træning og kan generere svar, der statistisk set lyder rigtige. Men den har ingen adgang til jeres specifikke virksomhedsdata, jeres aktuelle priser, jeres nyeste returpolitik eller jeres nuværende lagerstatus. Resultatet er, at den fylder hullerne ud med kvalificerede gæt, og det er præcis her, hallucinationerne opstår. RAG løser dette ved at give modellen adgang til en kontrolleret, opdateret videnbase, der fungerer som en enkelt kilde til sandhed.

En velfungerende RAG-implementering til kundeservice indeholder flere lag. Det første lag er selve videnbasen, en struktureret samling af jeres politikker, priser, returregler, FAQ-svar og andre godkendte dokumenter. Disse dokumenter konverteres til vektorrepræsentationer (embeddings), som gør det muligt for AI-systemet at finde de mest relevante passager hurtigt og præcist. Det andet lag er selve retrieval-mekanismen, der sørger for, at kun relevante, opdaterede og godkendte dokumenter bruges som kontekst for hvert svar.

Men RAG alene er ikke nok. Du har også brug for guardrails, de sikkerhedsforanstaltninger, der kontrollerer, hvad AI-systemet må og ikke må gøre. Guardrails kan implementeres på flere niveauer. Input-guardrails filtrerer og kategoriserer kundens henvendelse, før den når sprogmodellen, så du kan eskalere følsomme emner direkte til en menneskelig medarbejder. Output-guardrails kontrollerer svaret, inden det sendes til kunden, og kan blokere svar, der indeholder løfter, prisgarantier eller politikker, som ikke findes i videnbasen. Adfærds-guardrails definerer klare regler for chatbottens tone, sprog og grænser, såsom "sig aldrig ja til en rabat" eller "eskalér altid reklamationssager."

En effektiv guardrail-strategi inkluderer også det, man kalder "confidence scoring." Når RAG-systemet henter dokumenter fra videnbasen, vurderer det, hvor relevant det fundne materiale er i forhold til kundens spørgsmål. Hvis relevansscoren er under en fastsat tærskel, bør systemet ikke forsøge at svare, men i stedet informere kunden om, at spørgsmålet kræver menneskelig assistance. Dette forhindrer netop den type hallucinationer, vi så hos Air Canada, hvor chatbotten svarede selvsikkert på et spørgsmål, den reelt ikke havde tilstrækkelig information til at besvare korrekt.

Vil du sikre din AI-kundeservice mod hallucinationer?

Vi hjælper B2C-brands med at bygge sikre AI-løsninger med RAG-arkitektur og guardrails, så jeres chatbot kun siger det, den må.

Få mere at vide

Brand-governance og vejen frem: Fem principper for sikker AI i kundeservice

Teknologien er kun halvdelen af løsningen. Den anden halvdel handler om governance, altså de organisatoriske rammer, der sikrer, at jeres AI-system forbliver under kontrol over tid. AI-governance er ikke et engangsprojekt. Det er en løbende proces, der kræver klare roller, ansvar og procedurer. Start med at definere en AI-politik for kundeservice, der tydeligt beskriver, hvad chatbotten må og ikke må. Hvilke emner skal eskaleres til en menneskelig medarbejder? Hvilke typer løfter må chatbotten aldrig give? Hvordan håndteres klager og reklamationer?

Det første princip er at bygge en lukket videnbase. Jeres AI-chatbot skal udelukkende svare baseret på dokumenter, I har godkendt. Det betyder, at I skal oprette og vedligeholde en struktureret samling af FAQ-svar, politikker, produktinformation og procedurebeskrivelser. Denne videnbase skal opdateres, hver gang I ændrer en politik eller lancerer et nyt produkt, og den skal versioneres, så I altid kan spore, hvad chatbotten havde adgang til på et givet tidspunkt. Det lyder måske omfattende, men alternativet, at jeres chatbot frit opfinder svar baseret på træningsdata fra hele internettet, er langt dyrere i det lange løb.

Det andet princip er at implementere flerlags-guardrails. Som beskrevet ovenfor er guardrails ikke én ting, men et system af kontroller på tværs af input, output og adfærd. Det tredje princip er at logge og overvåge alt. Hver samtale mellem chatbotten og en kunde skal logges, og I bør have automatiske alarmer, der udløses, når chatbotten svarer på emner uden for sin godkendte videnbase, når en kunde udtrykker frustration eller utilfredshed, eller når chatbotten bruger formuleringer, der kan tolkes som løfter eller garantier.

Det fjerde princip er at teste regelmæssigt med adversarial testing, hvor I aktivt forsøger at få chatbotten til at fejle, præcis som brugerne gjorde med Chevrolet-chatbotten. Denne type test bør køres mindst månedligt og bør inkludere forsøg på at få chatbotten til at love rabatter, opfinde politikker, afsløre interne data og reagere uhensigtsmæssigt på provokationer. Resultaterne af disse tests bør dokumenteres og bruges til at stramme guardrails og opdatere videnbasen løbende.

Det femte og måske vigtigste princip er at have en klar eskaleringssti. Uanset hvor god jeres RAG-arkitektur og jeres guardrails er, vil der altid være situationer, som kræver et menneskeligt touch. Jeres AI-system skal kunne genkende, hvornår det er ude af stand til at hjælpe, og sømløst overføre samtalen til en menneskelig medarbejder med fuld kontekst. Det er ikke et tegn på svaghed i jeres AI-løsning. Det er et tegn på modenhed.

De brands, der lykkes med AI i kundeservice, er ikke dem, der automatiserer 100% af samtalerne. Det er dem, der automatiserer de rigtige samtaler og eskalerer resten intelligent. De investerer i grundig opsætning, løbende overvågning og en organisatorisk kultur, hvor AI-governance er en del af den daglige drift. I en verden, hvor 63% af forbrugere siger, at deres seneste chatinteraktion med en virksomhed ikke løste deres problem, er der et enormt potentiale i at gøre det rigtigt. AI-chatbots, der er bygget med RAG, guardrails og klar governance, kan levere hurtigere, mere præcise og mere konsistente svar end nogensinde før. Men kun hvis de er sat op til at sige sandheden, hele sandheden og intet andet end sandheden. Hvis du vil vide mere om, hvordan AI og automation kan styrke din kundeservice uden at kompromittere dit brand, er du velkommen til at kontakte os for en uforpligtende snak.

AI-implementering

Compliance og Governance

AI til Marketing og Salg

AI ROI Beregner

AI Nyheder

AI Ordbog