Vi er vokset 38%. Ikke på llms.txt.

Skrevet af Martin Mensbo Christiansen | 25-06-2026 07:30:00

For 8 uger siden lagde en dygtig dansk B2B-mand et opslag op, som rigtig mange nikkede til: gør en llms.txt-fil dig mere synlig i ChatGPT, Copilot og resten? Han havde testet det på flere sites, og konklusionen med hans egne ord var, at der ikke sker noget.

Jeg købte ikke præmissen. Ikke fordi han tager fejl, men fordi hele diskussionen kørte på fornemmelser og serverlogs, og ingen havde data på det, der faktisk betyder noget: optræder du i svarene, eller gør du ikke? Så vi byggede et apparat for at måle det, og her er hvad der rent faktisk flyttede tallet.

Først: kritikerne har ret

Det skal stå tydeligt, for det er fundamentet under resten. Som synlighedstrick gør en llms.txt ingenting, og det er ikke en mavefornemmelse, men målt. Ahrefs gennemgik 137.000 domæner: 97% af alle llms.txt-filer fik nul requests i maj 2026, og kun 28% af domænerne havde overhovedet filen.

OtterlyAI fulgte ét site i 90 dage. Ud af 62.100 bot-requests ramte 84 filen, altså 0,1%. SE Ranking kiggede på 300.000 domæner og fandt ingen sammenhæng mellem at have filen og at blive citeret i et AI-svar. Google selv siger det rent ud: i deres guide til generativ AI-søgning fra maj 2026 står der i et afsnit, de kalder mythbusting, at filer som llms.txt ikke er nødvendige for at dukke op i AI-søgning.

John Mueller fra Google har dog én undtagelse. En llms.txt kan hjælpe, når en agent allerede er inde på dit site og skal finde rundt eller gennemføre en opgave. Filen kan ikke få en LLM til at vælge dit site, men den kan være en slags butiksoversigt for nogen, der allerede er gået ind ad døren. Sælger nogen dig llms.txt som en vej til mere synlighed, har kritikerne fat i noget rigtigt: den vej findes ikke.

Hvorfor det stadig er den forkerte diskussion

Her stopper de fleste. Filen virker ikke, punktum, videre. Men læg mærke til, hvad hele debatten hviler på: serverlogs og holdninger. Ingen kunne svare på det egentlige spørgsmål, som ikke handler om en fil, men om en kanal: hvordan ser vi ud, når en kunde spørger en AI i stedet for at google?

Det er den sorte boks i AEO. Du kan ikke se, hvordan du optræder, svarene skifter fra gang til gang, og de fleste værktøjer giver dig ét tal, du ikke kan efterprøve. Vi ville ikke tro eller lade være med at tro. Vi ville måle.

Så vi byggede et system, der trækker vores egne data ud af de 4 største platforme: ChatGPT, Gemini, Perplexity og Claude. Og vi byggede det, så vi faktisk kan stole på tallene.

Vi spørger maskinerne, ikke skyggen

Den eneste måde at vide, hvordan du optræder i et AI-svar, er at stille spørgsmålet og læse svaret. Så det er præcis, hvad vi gør. Vi sender de samme spørgsmål til de 4 platforme gennem deres API'er og fanger det faktiske svar, ord for ord, inklusive de kilder svaret henviser til.

Backlinks og Google-placeringer kan antyde noget, men det er proxy-data. Det er skyggen, ikke kilden, og vi vil have kilden. Derfor henter vi svarene gennem platformenes egne API'er med websøgning slået til, så de er grounded i live søgning og ligner det, en bruger får.

Vi scraper ikke de skærme, man er logget ind på. Scraping brækker hele tiden og kan ikke gentages, og så er dine data ikke til at stole på i morgen. Der er en ærlig afvejning: vores svar er ikke 100% identiske med det, en enkelt bruger ser i appen, men til gengæld er de stabile, gentagelige og retningsvist korrekte.

Og vi har Claude med fra start. De fleste AEO-værktøjer tracker ChatGPT, Gemini og Perplexity og stopper der. Folk bruger Claude til at finde leverandører og træffe valg, så at lade den ude er en blind vinkel.

Den vigtigste beslutning: vi spørger mange gange

En AI giver ikke det samme svar hver gang. Stiller du det samme spørgsmål 5 gange, kan du blive nævnt de 3 gange og overset de 2. Et enkelt svar er en anekdote, ikke data.

Derfor spørger vi hvert spørgsmål 5 gange på hver platform, gemmer hvert af de 5 svar som sin egen måling og regner spredningen ud. Det er det, der gør forskellen på at optræde 7 ud af 10 gange og på tilfældig støj. Uden gentagne målinger aflæser du bare ét terningekast og kalder det en tendens.

Vi gemmer hvert svar råt i vores egen database, sammen med hvornår vi spurgte, hvilken platform og modelversion der svarede, og de kilder svaret henviste til. Det lyder kedeligt, men det er rygraden i at kunne stole på tallene. Når din synlighed falder, skal du kunne svare på, om du reelt er røget ned, eller om platformen bare har opdateret sin model. Uden tidsstempel og version er enhver ændring tvetydig.

Vi skelner også mellem at blive nævnt og at blive citeret. Det er to forskellige ting at blive omtalt i et svar og at få sit eget indhold brugt som kilde. Den interessante tilstand er, når du bliver nævnt, men ikke citeret: modellen kender dig, men trækker ikke på dit indhold. Og vi rapporterer intervaller, ikke falsk præcision: på et lille sæt siger vi 7 af 10 spørgsmål på ChatGPT, ikke 70% share of voice.

Hvorfor vi ikke bare købte et AEO-værktøj

Rimeligt spørgsmål, og vi er endda HubSpot-partnere. HubSpot har en AEO-funktion, Semrush har en, og der dukker nye op hver måned. Det korte svar er, at de fleste af dem giver dig præcis det, vi ville væk fra: et tal i et dashboard, du ikke selv kan regne efter fra bunden.

Værktøjerne er udmærkede til det, de er. HubSpot AEO sidder lige i CRM'et, tracker ChatGPT, Gemini og Perplexity og foreslår konkret content. Semrush dækker bredt, Claude med, og giver dig en visibility score og en share of voice. Lever du allerede i et af dem, er det et fint sted at starte. For os var der tre ting, de ikke løste rent teknisk.

Du ejer ikke de rå svar. Du får en score, en kurve, en procent, men selve svarene ligger i leverandørens system, og siger du abonnementet op, ryger historikken med. Flere af tallene er desuden modelleret, ikke målt. Semrush skriver det selv pænt ud: deres tal er sandsynlighedsbaserede og skal ikke tages for pålydende.

Og du kan ikke se under en black-box score. Falder din visibility 8 point, hvorfor så? Er du reelt røget ned, eller har platformen skiftet model under dig? Uden de rå svar med tidsstempel og modelversion kan værktøjet ikke svare. Vores kan.

Så er der en grund, der ikke er teknisk: det er vores fag. Vi bygger AI- og MCP-infrastruktur for danske virksomheder hver dag. At leje en black box per bruger giver ikke mening, når vi kan bygge apparatet, eje det og stille det til rådighed for kunderne. Det sjove er, at de dygtige folk er enige om principperne: Semrush anbefaler selv at læse tal som intervaller og bruge daglige målinger til at skille signal fra støj.

Det var her, de 23% kom fra

Så til tallet, og hvordan vi måler det. Vi har kørt AEO-målingen i 16 uger. 30 prompts, som vi holder for os selv, men det er den slags spørgsmål en kunde stiller en AI: hvem er bedst til en bestemt opgave, hvilke leverandører findes i Danmark, hvad skal man vælge mellem to navne.

Hver prompt er kørt 5 gange på alle 4 platforme, og hvert svar er gemt råt med tidsstempel og modelversion. De første 4 uger var baseline. For 12 uger siden lancerede vi vores markdown-system. Over de 12 uger er vores citation-rate på tværs af de 30 prompts og de 4 platforme i gennemsnit steget 23%.

Citation-rate er, hvor ofte modellerne bruger vores eget indhold som kilde, ikke bare nævner os. Det er den svære af de to. Og her er den ærlige del: ja, markdown-systemet kørte i hele de 12 uger, men det er ikke filen, der skabte tallet, og det vil vi ikke lade som om.

Husk SE Rankings 300.000 domæner: ingen sammenhæng mellem en llms.txt og at blive citeret. Vores citation-rate steg alligevel, fordi vi lavede arbejdet ved siden af. Indhold og struktur. Det eneste nye var, at vi nu kunne se det virke, fordi vi målte.

Det matcher præcist, hvad andre der har gravet i data finder. Search Engine Land fulgte 10 sites før og efter de fik en llms.txt, og de, der voksede, gjorde det fordi de byggede brugbare ting: skabeloner til download, sammenligningstabeller, indhold der er let at trække ud. Et af dem fejrede sin nye llms.txt, men tre uger forinden havde de udgivet 27 downloadbare skabeloner. Det var skabelonerne, ikke filen. Deres konklusion er den samme, vi nåede: llms.txt dokumenterede indsatsen, den drev den ikke.

Så hvorfor byggede vi alligevel en llms.txt?

Fordi vi ikke byggede den som et synlighedstrick. Vi byggede den til det, den oprindeligt blev opfundet til. Jeremy Howard, der foreslog formatet i september 2024, havde et konkret problem for øje: en AI's kontekstvindue er for lille til en hel hjemmeside, og at konvertere HTML med menuer, reklamer og JavaScript til ren tekst er besværligt og fejlbehæftet. Det handlede om at gøre indhold læsbart for en agent på inferenstidspunktet, ikke om ranking.

Det er også derfor, Anthropic, OpenAI og Perplexity alle har en llms.txt på deres udviklerdokumentation. Da Mintlify, der hoster dokumentation, slog llms.txt til for alle deres docs-sider i november 2024, fik tusindvis af docs en fil fra den ene dag til den anden, Anthropic og Cursor iblandt. Når en udvikler sidder i Claude Code og vil hente Anthropics API-dokumentation, er en llms.txt et fornuftigt format. Det er filens rigtige job.

Så vi gjorde det samme for consile.dk. Systemet kører på vores HubSpot CMS og laver, helt af sig selv, en ren markdown-udgave af hver eneste side og hvert blogindlæg. consile.dk/priser findes nu også som consile.dk/priser.md. En llms.txt binder det hele sammen som en indholdsfortegnelse over alt vores indhold, sorteret efter sider og blog.

Det vigtige er, at det kører dagligt og af sig selv. Systemet renser hver side for menuer, knapper, cookie-bannere og scripts, så kun budskabet står tilbage: overskrifter, brødtekst, pointer. Opdaterer marketing en side, følger den rene udgave med dagen efter. Slettede sider ryger også ud. Ingen skal kopiere, klippe eller huske noget.

Hvorfor gøre det, hvis det ikke flytter synligheden i dag? Fordi det er en asymmetrisk satsning: det koster os ingen løbende arbejdstid, det kan ikke skade, og det rammer præcis Muellers ene undtagelse, hvor en agent inde på sitet har en ren, struktureret udgave at læse. Standarderne for, hvordan agenter navigerer, er ikke faldet på plads endnu, og Mueller gætter selv på et halvt til et helt år. Falder de på plads, er vi klar, og skulle de aldrig gøre det, har vi spildt nul timer. Det er forskellen på at købe en præmis og at afdække en risiko.

Det vi faktisk lærte

Tre ting, konkret. En llms.txt er ikke en vækstknap. Sælger nogen den sådan, har de uret, og kritikerne i den tråd har ret i at kalde det ud. Det gør vi også.

De 23% kom fra indhold og struktur, vi kunne måle. Ikke fra en fil. Det er den samme historie, dataen fra andre fortæller, hver gang nogen kigger ordentligt efter.

Og det vigtigste: hold op med at skændes om filen ud fra serverlogs og holdninger. Mål din faktiske synlighed i svarmotorerne i stedet. Det var præcis det, ingen i den LinkedIn-tråd havde, et tal de kunne efterprøve. Vores rå svar ligger i vores egen database, og vi kan regne et hvilket som helst tal igennem på ny uden at spørge platformene en gang til.

Jeg købte ikke præmissen. Jeg byggede et apparat til at teste den. Det vil jeg anbefale alle at gøre, før de tror på det næste, nogen fortæller dem om AI-synlighed. Også når det kommer fra mig.

Se hele indlægget