Anthropic er ikke længere blot et nichevalg for tidlige AI-brugere. Ny data fra den amerikanske...
Harness engineering er disciplinen bag pålidelige AI-agenter. Forstå hvad en agent harness er, hvorfor modellen ikke er nok, og hvordan det skaber værdi.


En agent harness fungerer som mellemlaget mellem AI-modellen og den virkelige verden. Når en agent modtager en opgave, er det harnessen, der styrer hele forløbet: hvilke værktøjer agenten har adgang til, hvilke handlinger der kræver godkendelse, hvordan fejl håndteres, og hvad der logges undervejs.
Konkret består en harness typisk af fem lag. Først er der tilladelsessystemet, som definerer præcis hvad agenten må og ikke må. Dernæst kommer kontekststyringen, der sørger for, at agenten har den rette information tilgængelig på det rette tidspunkt. Det tredje lag er feedback-loops, der giver agenten mulighed for at evaluere sine egne mellemresultater og justere kursen. Fjerde lag er observability, altså logging og monitorering, så mennesker kan følge med i agentens beslutninger. Femte lag er livscyklushåndtering: checkpoint, genstart og state management, der sikrer, at agenten kan genoptage arbejdet efter nedbrud.
Et konkret eksempel: OpenAIs Codex-team byggede en produktionsapplikation med over en million linjer kode, hvor ingen linjer blev skrevet manuelt. Ingeniørerne designede harnessen, der gav AI-agenten de rette begrænsninger, linters, tests og livscyklusstyring til at producere pålidelig kode via ca. 1.500 automatiserede pull requests.
Forskellen mellem en god og en dårlig harness kan måles direkte. Et kodningsagent-team gik fra Top 30 til Top 5 på Terminal Bench 2.0 udelukkende ved at ændre harnessen, ikke modellen.
For virksomheder, der vil gå fra AI-eksperimenter til produktion, er harness engineering den afgørende disciplin. Det er forskellen mellem en demo, der imponerer i et mødelokale, og et system, der kører pålideligt 24/7 med kunder og forretningskritiske data.
Softwareudvikling er det mest modne anvendelsesområde. Her styrer harnessen kodningsagenter, der skriver, tester og deployer kode inden for klart definerede rammer. Harnessen sikrer, at agenten overholder kodestandarder, ikke kører destruktive kommandoer, og at alle ændringer gennemgår automatiserede tests, før de når produktion.
Kundevendte AI-systemer er et andet voksende område. Virksomheder, der deployer conversational AI til kundeservice, bruger harness engineering til at definere, hvad agenten må svare på, hvornår den skal eskalere til et menneske, og hvordan den håndterer følsomme data. Guardrails i harnessen forebygger hallucinationer og sikrer compliance.
Multi-agent systemer er den mest avancerede anvendelse. Her fungerer harnessen som dispatcher i en hub-and-spoke model, hvor den koordinerer flere specialiserede agenter. I stedet for én agent, der forsøger at gøre alt, styrer harnessen flere multi-agent systemer, der hver håndterer deres domæne.
Fælles for alle anvendelser er, at harnessen giver virksomheden kontrol og tryghed. Den gør AI-agenter reviderbare, forudsigelige og sikre nok til at operere i regulerede miljøer som finans, sundhed og offentlig forvaltning.
Den mest udbredte misforståelse er, at harness engineering blot er prompt engineering med et nyt navn. Det er det ikke. Prompt engineering handler om, hvad du beder modellen om. Context engineering handler om, hvad du sender til modellen. Harness engineering handler om, hvordan hele systemet opererer: værktøjer, tilladelser, tilstand, tests, logs, retries, checkpoints og guardrails.
En anden misforståelse er, at bedre modeller fjerner behovet for harness engineering. Det modsatte er tilfældet. Jo mere kapable modellerne bliver, jo vigtigere bliver det at styre, hvad de må, og hvordan de fejler. Modellen er blevet en commodity. Claude, GPT-4, Gemini og open source-alternativer performer inden for et snævert bånd af hinanden. Det er systemet omkring modellen, der afgør succes.
Endelig skal harness engineering ikke forveksles med AI-frameworks som LangChain eller CrewAI. Et framework giver dig byggeklodserne til at designe en agents logik. Harnessen er driftsmiljøet, der faktisk styrer agentens eksekvering, tilstand og pålidelighed i produktion. Frameworket er tegningen, harnessen er fabrikken.
Agentic AI: AI-systemer, der kan handle autonomt for at nå et mål. Harness engineering er disciplinen, der gør agentic AI produktionsklar.
AI Agent: Den konkrete implementering af en autonom AI. En agent består af model + harness.
Guardrails: De sikkerhedsregler og begrænsninger, der er en central del af enhver agent harness.
Multi-agent System: Arkitekturer med flere koordinerede agenter, hvor harnessen fungerer som dispatcher.
Prompt Engineering: Disciplinen bag effektive instruktioner til AI-modeller. Komplementær til, men forskellig fra, harness engineering.
AI Governance: Politikker og tilsyn med AI-systemer. Harness engineering er den tekniske implementering af governance-principper.
AI Orchestrering: Koordinering af AI-komponenter. Orkestratoren er hjernen, harnessen er hænderne og infrastrukturen.
Anthropic er ikke længere blot et nichevalg for tidlige AI-brugere. Ny data fra den amerikanske...
OpenAI har samlet ChatGPT, kodningsagenten Codex og AI-browseren Atlas i en enkelt...
Meta lukkede i april 2026 døren til open source-æraen. Med lanceringen af Muse Spark den 8. april...