Fable 5-kraft til Opus-pris: Sådan skære du usage med 64% med uddelegering
Du kender det måske fra dit eget feed. Nogen åbner Claude med Fable 5, vender ryggen til i otte minutter, og så er hele det femtimers forbrugsvindue brugt op. De næste 4 timer er på pause, eller også tikker der credits ud af kortet i baggru…
Du kender det måske fra dit eget feed. Nogen åbner Claude med Fable 5, vender ryggen til i otte minutter, og så er hele det femtimers forbrugsvindue brugt op. De næste 4 timer er på pause, eller også tikker der credits ud af kortet i baggrunden.
Klagerne vælter frem, og vi forstår dem godt. Men i langt de fleste tilfælde er problemet ikke Fable 5. Det er måden, den bliver brugt på. I dette indlæg viser vi et udklip af den arkitektur, vi selv kører i Claude Code, hvor én model planlægger og en anden bygger. Den har skåret vores forbrug med 64 procent, og vi har stadig Fables kvalitet med, hvor det betyder noget. Til sidst kan du hente hele opsætningen som en færdig skabelon.
Derfor brænder Fable 5 dit forbrug
Tallene først, for de er ikke til diskussion.
Fable 5 bruger dobbelt så meget i forbrug som Opus 4.8 på et abonnement. Det er ikke noget, vi gætter mig til. Claude Code skriver det selv lige ved siden af modellen, når du vælger den, og på API'et koster den nøjagtig det dobbelte: 10 og 50 dollar pr. million tokens mod Opus' 5 og 25. Hver gang du sender en opgave til Fable, betaler du altså to gange, hvad den samme opgave ville koste på Opus.
Oven i den grundpris kommer måden, agenter arbejder på. Når Claude Code løser en opgave selvstændigt, læser den filer, kører kommandoer og kan sætte flere kald i gang på én gang. For hvert skridt vokser konteksten, og hele den voksende kontekst bliver sendt med igen ved næste skridt. Forbruget stiger derfor ikke pænt og lineært. Det løber. Sætter du den model, der i forvejen tæller dobbelt, til at gøre det hele, er det ikke mærkeligt, at vinduet er væk, før kaffen er kold.
Der er også en deadline lige nu.
Fable 5 er gratis oveni abonnementet frem til 22. juni 2026. Efter den dato trækker den på usage credits til fuld API-takst. Lige nu betaler du kun med dobbelt vægt mod dit vindue, men om kort tid betaler du med rigtige penge. Så spørgsmålet er ikke, om du skal være smart med Fable. Det er, hvor hurtigt.
Få vores skabelon lige her!
Og nej vi anmoder ikke om at du giver nogen email eller din første fødte.
Vi vil dog sætte stor pris på, hvis du vil følge med i vores nyhedsbrev.
Idéen: brug Fable dér, hvor den er dobbelt så meget værd
Her er den indsigt, hele opsætningen hviler på. Du betaler dobbelt for Fable, så Fable skal kun lave det arbejde, der faktisk er dobbelt så meget værd. Og det arbejde findes. Det er planlægningen.
Fable er stærk til at tænke bredt, gennemskue en kompliceret kodebase og lægge en plan, der holder. Det er præcis dér, en dårlig beslutning bliver dyr, fordi den forplanter sig i alt det, der bliver bygget bagefter. At bruge den bedste model til netop det skridt er ikke spild.
Det er en billig forsikring mod en dyr fejl.
Men når planen først ligger, ser resten anderledes ud. At skrive koden efter en god plan er mere håndværk end hovedbrud. Det kræver omhu og præcision, ikke nødvendigvis den dyreste model i markedet. Dér er Opus 4.8 mere end rigeligt, og den gør det til halvdelen af forbrugsvægten.
Så vi deler arbejdet i to roller, ligesom på et rigtigt team. En arkitekt, der tegner løsningen, og en bygmester, der fører den ud i livet. Arkitekten er Fable. Bygmesteren er Opus. Du beholder kvaliteten dér, hvor den er kritisk, og du holder op med at betale overpris for alt det andet.
Sådan er arkitekt-udfører-opsætningen bygget
I praksis er det to subagenter i Claude Code. De ligger som to små filer i mappen .claude/agents i dit projekt, og de gør hver især én ting godt.
Den første er arkitekten. Den kører på Fable og er bevidst sat til kun at læse. Den har ikke adgang til at ændre en eneste fil. Dens opgave er at undersøge problemet, finde den egentlige årsag i stedet for symptomet, veje et par løsninger op mod hinanden og aflevere en nummereret plan: hvilke filer der skal røres, hvad der skal ske i hver enkelt, og hvordan man bagefter tjekker, at det virker. Fordi den kun kan læse, kan den ikke nå at lave skade, mens den roder rundt i koden.
Den anden er udføreren. Den kører på Opus og tager arkitektens godkendte plan og fører den ud i livet i små, testbare trin. Den følger planen, den finder ikke selv på nye designvalg undervejs, og støder den på noget, planen ikke tog højde for, så stopper den og spørger i stedet for at gætte.
Imellem de to sidder du. Du ser planen, før der bliver skrevet en eneste linje kode, og du godkender den eller sender den retur. Det lyder som en lille ting, men det er hele pointen. Det er meget billigere at rette to sætninger i en plan end at rulle en halv times forkert kodning tilbage. En sidegevinst er, at hver subagent kører i sit eget kontekstvindue. Al den tunge research bliver inde i agenten, og kun det færdige resultat kommer tilbage til din hovedtråd, så den ikke vokser sig dyr undervejs.
For at binde det hele sammen ligger der en kort instruks i projektets CLAUDE.md, der siger, at ikke-trivielle opgaver altid skal planlægges af arkitekten først og bygges af udføreren bagefter. Der er også en genvej, så du kan sætte hele flowet i gang med én kommando. Du beskriver opgaven i daglig tale, og resten kører af sig selv: planlæg, godkend, byg.
Det ekstra lag, der gav de sidste 14 procent
Indtil her har vi flyttet udførelsen fra Fable til Opus. Det er det første og største spring. Men der var mere at hente, og det kom fra et ekstra lag oven på arkitekten.
Ikke alle opgaver er lige svære. En stor del af det daglige er rutine: omdøb noget, ret en åbenlys fejl, flyt en funktion fra én fil til en anden. Den slags kræver ikke dyb tænkning, hverken af arkitekten eller udføreren. Så vi lod arkitekten sortere opgaverne. Den vurderer, hvor svær en opgave egentlig er, og de lette stykker sender den direkte videre til Opus med lavere effort, altså med mindre tung tænkning slået til.
Effort er den indstilling i Claude Code, der bestemmer, hvor meget modellen tænker, før den svarer. Mere effort giver dybere ræsonnement, men koster også mere. Pointen er, at de fleste opgaver slet ikke har brug for det højeste niveau. Ved at lade arkitekten skrue effort ned på det enkle og kun op på det svære, rammer vi det rigtige niveau hver gang i stedet for at betale for maksimal tænkning på alt.
Hvorfor forbruget faktisk falder, og hvor det ikke gør
vi vil gerne være ærlig her, for det er nemt at sælge subagenter som en mirakelkur, og det er de ikke. Subagenter er ikke gratis. Bruger du dem i flæng, kan de sagtens trække mere forbrug, ikke mindre, og store opsætninger med mange parallelle agenter kan løbe op i et mangedobbelt forbrug af en helt almindelig session. Gevinsten kommer ikke af, at man bruger subagenter. Den kommer af, at man er bevidst om, hvilken model og hvilken effort hver opgave får.
Når vi lægger mine egne tal på bordet, kommer de 64 procent fra to lag. Det første lag er at flytte udførelsen fra Fable til Opus. Fordi Fable vejer dobbelt, giver det alene omkring 50 procent lavere forbrug i forhold til at køre alt på ren Fable 5. Det er ikke engang en optimering, det er bare at stoppe med at betale dobbelt for noget, der ikke kræver det.
Det andet lag er arkitektens triagering af effort, som vi beskrev ovenfor. Det har givet mig yderligere 14 procent oveni. Lagt sammen lander vi på 64 procent lavere forbrug end ren Fable, og det vigtigste for mig er, at kvaliteten på planlægningen er den samme, fordi det stadig er Fable, der lægger planerne.
Så hvis du forventer, at du bare kan tænde for et par agenter og se forbruget falde, bliver du skuffet. Faldet kommer, når du behandler din dyreste model som en specialist, du kun henter ind til det svære, og lader resten køre billigere.
Hent boilerplaten, og kom i gang
Du behøver ikke bygge det her fra bunden. vi har samlet hele opsætningen i en lille skabelon, du kan lægge direkte ind i dit eget projekt: de to agentfiler, genvejen til at starte flowet og den tekststump, der skal i din CLAUDE.md. Den er gjort helt projekt-uafhængig, så der er ikke noget af vores eget setup, du skal pille ud først.
Et par krav skal være på plads, før det spiller. Din version af Claude Code skal kende både Fable som model og effort-feltet. Hvis din editor afviser Fable som model, kører du en for gammel version, og en opdatering løser det. Du skal naturligvis også have adgang til både Fable og Opus på din konto.
Og har du slet ikke Fable, så lad være med at lade det stoppe dig. Sæt arkitekten til at køre på Opus eller en endnu billigere model i stedet. Du mister selve Fable-mod-Opus-besparelsen, men du beholder det vigtigste princip: planlæg med en god model, byg billigere, og betal kun topvægt for det arbejde, der faktisk kræver det. Det er dér, pengene ligger, uanset hvilke modeller du har til rådighed.
Fortsæt læsningen
Claude Fable 5 og Mythos 5: Anthropics stærkeste model til alle
Anthropic frigav i dag to nye modeller på én gang. Den ene kan du bruge med det samme. Den anden får kun en håndfuld cyberforsvarere adgang …
Microsoft Build 2026: AI-agenter rykker ud af skyen
Samme uge, som NVIDIA præsenterede sin nye PC-chip, holdt Microsoft sin Build-konference. De to keynotes lød næsten som ét stykke musik spil…
RTX Spark: AI-agenten flytter ned på din PC
Den 1. juni stillede Jensen Huang sig op på en scene i Taipei og sagde, at det er på tide at genopfinde PC'en. Den slags udmeldinger har vi …