Docling (AI-dokumentindtag)
Docling er et open-source dokumentindtagsværktøj udviklet af IBM Research, der konverterer komplekse dokumenter til struktureret data, som AI-systemer kan arbejde med. Hvor virksomheder tidligere brugte uger på manuelt at forberede dokumenter til AI-projekter, automatiserer Docling hele processen fra PDF, DOCX, PPTX og andre formater til et ensartet, maskinlæsbart output.
For virksomheder, der bygger RAG-løsninger eller vil bruge deres interne dokumentation i AI-systemer, er Docling det fundament, der gør dokumenter tilgængelige for modellerne. Uden pålidelig dokumentindtagning får selv den bedste sprogmodel upræcise eller ufuldstændige svar.
Docling er licenseret under MIT og kan bruges frit i kommercielle sammenhænge. Projektet har samlet over 37.000 GitHub-stjerner og er doneret til Linux Foundations Agentic AI Foundation, hvilket understreger dets position som industristandard for dokumentkonvertering.
Hvordan virker Docling?
Docling tager et dokument i næsten ethvert format og omdanner det til en struktureret repræsentation kaldet DoclingDocument. Processen foregår i flere trin: Først analyseres dokumentets layout for at identificere overskrifter, brødtekst, tabeller, figurer, kodeblokke og matematiske formler. Derefter bevares læserækkefølgen, så indholdet kommer ud i den rækkefølge, et menneske ville læse det.
For PDF-filer bruger Docling en kombination af layout-analyse (baseret på DocLayNet-modellen) og tabelgenkendelse (TableFormer). Scannede dokumenter håndteres via OCR med EasyOCR eller Tesseract. I februar 2026 lancerede IBM desuden Granite-Docling-258M, en vision-language model der kan forstå et helt dokument i ét enkelt inferenstrin.
Output fra Docling kan eksporteres som Markdown, JSON eller direkte ind i frameworks som LangChain og LlamaIndex. JSON-formatet bevarer metadata som sidetal og bounding boxes, hvilket er værdifuldt for grounding i enterprise-løsninger.
Docling understøtter også batchkonvertering, så virksomheder kan processere tusindvis af dokumenter i én kørsel. Det gør det muligt at opbygge store knowledge bases fra eksisterende dokumentsamlinger uden manuel indsats.
Consile hjælper virksomheder med at bygge dokumentindtags-pipelines, der gør jeres interne viden tilgængelig for AI. Kontakt os for en vurdering af, hvordan Docling passer ind i jeres AI-arkitektur.
Docling i erhvervslivet
Den mest udbredte anvendelse af Docling er som første led i en RAG-pipeline. Virksomheder konverterer deres interne dokumentation, kontrakter, politikker og manualer til struktureret data, som derefter chunkes og indekseres i en vector database. Når medarbejdere stiller spørgsmål til en AI-assistent, henter systemet de relevante dokumentstykker og genererer præcise svar med kildehenvisning.
Juridiske afdelinger bruger Docling til at processere kontrakter og compliance-dokumenter, så AI-systemer kan besvare spørgsmål om specifikke klausuler uden at juristen skal lede manuelt. Finanssektoren anvender det til at analysere årsrapporter, risk assessments og bankdokumentation i stor skala.
En anden væsentlig anvendelse er forberedelse af data til fine-tuning af AI-modeller. Når virksomheder vil tilpasse en sprogmodel til deres domæne, er kvaliteten af træningsdata afgørende. Docling sikrer, at dokumenter konverteres korrekt, herunder tabeller og strukturerede data, som ofte går tabt i simplere konverteringsværktøjer.
Red Hat har integreret Docling i RHEL AI, så enterprise-kunder kan indlæse deres private data direkte i InstructLab til syntetisk datagenerering og modeloptimering. Det viser, hvordan dokumentindtag er ved at blive en standardkomponent i enterprise AI-infrastruktur.
Hvad Docling ikke er
Docling er ikke en komplet AI-løsning i sig selv. Det er et dokumentforberedelses-værktøj, der forbereder data til brug i AI-systemer. Docling genererer ikke svar, analyserer ikke indhold semantisk og træffer ikke beslutninger. Det er det første trin i en pipeline, ikke det sidste.
Docling er heller ikke en erstatning for specialiserede IDP-platforme (Intelligent Document Processing) med avanceret formularudfyldning, håndskriftsgenkendelse eller workflow-automatisering. Doclings styrke er struktureret konvertering til AI-formål, ikke end-to-end dokumenthåndtering med forretningsregler og godkendelsesflow.
Det er også vigtigt at forstå, at Doclings output kun er så godt som inputdokumentets kvalitet. Dårligt scannede PDF-filer, dokumenter med komplekse overlappende layouts eller billeder med tekst i lav opløsning kan stadig give udfordringer, selvom OCR-funktionaliteten hjælper betydeligt.
Relaterede termer
Chunking opdeler dokumenter i meningsfulde bidder, så AI-systemer kan søge og svare præcist. Lær hvordan chunking styrker RAG og enterprise AI.
Embeddings omdanner tekst, billeder og data til vektorer, som AI kan forstå og sammenligne. Lær hvordan embeddings driver søgning, RAG og anbefalinger.
En data pipeline flytter, transformerer og leverer data til AI-systemer og analyser. Forstå opbygningen, forretningsværdien og de typiske faldgruber.
En knowledge base er virksomhedens strukturerede vidensarkiv, som AI-systemer bruger til at finde og levere præcise svar. Forstå opbygning og forretningsværdi.
Inference er det øjeblik, hvor en AI-model omsætter data til svar. Forstå hvorfor inference er den største omkostning i AI, og hvordan du optimerer den.
En retrieval pipeline er kernen i RAG-systemer. Lær hvordan data indekseres, hentes og bruges til at give AI præcise, kildebaserede svar i din virksomhed.
Ofte stillede spørgsmål om Docling
Er Docling gratis at bruge kommercielt?+
Ja. Docling er licenseret under MIT-licensen, som tillader fri kommerciel brug uden begrænsninger. Projektet er open source og vedligeholdes af IBM Research samt Linux Foundations Agentic AI Foundation.
Hvad er forskellen på Docling og LlamaParse?+
Docling er open source og kører lokalt, hvilket giver fuld kontrol over data. LlamaParse er en managed cloud-tjeneste med enterprise-features som SOC2-compliance og RBAC. For virksomheder med strenge datakrav er Docling ofte det foretrukne valg, mens LlamaParse er hurtigere at komme i gang med. Consile hjælper med at vælge den rette løsning til jeres setup.
Kan Docling håndtere scannede PDF-filer?+
Ja. Docling inkluderer OCR-funktionalitet via EasyOCR og Tesseract, og den nyere Granite-Docling model bruger en vision-language tilgang, der kan forstå scannede dokumenter direkte. Kvaliteten afhænger dog af scanningens opløsning.