Blog
Kontakt os

AI-infrastruktur (AI Infrastructure)

AI-infrastruktur er den samlede teknologiske fundament, der gør det muligt at træne, deploye og køre AI-modeller i produktion. Det dækker hardware (GPU'er, TPU'er, NPU'er), netværk (InfiniBand, RDMA), storage (objekt-storage, data lakes), software-platforme (MLOps, orkestrering, model serving) og de cloud- eller on-premise-miljøer, der binder det hele sammen. Uden den rette infrastruktur er selv den bedste AI-model blot en fil på en harddisk.

Forestil dig en dansk produktionsvirksomhed, der vil bruge computer vision til kvalitetskontrol på samlebåndet. Modellen kræver GPU-inferens med lav latenstid, en data pipeline der streamer billeder fra kameraer i realtid, et model registry der versionerer modellen, og et monitoring-lag der slår alarm, hvis nøjagtigheden falder. Alt dette er AI-infrastruktur. Det er forskellen mellem et proof of concept i en Jupyter Notebook og et system, der faktisk kører 24/7 i produktion.

For virksomheder i 2026 er AI-infrastruktur blevet en strategisk beslutning på C-level. Hyperscalerne planlægger at investere over 650 milliarder USD i AI-infrastruktur alene i 2026, og det globale marked er vurderet til 142,8 milliarder USD med en forventet vækst til 947 milliarder USD i 2035. Valget mellem cloud AI, on-premise AI eller en hybrid tilgang afgør ikke kun omkostninger, men også compliance, datasikkerhed og skalerbarhed.

Læsetid 8 minOpdateret maj 2026

Sådan er AI-infrastrukturen opbygget

1. Compute-laget: GPU'er, TPU'er og specialchips. Kernen i al AI-infrastruktur er accelereret compute. NVIDIA dominerer med en estimeret markedsandel på 78 % af AI-trænings-GPU-leverancer i 2026. Deres nuværende flagskib, Blackwell-arkitekturen (B200, GB200), afløser Hopper-generationen (H100, H200) og leverer op til 4x bedre inferensydelse pr. watt. Google har sine egne TPU'er, senest TPU v6e (Trillium), der er optimeret til Googles egne modeller. AMD konkurrerer med MI300X-serien, der tilbyder 192 GB HBM3-hukommelse pr. chip, hvilket gør dem attraktive til store modeller, der kræver meget VRAM.

2. Netværkslaget: InfiniBand og RDMA. Når du træner en foundation model på tværs af hundredvis af GPU'er, bliver netværket flaskehalsen. InfiniBand fra NVIDIA (tidl. Mellanox) leverer 400 Gb/s per port med ultra-lav latenstid. Det er standarden for distribueret træning. Alternativet er Ultra Ethernet Consortium (UEC), der arbejder på at gøre Ethernet konkurrencedygtigt til AI-workloads. For inferens, hvor kravene er lavere, er standard 100 GbE ofte tilstrækkeligt.

3. Storage og data infrastructure. AI-workloads kræver hurtig adgang til store datamængder. Objekt-storage (som AWS S3, Azure Blob, Google Cloud Storage) håndterer petabyte-skala datasæt. Til træning bruges ofte parallelle filsystemer som Lustre eller GPFS, der kan levere den throughput, GPU'erne kræver. Data lakes samler rå og processeret data, mens data pipelines (Apache Kafka, Apache Spark) håndterer indsamling, transformation og distribution.

4. MLOps-laget: Fra eksperiment til produktion. MLOps er disciplinen, der bringer machine learning fra notebook til drift. Det omfatter eksperimentsporing (MLflow, Weights & Biases), pipeline-orkestrering (Kubeflow, Apache Airflow), model registry (MLflow Model Registry, Vertex AI Model Registry), og automatisk retraining-workflows. Uden MLOps ender virksomheder med modeller, der fungerer i test, men aldrig når produktion.

5. Model serving og inferens. Når en model er trænet, skal den serveres med lav latenstid og høj throughput. Frameworks som NVIDIA Triton Inference Server, vLLM og TensorRT-LLM optimerer inferens. Containerisering med Docker og orkestrering med Kubernetes gør det muligt at skalere op og ned efter belastning. Serverless-inferens (som AWS Bedrock, Google Cloud Vertex AI) abstraherer infrastrukturen helt.

6. Observability og monitoring. I produktion er det afgørende at overvåge modellers ydelse over tid. Model drift (når data ændrer sig, og modellens præcision falder) opdages kun med systematisk monitoring. Værktøjer som Prometheus, Grafana, Arize AI og WhyLabs giver indsigt i latenstid, throughput, fejlrater og driftsignaler. Uden dette lag opdager virksomheder først problemer, når kunder klager.

7. Sikkerhed og governance. AI-infrastruktur kræver sikkerhed i hvert lag: kryptering af data at rest og in transit, adgangskontrol til modeller og datasæt, audit trails for compliance, og netværkssegmentering. AI governance er ikke blot et policy-dokument, det er konkret infrastruktur: model cards, datasheets, automatisk bias-detektion og regulatory reporting. Med EU AI Act, der træder fuldt i kraft 2. august 2026, er dette lag obligatorisk for enhver europæisk virksomhed.

Arkitektonisk sammenligning. Hyperscalerne (AWS, Azure, GCP) tilbyder fuldt integrerede stakke, hvor compute, storage, networking og MLOps er tæt koblet. Det giver bekvemmelighed, men også vendor lock-in. Specialiserede cloud-udbydere som CoreWeave og Lambda tilbyder ren GPU-compute med Kubernetes-native kontrol, hvilket giver mere fleksibilitet men kræver mere egent infrastruktur-kompetence. On-premise-løsninger fra NVIDIA (DGX SuperPOD) eller Dell giver fuld datakontrol, men kræver betydelig kapitalinvestering og driftskompetence.

Vi hjælper danske virksomheder med at vælge, opbygge og optimere AI-infrastruktur, fra den første GPU-instans til en fuld produktions-stak med MLOps, monitoring og EU-compliance. Kontakt os for en infrastruktur-vurdering, der matcher jeres use cases med den rette arkitektur.

Konkrete anvendelser i erhvervslivet

GPU-klynger til model-træning. Virksomheder der træner egne modeller, har brug for klynger af GPU'er forbundet med høj-båndbredde netværk. En typisk opsætning til fine-tuning af en 70B-parameter model kræver 8 H100 GPU'er i ca. 4-8 timer. Til pre-training af en frontier model kræves tusindvis af GPU'er over uger. For en dansk virksomhed, der fine-tuner en branchespecifik model, er cloud GPU-instanser den mest realistiske tilgang. Alternativet er en managed platform som Azure AI Foundry eller Google Vertex AI, der abstraherer klynge-management.

Inferens-infrastruktur til realtidsapplikationer. En dansk bank, der deployer en conversational AI-assistent til kundeservice, har brug for inferens med under 200 ms latenstid. Det kræver GPU-baserede inferens-servere placeret geografisk tæt på brugerne, load balancing, auto-scaling og failover. Managed services som AWS Bedrock eller Google Cloud Vertex AI håndterer dette, men koster typisk 2-3x mere end selvadministreret infrastruktur. For mange virksomheder er den ekstra omkostning det værd, fordi de slipper for ops-byrden.

Data pipelines til AI-drevne forretningsprocesser. En dansk e-commerce-virksomhed, der bruger churn prediction og next best action, har brug for data pipelines der samler kundedata fra CRM, website, email og support i realtid. Apache Kafka streamer events, dbt transformerer data, og en feature store (som Feast eller Tecton) serverer features til modellerne med lav latenstid. Denne infrastruktur er forudsætningen for, at AI-modeller kan handle på aktuelle data i stedet for forældede batch-kørsler.

Edge AI-infrastruktur til produktion og logistik. Virksomheder i produktion, logistik og detailhandel deployer i stigende grad AI direkte på enheder: kameraer med integrerede NPU'er, industrielle PC'er med NVIDIA Jetson-moduler, eller dedikerede edge-servere. Fordelen er lav latenstid (ingen round-trip til cloud), dataminimering (kun metadata sendes centralt) og drift uden netforbindelse. En dansk fødevareproducent kan køre kvalitetskontrol-modeller direkte på linjen uden at sende billeder til en ekstern cloud.

Sovereign og hybrid cloud til regulerede brancher. Finansielle institutioner, sundhedssektoren og offentlige myndigheder i Danmark og EU har specifikke krav til datalokalitet, GDPR-compliance og suverænitet. Det globale marked for sovereign cloud er estimeret til 195 milliarder USD i 2026, med Europa som den hurtigst voksende region. Løsninger som T-Systems Sovereign Cloud (baseret på Google Cloud-teknologi), OVHcloud og Scaleway tilbyder EU-baseret AI-infrastruktur uden eksponering mod amerikanske jurisdiktioner som CLOUD Act.

MLOps-platforme til modelstyring. Virksomheder med mere end 5-10 modeller i produktion har brug for systematisk modelstyring: versionering, A/B-testing, automatisk retraining, og performance monitoring. Platforme som Databricks (med Unity Catalog), AWS SageMaker, Google Vertex AI og open source-alternativer som MLflow + Kubeflow dækker dette behov. For en dansk virksomhed der starter sin AI-rejse, er en managed platform det mest pragmatiske valg. For organisationer med et dedikeret ML-team kan en modulær open source-stak give mere kontrol.

Udbydere og konkurrentlandskab

AWS (Amazon Web Services)
Den største cloud-udbyder med det bredeste udvalg af AI-tjenester. EC2 P5-instanser med H100 GPU'er koster ca. 3,90 USD pr. GPU pr. time on-demand. Styrker: modent økosystem med SageMaker (MLOps), Bedrock (managed inferens), Trainium-chips (egne AI-acceleratorer) og dyb integration med resten af AWS. Svaghed: priser er steget ca. 15 % på reserverede GPU-instanser i tidligt 2026, og vendor lock-in er betydelig.

Microsoft Azure
Tæt integreret med OpenAI-modeller via Azure OpenAI Service. NC H100 v5-instanser koster ca. 6,98 USD pr. GPU pr. time on-demand i US East, hvilket gør Azure til den dyreste hyperscaler for ren GPU-compute. Styrker: enterprise-integration med Microsoft 365, Dynamics, og GitHub Copilot. Azure AI Foundry samler model management, fine-tuning og deployment. Svaghed: højere pris pr. GPU-time og mere kompleks prissætning end konkurrenterne.

Google Cloud Platform (GCP)
Tilbyder både NVIDIA GPU'er og egne TPU'er. A3-high-instanser med H100 koster ca. 3,00 USD pr. GPU on-demand, og spot-instanser kan fås for ca. 2,25 USD (60-91 % rabat). Styrker: TPU'er er unikke for storskala-træning, Vertex AI er en komplet MLOps-platform, og BigQuery integrerer data analytics med ML. Svaghed: TPU-økosystemet kræver tilpasning af kode (JAX/XLA), og GPU-udvalget har historisk været mindre end AWS.

CoreWeave
Specialiseret AI-cloud-udbyder der voksede eksplosivt i 2025-2026. NVIDIA investerede 2 milliarder USD i CoreWeave i januar 2026, og Meta indgik en aftale om ca. 21 milliarder USD i AI-cloudkapacitet frem til 2032. Styrker: Kubernetes-native platform, InfiniBand-networking som standard, og priser der typisk er 30-50 % lavere end hyperscalerne for ren GPU-compute. Svaghed: mangler det brede servicekatalog (databaser, analytics, serverless) som hyperscalerne tilbyder.

Lambda
AI-cloud fokuseret på developer experience. Tilbyder H100 og B200 instanser med InfiniBand. Lambda Cloud er designet til hurtig onboarding: du kan gå fra nul til træning med minimal konfiguration. Priser er konkurrencedygtige med CoreWeave. Styrker: simpel UX, stærk dokumentation, on-demand B200-adgang. Svaghed: mindre skala end CoreWeave, færre regioner.

NVIDIA (hardware og software)
Kontrollerer hele stakken fra chip til software. Med CUDA-økosystemet, Triton Inference Server, NIM (NVIDIA Inference Microservices) og DGX-platforme er NVIDIA den de facto standard. Blackwell-arkitekturen (B200, GB200 NVL72) leverer markant bedre pris-ydelse end Hopper. Svaghed: dominansen skaber afhængighed, og priserne forbliver høje pga. vedvarende forsyningsknaphed, som analytikere forventer fortsætter ind i 2027.

Hvor AI-infrastruktur er kompleks. Der er ingen enkelt udbyder, der er bedst til alt. Hyperscalerne vinder på bredde og compliance-certificeringer. De er det sikre valg for regulerede brancher. CoreWeave og Lambda vinder på pris og ren GPU-ydelse til træning. NVIDIA kontrollerer hardware-laget uanset hvilken cloud du vælger. For danske virksomheder er det realistiske valg ofte en hybrid: managed services fra en hyperscaler til inferens og MLOps, suppleret med specialiseret GPU-cloud til træning, og on-premise-kapacitet til de mest følsomme workloads.

Ofte stillede spørgsmål om AI-infrastruktur

Hvad koster det at komme i gang med AI-infrastruktur?

Det afhænger af use case. En simpel inferens-workload med en managed service som AWS Bedrock eller Azure OpenAI Service kan starte fra få hundrede dollars om måneden. Fine-tuning af en model kræver typisk 8 GPU'er i 4-8 timer, hvilket koster 144-335 USD pr. kørsel. Pre-training af egne modeller koster fra hundredtusinder til millioner af dollars. For de fleste danske virksomheder er managed cloud-services det mest realistiske udgangspunkt.

Skal vi bruge cloud eller on-premise til AI?

For de fleste virksomheder er cloud det rigtige valg, fordi det kræver minimal forhåndsinvestering og skalerer efter behov. On-premise giver mening, hvis du har konstant høj GPU-udnyttelse (over 60-70 %), strenge datalokalitetskrav, eller allerede har datacenter-kompetencer. Mange ender med en hybrid tilgang: cloud til eksperimenter og burst-kapacitet, on-premise eller sovereign cloud til følsomme produktions-workloads.

Hvad betyder EU AI Act for vores AI-infrastruktur?

Fra 2. august 2026 stiller EU AI Act konkrete krav til infrastrukturen bag højrisiko AI-systemer. Du skal kunne logge alle model-beslutninger, versionere modeller og datasæt, generere teknisk dokumentation, og sikre human oversight. Det betyder, at din infrastruktur skal inkludere audit trails, model registry, data lineage-tracking og monitoring. Overtrædelser kan medføre bøder op til 35 millioner EUR eller 7 % af global omsætning.

Hvad er forskellen på GPU, TPU og NPU?

GPU'er (Graphics Processing Units) er de mest udbredte AI-acceleratorer, domineret af NVIDIA. De er generelle og understøtter alle frameworks. TPU'er (Tensor Processing Units) er Googles proprietære chips, optimeret til TensorFlow og JAX. De er typisk hurtigere og billigere til Googles egne workloads, men kræver kodetilpasning. NPU'er (Neural Processing Units) er energieffektive chips designet til edge-inferens i telefoner, PC'er og IoT-enheder, ikke til træning.

Hvordan undgår vi vendor lock-in?

Brug containere (Docker) og Kubernetes som abstraktionslag, så dine workloads kan flyttes mellem udbydere. Vælg open source MLOps-værktøjer (MLflow, Kubeflow) frem for proprietære platforme hvor muligt. Standardiser på ONNX-formatet til modeleksport, så modeller ikke er bundet til et enkelt framework. Planlæg en multi-cloud-strategi fra starten, selvom du starter med én udbyder.

Er der danske alternativer til de store cloud-udbydere?

Danmark har ikke en hyperscaler, men der er europæiske alternativer. T-Systems (Sovereign Cloud baseret på Google-teknologi), OVHcloud og Scaleway tilbyder EU-baseret AI-infrastruktur. Derudover eksperimenterer det danske Digitaliseringsministerium med open source-alternativer. For GPU-compute kan danske virksomheder også bruge specialiserede udbydere som CoreWeave og Lambda, der har europæiske regioner. Den mest realistiske tilgang for danske SMV'er er en managed service fra en hyperscaler med data residency i EU.

Hvor starter vi, hvis vi ingen AI-infrastruktur har i dag?

Start med en managed cloud-platform: AWS SageMaker, Google Vertex AI eller Azure AI Foundry. Disse platforme håndterer compute, MLOps og model serving, så dit team kan fokusere på modeller og data i stedet for infrastruktur. Brug en proof of concept-tilgang med et enkelt use case, og skalér infrastrukturen, når værdien er dokumenteret. Consile hjælper danske virksomheder med at vælge den rette platform og arkitektur baseret på deres specifikke behov.