Vector Database

AI ORDBOG

Hvordan virker en vector database?

En vector database fungerer ved at omdanne data til vektorer — numeriske repræsentationer i et flerdimensionelt rum — ved hjælp af en foundation model eller en dedikeret embeddings-model. Når en tekst, et billede eller et datapunkt sendes gennem modellen, producerer den en vektor med typisk 384 til 1.024 dimensioner, som fanger den semantiske betydning af inputtet.

Når en bruger stiller en forespørgsel, konverteres forespørgslen til en vektor på samme måde. Databasen sammenligner derefter denne vektor med alle lagrede vektorer ved hjælp af afstandsmetrikker som cosine similarity eller euklidisk afstand. De vektorer, der ligger tættest på forespørgslen i det matematiske rum, returneres som resultater — selv hvis de ikke deler et eneste nøgleord med forespørgslen.

For at håndtere millioner eller milliarder af vektorer effektivt bruger vector databases avancerede indekseringsteknikker som HNSW (Hierarchical Navigable Small Worlds) og IVF (Inverted File Index). Disse strukturer gør det muligt at udføre approximate nearest neighbor-søgninger (ANN), som finder de mest relevante resultater uden at gennemsøge hele datasættet.

Det afgørende er, at en vector database ikke bare er et indeks — den kombinerer vektorsøgning med metadata-filtrering, skalerbarhed, persistens og adgangskontrol. Det adskiller den fra et simpelt vektorindeks og gør den velegnet til produktionsmiljøer.

Vector databases i erhvervslivet

Den mest udbredte enterprise-anvendelse af vector databases er RAG. Her lagres virksomhedens dokumentation — politikker, manualer, kontrakter, produktbeskrivelser — som vektorer. Når en medarbejder eller kunde stiller et spørgsmål til en AI-løsning, søger systemet i vector databasen efter de mest relevante passager og sender dem som kontekst til en LLM, der genererer et præcist svar med reference til kilden.

Semantisk søgning er et andet højværdi-scenarie. I modsætning til traditionel nøgleordssøgning forstår en vektorbaseret søgning hensigten bag forespørgslen. En søgning på "hvordan håndterer vi kundeklager" finder relevante dokumenter, selv om de bruger ordene "reklamationsproces" eller "complaint handling". Det gør teknologien ideel til vidensbaser, juridiske dokumentarkiver og kundesupport.

Conversational AI og enterprise-chatbots er tæt knyttet til vector databases. Chatbots, der besvarer spørgsmål baseret på virksomhedens egne data, afhænger af hurtig og præcis vektorsøgning for at levere relevante svar i realtid.

Derudover bruges vector databases til anbefalingssystemer, anomalidetektion og svindelforebyggelse. I finanssektoren kan transaktionsmønstre repræsenteres som vektorer, og uregelmæssigheder opdages ved at identificere vektorer, der afviger markant fra normen. I e-commerce kan produkter og kundeadfærd matches semantisk for mere præcise anbefalinger.

Hvad en vector database ikke er

En vector database erstatter ikke en traditionel database. De to typer løser fundamentalt forskellige opgaver. En relationel database håndterer strukturerede data som kunderegistre, transaktioner og rapporter med ACID-compliance og SQL-forespørgsler. En vector database håndterer ustrukturerede data — tekst, billeder, lyd — og finder ligheder baseret på semantisk betydning. I de fleste produktionsmiljøer bruges begge side om side.

Det er også en misforståelse, at vector databases kræver dyb machine learning-ekspertise at implementere. Moderne platforme som Pinecone, Weaviate og Qdrant tilbyder brugervenlige API'er og færdige integrationer med populære embeddings-modeller. Opsætningen af en grundlæggende RAG-pipeline med en vector database kan være overraskende enkel.

Endelig er en vector database ikke det samme som et vektorindeks. Et indeks (som FAISS) er en søgestruktur uden datapersistens, skalerbarhed eller adgangskontrol. En vector database bygger oven på indeksering med alt det, der kræves i et produktionsmiljø: backup, filtrering, sikkerhed og håndtering af samtidige forespørgsler.

Relaterede termer

Embeddings: Numeriske vektorrepræsentationer af data, som vector databases lagrer og søger i. Embeddings er den grundlæggende dataenhed i en vector database.

RAG (Retrieval-Augmented Generation): Teknik der kombinerer vektorsøgning med tekstgenerering. Vector databases er den foretrukne lagringsløsning i RAG-arkitekturer.

Semantic Search: Søgemetode der forstår betydning frem for nøgleord. Vector databases er den underliggende teknologi bag semantisk søgning.

Chunking: Processen med at opdele dokumenter i mindre dele, der kan konverteres til vektorer og lagres i en vector database.

LLM (Large Language Model): Sprogmodeller der genererer tekst og ofte bruger vector databases som ekstern videnskilde via RAG.

GraphRAG: Avanceret variant af RAG der kombinerer vektorsøgning med knowledge graphs for mere kontekstrige svar.

Op mod 56 % af alle Google-søgninger ender i dag uden et eneste klik. For B2B-virksomheder, der har...

Forestil dig en fremtid, hvor dine kunder aldrig besøger din hjemmeside igen. Ikke fordi du har...

AI kan nu producere videoer af jeres CEO, der er umulige at skelne fra ægte optagelser. Spørgsmålet...

AI-implementering

Compliance og Governance

AI til Marketing og Salg

AI ROI Beregner

AI Nyheder

AI Ordbog

Vector Database

AI ORDBOG

Hvordan virker en vector database?

Vector databases i erhvervslivet

Hvad en vector database ikke er

Relaterede termer

B2B Demand Gen i en Zero-Click-verden

Hjemmesidens død: Når AI-agenter erstatter dit B2B-site

Deepfakes og tillid: Sådan beviser dit brand, at I er ægte