Skip to content
AI Ordbog / Gemini (Google)

Gemini (Google)

Gemini er Googles AI-modelfamilie med multimodale evner og dyb integration i Google Workspace. Forstå hvad Gemini kan, og hvad det betyder for din virksomhed.

Gemini (Google)
Frame 4
Frame 3
Frame 2
Frame 1
Frame 5
Gemini (Google)
AI ORDBOG

Hvordan virker Gemini?

Gemini er bygget som en nativt multimodal model. Det betyder, at den ikke behandler tekst, billeder og lyd som separate inputs, der oversættes til ét format. I stedet forstår modellen alle modaliteter direkte i samme arkitektur. Du kan stille et spørgsmål med en blanding af tekst, et billede og en lydfil, og Gemini behandler det hele i kontekst.

Modelfamilien er opdelt i tiers baseret på kapacitet og hastighed. Gemini Pro er den mest kapable og egner sig til komplekse opgaver som analyse, kodning og research. Gemini Flash er optimeret til hastighed og lavere omkostninger, mens Flash-Lite er den letteste variant til simple, høj-volumen opgaver. Derudover har Google introduceret Deep Think, en reasoning-tilstand der kan tænke længere og generere parallelle tankegange til særligt krævende problemer.

Et afgørende kendetegn er Geminis kontekstvindue. Gemini understøtter op til 1 million tokens i konteksten, hvilket er markant mere end de fleste konkurrenter. Det gør det muligt at analysere store dokumenter, lange kodebiblioteker eller omfattende datasæt i én forespørgsel uden at miste sammenhæng.

Gemini tilgås enten via Googles forbrugerapp (gemini.google.com), via API gennem Gemini Enterprise Agent Platform (tidligere Vertex AI), eller direkte i Google Workspace-applikationer som Gmail, Docs og Sheets.

Gemini i erhvervslivet

For virksomheder er Geminis største fordel den native integration med Google Workspace. Medarbejdere kan bruge AI direkte i Gmail til at opsummere tråde, i Docs til at generere udkast, i Sheets til at analysere data, og i Meet til at få mødereferater. Ingen separat platform, ingen kontekstskift. Det reducerer adoptionsbarrieren sammenlignet med standalone AI-værktøjer.

Google har lanceret Gemini Enterprise Agent Platform som en samlet platform til at bygge, skalere og styre AI-agenter i virksomheder. Platformen understøtter langvarige AI-agenter, der kan arbejde selvstændigt i op til flere dage på komplekse opgaver. Virksomheder som Comcast har brugt platformen til at bygge intelligente kundeserviceassistenter, der erstatter scriptbaseret automation med conversational AI.

Gemini Enterprise kan desuden forbindes sikkert til Google Drive, Microsoft OneDrive, SharePoint, HubSpot, Jira og andre systemer, så AI-output er grounded i virksomhedens egne data. Det adresserer en af de største udfordringer ved enterprise AI: at modellen svarer ud fra generel viden i stedet for organisationens specifikke kontekst.

På prissiden er Gemini konkurrencedygtig. Flash-modellerne er 20-40 gange billigere per token end sammenlignelige modeller fra andre udbydere, hvilket gør Gemini til et attraktivt valg for højvolumen-applikationer som AI-drevet content generation, kundesupport og intern vidensøgning.

Hvad Gemini ikke er

Gemini er ikke en enkelt model, men en familie af modeller med forskellige styrker. Det er en vigtig distinktion, fordi valget mellem Pro, Flash og Flash-Lite har stor betydning for kvalitet, hastighed og pris. At bruge Pro til simple opgaver er spild af ressourcer, mens Flash kan være utilstrækkelig til kompleks reasoning.

Gemini er heller ikke udelukkende et Google Workspace-tillæg. Modellerne kan bruges via API uafhængigt af Google-økosystemet, og de konkurrerer direkte med OpenAIs GPT-modeller og Anthropics Claude på benchmarks for kodning, reasoning og multimodal forståelse. Gemini bør evalueres som en selvstændig LLM-platform, ikke blot som en funktion i Google-produkter.

Det er også værd at bemærke, at Gemini ikke automatisk har adgang til virksomhedens data. Integration med interne systemer kræver opsætning via Gemini Enterprise Agent Platform, og dataadgang skal konfigureres med passende sikkerhedskontroller og AI governance.

Relaterede termer

Foundation Model: Den kategori af store, forudtrænede AI-modeller som Gemini tilhører. Foundation models trænes på massive datasæt og tilpasses derefter til specifikke opgaver.

LLM (Large Language Model): Den teknologiske kerne i Gemini. En LLM er en sprogmodel med milliarder af parametre, der kan generere og forstå tekst.

Multimodal AI: AI-systemer der kan arbejde med flere datatyper samtidig. Gemini er nativt multimodal og behandler tekst, billeder, lyd og video i samme kontekst.

Generativ AI: Den overordnede kategori for AI, der skaber nyt indhold. Gemini er et eksempel på generativ AI anvendt på tværs af modaliteter.

Copilot: AI-assistenter integreret i arbejdsværktøjer. Gemini i Google Workspace fungerer som en copilot for produktivitet.

AI Agent: Autonome AI-systemer der kan handle selvstændigt. Gemini Enterprise Agent Platform er Googles svar på enterprise-grade AI-agenter.