Sprogmodeller12 min

GPT, Claude, Gemini, Grok: En ærlig sammenligning for danske beslutningstagere

Markedet for sprogmodeller bevæger sig i måneder, ikke år. I slutningen af 2025 lancerede Google, Anthropic og OpenAI nye frontier-modeller med tre ugers mellemrum. Priserne faldt. Kapabiliteterne steg. Og for den organisation der skal vælge platform, blev beslutningen mere kompleks – ikke enklere.

Denne gennemgang er vendor-neutral. Jeg sælger ingen licenser og har ingen partneraftaler med nogen af leverandørerne. Målet er at give danske beslutningstagere et faktuelt grundlag for at vælge den rigtige model til den rigtige opgave.

Modellerne

Fire modeller, fire profiler

OpenAI

GPT-5 / GPT-5.2

OpenAIs nyeste modeller sætter standarden for ræsonnement. GPT-5.2 opnåede den første perfekte 100%-score på AIME 2025 – den avancerede matematikkonkurrence – uden brug af eksterne værktøjer. Kontekstvinduet er 400.000 tokens, og hallucineringsraten er reduceret med 65% sammenlignet med forgængeren.

400K kontekstStærkest ræsonnementSOC 2 Type IIGDPR

Anthropic

Claude Opus 4.5

Anthropics topmodel dominerer kodningsopgaver med 80,9% på SWE-bench Verified – markant over GPT-5.2 (~70%) og Gemini (~65%). Claudes styrke er kompleks reasoning og autonome kodningsopgaver. Privacy-fokus er brancheførende med zero data retention som standard.

200K kontekstBedst til kodningZero data retentionSOC 2 Type II

Google

Gemini 2.5 / 3 Pro

Geminis 1 million token kontekstvindue er 2,5 gange større end GPT-5.2. Det muliggør behandling af hele patentporteføljer, juridiske dokumentsamlinger eller forskningskorpora i én session. På LongBench v2 scorer Gemini 68,2% mod GPT-5.2's 54,5%. Google Workspace integration er en fordel for organisationer i Google-økosystemet.

1M kontekstMultimodalISO 42001Workspace-integration

xAI

Grok

xAIs model er den billigste på API-niveau – markant under konkurrenterne. Styrken er real-time data via X/Twitter-integration. Enterprise-platformen er dog mindre moden end de tre andre, og for danske offentlige organisationer er compliance-dokumentationen endnu ikke på niveau med OpenAI, Anthropic eller Google.

Laveste API-prisReal-time dataTidlig enterprise

Økonomi

Priser der faktisk betyder noget

Priser på sprogmodeller er komplekse. Der er abonnementspriser for slutbrugere, API-priser for udviklere, og enterprise-aftaler med custom pricing. Her er et overblik:

Model

API input

API output

Pro-plan

GPT-5.2

$1,25–1,75

$10–14

$200/md

Claude 4.5

$5,00

$25,00

$100–200/md

Gemini 3 Pro

$1,25–2,50

$10–15

$250/md

Grok

$0,0002

$0,0005

$30/md

API-priser i USD per million tokens. Pro-plan er månedspris per bruger. Priser pr. februar 2026.

Prisforskellene er markante. Claude Opus 4.5 koster 2,7 gange mere end GPT-5.2 på API-niveau. Grok er størrelsesordener billigere end alle andre, men enterprise-funktionaliteten er begrænset.

Det vigtige er ikke den laveste pris. Det er den rigtige pris for den rigtige opgave. En organisation der primært har brug for dokumentopsummering, har andre behov end en der bygger autonome kodningsagenter.

Compliance

Sikkerhed og compliance i dansk kontekst

For danske offentlige organisationer er GDPR-compliance en forudsætning. Alle fire leverandører hævder GDPR-compliance, men implementeringen varierer:

OpenAI tilbyder SOC 2 Type II, GDPR og HIPAA. Enterprise-planen inkluderer data processing agreements og garanterer at data ikke bruges til trænning. Team- og Enterprise-planer har zero data retention.

Anthropic går længere med zero data retention som default – også på lavere abonnementer. SOC 2 Type II, GDPR og HIPAA. For organisationer med strenge krav til dataminimering er dette en differentiator.

Google er den eneste med ISO 42001-certificering – den internationale standard for AI management systems. Google Workspace-integration betyder at data kan forblive i det eksisterende økosystem. Stærkest for organisationer der allerede bruger Google.

xAI (Grok) har den mindst modne enterprise-platform. Compliance-dokumentation er begrænset sammenlignet med de tre andre. Ikke anbefalet til offentlige organisationer med strenge krav.

Anbefaling

Multi-model er den nye standard

Den rigtige sprogmodel er sjældent én model. Det er den rigtige model til den rigtige opgave.

Gartner forudsiger at AI-servicepris i 2026 vil blive en vigtigere konkurrenceparameter end rå performance. Det peger mod en multi-model strategi: en billig model til 70% af rutineopgaverne og en premium-model til de 30% der kræver avanceret ræsonnement eller kodning.

For en typisk dansk offentlig organisation anbefaler jeg denne tilgang:

Dokumentopsummering og borgerservice

GPT-5 eller Gemini. Stort kontekstvindue, lav pris, god til generelle opgaver. Gemini foretrækkes i Google Workspace-miljøer.

Kompleks sagsbehandling og analyse

GPT-5.2 med høj reasoning effort. Bedst til opgaver der kræver logisk stringens og matematisk ræsonnement.

Softwareudvikling og systemintegration

Claude Opus. Markant bedre kodekvalitet end konkurrenterne. Velegnet til RAG-implementering, API-udvikling og automatisering.

Stor-skala dokumentbehandling

Gemini 3 Pro med 1M token kontekst. Ideel til juridiske dokumenter, patentanalyse og research der kræver hele dokumenter i kontekst.

Advarsel

Tre fejl jeg ser igen og igen

1. At vælge model baseret på benchmark-scores. Benchmarks måler specifikke opgaver under kontrollerede forhold. De siger meget lidt om hvordan modellen performer på organisationens faktiske opgaver. Altid pilot-test med egne data.

2. At låse sig til én leverandør. Sprogmodel-markedet er for ungt og for hurtigt til vendor lock-in. Byg abstraktionslag der gør det muligt at skifte model uden at omskrive hele applikationen.

3. At ignorere totalomkostningen. API-prisen er kun en del af regnestykket. Prompt engineering, fine-tuning, monitoring, og den tid medarbejderne bruger på at lære systemet – alt sammen er reelle omkostninger. Anthropics batch-API giver 50% rabat. Prompt caching sparer 90% på gentaget indhold. Disse funktioner kan ændre hele business casen.

Konklusion

Valget handler ikke om teknologi

Det handler om organisationens opgaver, data, compliance-krav og eksisterende teknologistak. En kommune der vil automatisere borgerhenvendelser har fundamentalt andre behov end en styrelse der skal modernisere legacy-systemer.

Min anbefaling er altid den samme: start med opgaven, ikke med teknologien. Definér præcist hvad AI skal løse. Pilot-test med egne data. Og byg en arkitektur der tillader at skifte model når markedet bevæger sig – for det gør det.

Har du brug for uafhængig rådgivning om valg af sprogmodel? Jeg leverer en vurdering baseret på organisationens specifikke behov – uden leverandørbindinger.

Tag kontakt