Mere end 800 milliarder linjer COBOL-kode kører stadig i produktion globalt. I Danmark drifter KMD – nu ejet af NEC og med mainframe-operationer hos T-Systems – de kernesystemer som kommuner og statslige styrelser afhænger af dagligt. ATP, Skattestyrelsen, Udbetaling Danmark og de store banker opererer på den samme infrastruktur.
Ingen af disse systemer bliver skiftet ud i morgen. Det er heller ikke nødvendigt. Retrieval-Augmented Generation – RAG – gør det muligt at koble moderne AI-modeller til eksisterende data og systemer uden at røre ved den underliggende infrastruktur.
Problemet
Den generation af ingeniører der byggede og vedligeholdte Danmarks mainframe-systemer går på pension. Få datalogistuderende lærer COBOL. Stillingerne bliver sværere at besætte – KMD annoncerer løbende efter mainframe-specialister med DB2- og z/OS-kompetencer, men talentpoolen skrumper.
Samtidig indeholder systemerne årtiers akkumuleret viden: forretningslogik, sagsbehandlingsregler, datarelationer og dokumentation. Den viden er kodet i COBOL copybooks, JCL-jobs og systemdokumentation som ingen ny medarbejder kan overskue. Resultatet er en organisatorisk risiko der vokser for hver specialist der forlader arbejdsmarkedet.
Teknologien
RAG er en arkitektur der kobler en sprogmodel til eksterne datakilder. I stedet for at modellen svarer udelukkende baseret på sin trænningsdata, henter den først relevante dokumenter fra en vektordatabase og bruger dem som kontekst for sit svar. Resultatet er svar der bygger på organisationens egne data – ikke generiske hallucineringer.
For legacy-systemer fungerer RAG som et videnslag der ligger oven på den eksisterende infrastruktur. Data ekstraheres, chunkes og vektoriseres – men kildesystemet forbliver uændret. Det er en non-invasiv tilgang der ikke kræver migration eller omskrivning.
RAG erstatter ikke mainframen. RAG gør mainframens viden tilgængelig for resten af organisationen.
Arkitekturen
01
Moderne API-wrappers over CICS- og IMS-transaktioner eksponerer mainframe-data som REST- eller GraphQL-endpoints. Herfra kan data embeddes i en vektordatabase og indgå i RAG-pipelinen. Denne tilgang er ideel når der er behov for real-time adgang til transaktionsdata.
02
For analytiske use cases er batch-udtræk fra DB2- eller VSAM-databaser ofte den mest pragmatiske vej. Data ekstraheres på planlagte tidspunkter, chunkes efter semantisk indhold og vektoriseres. Velegnet til dokumentsøgning, compliance-checks og vidensstyring.
03
MQ- eller Kafka-baseret event streaming fra mainframen muliggør en near-real-time RAG-pipeline. Når en transaktion eller dataopdatering sker, streames eventet til en processor der opdaterer vektordatabasen. Særligt relevant for sagsbehandlingssystemer med løbende opdateringer.
04
Indeksering af COBOL copybooks, JCL-scripts og systemdokumentation giver udviklere og driftsfolk en AI-assistent der kan besvare spørgsmål om systemet. Thoughtworks har dokumenteret at denne tilgang reducerer reverse engineering-tid med to tredjedele – fra seks uger til to uger per 10.000 linjer kode.
Resultater
En af verdens største bilproducenter stod over for at modernisere 15 millioner linjer COBOL-kode. Projektet var bagud og licensfristen pressede. Løsningen var en RAG-arkitektur der indekserede hele kodebasen og gav udviklerne en AI-assistent til at forstå og dokumentere koden.
Resultatet: reverse engineering-tiden per 10.000-linjers modul faldt fra seks uger til to. For hele kodebasen svarer det til en besparelse på 60.000 mandedage. Ikke en teoretisk beregning – et dokumenteret resultat fra et igangværende projekt.
IBM rapporterer tilsvarende tal fra deres watsonx Code Assistant for Z, der bruger en Granite LLM med RAG-arkitektur til COBOL-forståelse og -generering. Version 2.8 introducerede agentic AI-workflows til mainframe-modernisering med en rapporteret 60% produktivitetsstigning ved COBOL-til-Java-transformation.
Danmark
KMD har outsourcet sin mainframe-drift til T-Systems i en syv-årig kontrakt – den største T-Systems har vundet i Danmark. Det signalerer at mainframen forbliver central i dansk offentlig IT i mange år endnu, men at fokus skifter fra drift til modernisering og innovation oven på den eksisterende platform.
For kommuner og styrelser der afhænger af KMDs systemer, åbner RAG en vej til at udnytte de data der allerede findes. En sagsbehandler kan stille spørgsmål til et AI-system der trækker på historiske sager, lovgivning og interne retningslinjer – uden at mainframen modificeres.
Gartner forudser at AI-drevne workloads på mainframe stiger fra 3% i 2024 til 25% i 2026. Spørgsmålet er ikke om danske organisationer skal koble AI til deres legacy-systemer. Spørgsmålet er hvornår.
2026 og frem
RAG er ikke en statisk teknologi. I 2025–2026 ser jeg tre tendenser der gør RAG endnu mere relevant for legacy-miljøer:
Hybrid retrieval kombinerer semantisk søgning med keyword-matching og overgår konsekvent single-method pipelines i enterprise-datasæt med støj og inkonsistens – præcis den type data man finder i legacy-systemer.
GraphRAG kobler vektorsøgning med strukturerede ontologier og knowledge graphs. Det giver kontekst og logik til retrieval-processen – med rapporteret søgepræcision op til 99%. Særligt værdifuldt for komplekse forretningslogikker i COBOL-systemer.
Agentic RAG lader AI-agenter selvstændigt beslutte hvilke datakilder der skal konsulteres og i hvilken rækkefølge. Det er evolution fra passiv hentning til aktiv informationssøgning – og det gør RAG langt mere effektiv i komplekse legacy-miljøer med mange heterogene datakilder.
Alle taler om at erstatte legacy. Den smartere tilgang er at bygge oven på det.
Jeg designer og implementerer RAG-arkitekturer der integrerer med eksisterende systemer – også mainframe og legacy. Lad os tale om mulighederne.