Skip to main content


      Mange organisationer oplever udfordringer med at håndtere deres interne dataflows. At forstå det samlede flow af data, som det bevæger sig gennem og mellem systemer, er ofte en vanskelig opgave – ikke kun på grund af systemernes kompleksitet, men også som følge af manglende struktur og dokumentation.

      Datafstamning udgør en struktureret ramme til at spore dataens bevægelser på tværs af tabeller, programmer og applikationer og giver indsigt i, hvor data stammer fra, og hvordan det bevæger sig. Det giver et samlet overblik over hele dataøkosystemet og muliggør samtidig dybdegående analyse af specifikke processer. Som en central del af effektiv masterdatastyring (MDM) bidrager datafstamning til øget transparens og kontrol i organisationen.

      Regulatoriske krav er ofte en væsentlig drivkraft bag initiativer inden for datafstamning. For eksempel kræver GDPR, at virksomheder har styr på, hvor og hvordan brugernes data behandles – noget der er vanskeligt uden et klart overblik over dataens oprindelse og flow.

      Datafstamning spiller også en vigtig rolle i vedligeholdelse og videreudvikling af ældre systemer. Det kan være en udfordrende opgave at opdatere, udskifte eller migrere disse systemer på grund af teknisk gæld eller begrænset systemindsigt. Ved automatisk at kortlægge upstream- og downstream-afhængigheder og dataflows forenkler datafstamning denne proces og giver værdifulde indsigter, der letter overgangen.

      Vores NewTech-team er førende inden for generativ AI og nye teknologier. Vi har udviklet GenAI-baserede acceleratorer til datafstamning, som automatisk analyserer kildekode og identificerer dataflows med enestående præcision. Opgaver, der tidligere krævede ugers arbejde af en erfaren udvikler, kan nu gennemføres på få minutter.


      Mads Galatius
      Mads Galatius

      Director, Advisory

      KPMG in Denmark



      Vi kan hjælpe jer med:

      Vores accelerator til datafstamning er fleksibel og kan anvendes i flere faser af dataflowet. Uanset om det handler om at analysere programafhængigheder i SAS-scripts, styre læsning og lagring af vedvarende datatabeller eller spore data på feltniveau mellem SQL-tabeller, kan acceleratoren tilpasses det konkrete behov. Ved at kombinere agentbaserede netværk, prompt engineering og strukturerede forbindelser opnår løsningen en imponerende præcision på 95 % (baseret på faktiske kundeprojekter) – højere end det, mennesker typisk opnår.

      Outputtet er et grafnetværk bestående af noder og forbindelser, som visuelt illustrerer dataens placering og relationer. Netværket kan både forespørges for at udtrække værdifulde indsigter og navigeres visuelt for et samlet overblik. Med dette værktøj kan du hurtigt finde svar på centrale spørgsmål som:

      • Hvilke downstream-datafelter påvirkes af mit oprindelige datafelt?
      • Hvilke programmer er dette SAS-script afhængigt af?
      • Hvilke filer gemmer dette script til, og hvordan indgår de i andre programmer?
      • Analyse af program- og dataflowafhængigheder

      Afhængigheder i et dataøkosystem definerer, hvordan scripts interagerer med data, programmer, tabeller og andre scripts. Scripts kan være afhængige af specifikke programmer, biblioteker eller softwaremiljøer. For eksempel kan et SAS-script benytte eksterne funktioner, pakker eller værktøjer for at udføre sine opgaver – og ændringer i disse (fx versionsopdateringer) kan påvirke scriptets funktionalitet (kendt som programafhængigheder).

      Derudover læser og skriver scripts ofte til bestemte databaser, tabeller eller filer, hvilket skaber afhængighed af tilgængeligheden og integriteten af disse datakilder (kendt som dataflow-afhængigheder).

      Vi etablerer både et indledende billede og leverer værktøjer til at automatisere vedligeholdelsen af dataafstamning. Nøjagtigheden af datafstamning er afgørende, og enhver ændring i processer eller programmer kræver en opdatering. Ved at anvende en GenAI-baseret tilgang minimerer vi risikoen for forældet information og sparer tid fremadrettet ved at automatisere det, der ellers ville være en manuel opgave.

      Der findes flere værktøjer på markedet, der udnytter datafstamning til at generere indsigt – herunder Microsoft Purview, Informatica og Collibra. Disse systemer dækker dog typisk kun 50–70 % af det samlede dataflow. Vores accelerator kan integreres problemfrit med disse løsninger og giver et mere komplet billede af dataens bevægelser og sammenhænge.




      Andre relevante services

      Vi har stor erfaring med at føre ML-projekter fra PoC-stadiet til produktionsklare opsætninger i fuld skala.

      Vi tilbyder skræddersyede projekter og managed services og har leveret nogle af de største automatiseringsløsninger.

      Vi hjælper organisationer med at forstå, forberede sig på og udnytte kvantecomputere.

      Udforsk vores indsigter om AI og data

      Din one-stop destination for indsigt, events og services, der alle omhandler AI.

      Smart automation industry robot in action - industry 4.0 concept - 3D Render