Fagpakke var spot-on på de dataudfordringer, som Mads arbejder med til daglig
Mads Thomsen (foto) arbejder som Senior Data og GIS developer ved Aarhus Vand.
Hvorfor valgte du fagpakken Business Intelligence - analyse af store databaser?
Jeg valgte fagpakken, fordi beskrivelsen af faget var spot-on på de dataudfordringer, som jeg arbejder med til daglig som softwareudvikler hos Aarhus Vand. Udfordringerne tager afsæt i, at både forsyning af rent drikkevand, håndtering af regnvand og rensning af spildevand tilsammen genererer store mængder af data, og de data skal kombineres på tværs af fagsystemer, så de har sammenhænge og kan give os værdifuld viden og indsigt i hele Aarhus Vand.

Hvad var dit udbytte af fagpakken?
Fagpakken om Business Intelligence og store databaser har udvidet mit teoretiske fundament og begrebsapparat helt enormt. Jeg bruger min nye viden næsten hver dag, og jeg oplever faktisk, at jeg nu anskuer de fleste af mine arbejdsopgaver med nye øjne!
Indholdet i fagpakkens tre enkeltfag har givet mig en forståelse for blandt andet Kimball Lifecycle* og Multidimensional modellering, der er en metode til at organisere og analysere data på tværs af flere "dimensioner", f.eks. tid, sted og produkt. Når man skal gå på opdagelse i store datatidsserier, så har man ofte brug for at finde outlier og anomalier, altså fx. data, der afviger fra det forventede mønster, samt genskabe eventuelt manglende data. Fagpakken har lært mig teknikker til knowledge discovery via følgende fremgangsmåde; fra data selection – data cleaning – data transformation – data mining – pattern evaluation og til visualization, og som for mig har resultereret i ny viden. I løbet af fagpakken arbejdede vi desuden både med python, supervised/unsupervised machine learning og cloud computing samt column-oriented data store.
Efter fagpakken Business Intelligence - analyse af store databaser valgte du at skrive det afsluttende masterprojekt, som betyder, at du i dag er Master i it. Kan du fortælle lidt om din afsluttende proces?
Ja, selvfølgelig. Fagpakken inspirerede mig til at arbejde videre med BI og store databaser i mit masterprojekt. Masterprojektet gav mig mulighed for at tage udgangspunkt i en udfordring fra min hverdag og løfte det op på et akademisk niveau.
En af udfordringerne med at gemme Big Data til fremtidige analyser er, at domæne-eksperternes viden går tabt i en data lake. Mit masterprojekt gav et bud på, hvordan domæne-viden kan omsættes til metadata via et koncept, som er uafhængigt af både software, platform og domæne.
Mit afsluttende masterforløb gav mig en akademisk arbejdsmetodik med detailed record keeping og logbog til at fastholde resultater, så ens arbejde bliver reproducerbart og anvendeligt for brugerne.
Om Mads Thomsens masterforløb
Han har taget følgende fagpakker:
• Softwarearkitektur i praksis
• Business Intelligence - analyse af store databaser
Han afsluttede sit masterforløb med et masterprojekt, der bærer titlen Preserving domain knowledge in a data lake (fra 2022), og som kan læses her.
* Kimballs livscyklus er en metode til udvikling af datavarehuse og er udviklet af den amerikanske forsker Ralph Kimball og en række kolleger.
Interview fra december 2025.