Billede af gammeldags arkivering

Arkivering af digitale data er afgørende for at bevare den danske historie. Men hvordan sikrer man, at gamle data stadig kan tilgås om 5, 100 og 200 år? Det er der flere metoder til.

Måske har du prøvet at finde en kvittering for et indkøb fra 2015 frem for blot at konstatere, at teksten på den laserprintede kvittering er stort set usynlig. Eller du har siddet med en bunke smalfilm eller VHS-bånd, der måske gemmer guld fra familiens største begivenheder – men du kan ikke længere afspille dem. Eller talen fra dit bryllup er gemt på en floppydisk i et dokument, som din pc ikke kan genkende.

Historisk viden er dermed gået tabt – og det samme kan ske, når det gælder historisk viden og data fra hele landets små og store begivenheder. Derfor kæmper arkivarer hårdt for at bevare de historiske data fra især offentlige instanser og sikre dem, så fremtidens historikere kan forstå det danske samfund her i det 21. århundrede.

Det er en kamp, der bl.a. indeholder enorme mængder af data, evigt skiftende dataformater, fysiske medier, som bryder sammen, og kilometervis af papirer, som står på hylder i fx. regioner, kommuner og statslige myndigheder og institutioner.

Kilometer af dokumenter i arkiverne

”Vi har siden 2004 samarbejdet med Rigsarkivet, de kommunale, offentlige arkiver og KL om løsningen af arkiveringsopgaver. I takt med, at der kommer flere myndigheder, bliver der også produceret mere og mere data, hvor en stor del skal arkiveres i henhold til lovgivningen,” siger Stefan Frimann Franck, som er Senior Business Specialist i KMD Arkivering.

Hvert år modtager Rigsarkivet mellem 25 og 44 terabyte data. 1 terabyte svarer til 1000 gigabyte eller GB. Mængden svarer til cirka 25-44 kilometer dokumenter, hvis det blev printet. Intet tyder på, at mængden af data bliver mindre, selv om Rigsarkivet forventer, at de ca. 5-10 kilometer papir, man lige nu modtager årligt, vil blive mindre i takt med digitaliseringen.

Flere metoder til at sikre fremtidens arkiver

Men hvordan sikrer man, at gamle data stadig kan tilgås om 5, 100 og 200 år? Det er der flere veje til.

”Der er overordnet tre metoder til en fremtidssikret arkivering. Den ene er at bevare gammel hardware, så man tilgå data i deres oprindelige form. Den anden er en såkaldt emuleringsstrategi, hvor man bygger software, der kan afvikle ældre programmer. Det kender man måske især fra computerspil fra 1980erne,” forklarer Stefan Frimann Franck.

”Den tredje metode hedder migrering og er den strategi, man i Europa lægger sig an på. Her konverterer man data og gemmer dem i formater, som er uafhængige af software- og hardwareleverandører. Det er den metode, vi bruger, når vi fx afleverer til Rigsarkivet, hvor vi pt. afleverer data i XML og elektroniske dokumenter i TIFF, MPG og MP3,” siger han.

XML er et såkaldt computer-opmærkningssprog, der er bygget til at opbevare data og bl.a. bliver brugt i opbygning af hjemmesider, mens TIFF, MPG og MP3 er formater til hhv. billede, video og lyd.

”Vi har allerede nu konverteret over 2000 forskellige formater til XML, TIFF, MPG og MP3 og leveret til fx Rigsarkivet, men også bl.a. stadsarkiverne. Hvis det i fremtiden ser ud til, at de formater er på vej til at udgå, vil de filer så blive migreret til andre formater,” siger Stefan Frimann Franck.

Vi har siden 2004 samarbejdet med Rigsarkivet, de kommunale, offentlige arkiver og KL om løsningen af arkiveringsopgaver. I takt med, at der kommer flere myndigheder, bliver der også produceret mere og mere data, hvor en stor del skal arkiveres i henhold til lovgivningen

Stefan Frimann Franck, Senior Business Specialist i KMD Arkivering

Digitalt arkiv på mere end 150 terabyte data

Rigsarkivet har i over 800 år opbevaret og dokumenteret landets historie. Det indeholder utrolige mængder af fysiske dokumenter, som bliver opbevaret ved den helt rigtige temperatur og luftfugtighed for at bevare papirerne. De digitale arkiver er rent fysisk meget mindre og bliver lige nu opbevaret på avancerede magnetbånd og Blu-ray-diske. De mere end 150 terabyte data bliver løbende flyttet til nye medier, når fx Blu-ray-diskene går i opløsning.

Samtidig er Rigsarkivets digitale arkiv spejlet og bliver opbevaret offline på tre forskellige og hemmelige lokationer, så de ikke samtidig kan blive ødelagt af hackere, brand eller andre katastrofer. Det er også derfor, at den digitale kulturarv bliver opbevaret både på magnetbånd og Blu-ray – for en voldsom solstorm kan potentielt slette alle magnetbåndene.

”Jeg siger ikke, at det er sandsynligt. Men vi skal være beredte på, at det ikke må ske,” sagde Jan Dalsten Sørensen, som er leder for Digital Bevaring og Oparbejdning i Rigsarkivet, til Berlingske for nylig.

Til samme avis gav Jan Dalsten Sørensen udtryk for sin største bekymring omkring den digitale opbevaring af viden: ”Det der kan gøre mig urolig er, hvis forvaltningens dokumentation udvikler sig i retning af en mere flygtig karakter. Det kræver altid en bevidst handling, når digitale data skal bevares,” sagde han.

Så længe forvaltningens dokumentation fx foregår i etablerede fagsystemer, er der næppe den store grund til bekymring på dette område. Men det kræver opmærksomhed, hvis man skal sikre fx dokumentation mellem borgere og en chatbot – eller en dialog mellem en borger og en sagsbehandler i andre dialogværktøjer.

”Og så er der stadig et efterslæb mange steder. En lang række kommuner har fx ingen fast aftale om at få arkiveret deres data,” siger Stefan Frimann Franck.

Men i mellemtiden arbejder KMD Arkiverings konverteringsmotor i døgndrift på at konvertere filer fra et utal af formater fra kommuner, regioner og statslige myndigheder. I år forventer Stefan Frimann Franck, at man volumenmæssigt afleverer mest til de kommunale arkiver i år, og at man samlet set til både Rigsarkivet og de kommunale arkiver vil komme til at levere ca. 25 terabyte data til den hastigt voksende digitale danmarkshistorie.