Optimering af aktindsigtsprocessen med AI

I mange offentlige institutioner er behandlingen af aktindsigtsanmodninger en meget tidskrævende proces, der indeholder mange trin.

En typisk aktindsigtsproces kan konceptuelt beskrives i følgende trin: 

  1. Anmodning om aktindsigt modtages 
  2. Anmodningen visiteres og fordeles til vurdering 
  3. Vurdering af anmodningen 
  4. Fremsøgning af relevante sager og dokumenter 
  5. Sortering og ekstrahering 
  6. Bortredigering/afblænding af følsomme data
  7. Godkendelse
  8. Aflevering til anmoder

Ofte er trin 6 i ovenstående procesbeskrivelse, Overstregning/afblænding af følsomme data, meget ressourcekrævende. KMD WorkZone tilbyder en række features, der kan reducere ressourceforbruget væsentligt.

KMD WorkZone Advanced PDF

I KMD WorkZone version 2021.2 blev der introduceret et nyt modul, KMD WorkZone Advanced PDF, der muliggør redigering af PDF dokumenter direkte i KMD WorkZone Client uden anvendelse af særlige PDF redigeringsværktøjer. Under redigering af dokumentet kan ord og tekststrenge, der skal bortredigeres/afblændes, opmærkes, og efter godkendelse kan den endelige bortredigering ske.  

Opmærkningen af ord og tekststrenge til bortredigering kan ske ved manuel markering eller på baggrund af en søgning, herunder søgning  efter ord og tekststrenge, der matcher et bestemt mønster beskrevet med et regulært udtryk. Som standard kan KMD WorkZone finde web adresser, CPR-numre, CVR-numre og e-mailadresser i dokumentet og opmærke disse for bortredigering. Det er muligt at konfigurere KMD WorkZone med flere regulære udtryk, der kan anvendes i den automatiske opmærkning af tekst til bortredigering. 

Med KMD WorkZone 2023.3 introduceres endnu et modul, der yderligere reducerer ressourceforbruget ved opmærkning af følsomme oplysninger i dokumentet, der bør bortredigeres før. Modulet KMD WorkZone Suggest Redaction er en feature, der tilbyder AI-baseret identificering og opmærkning af personhenførbare ord i dokumenter på baggrund af en forståelse af teksten. 

KMD WorkZone Suggest Redaction benytter servicen KMDtxt, der er en AI baseret sprogmodel, som igennem Machine Learning er trænet til at genkende forskellig personhenførbar information. Det kan f.eks være entiteter som navne på personer, lokationer, navne på virksomheder og organisationer, pasnumre, betalingskortnumre mv. Sprogmodellerne er kontekstbaserede, så når de givne entiteter optræder i brødtekstformat, opnås der en performance på >95% præcision. Standardentiteterne er klar til brug i KMD WorkZone når modulet tilvælges og kan umiddelbart skabe værdi ved en væsentlig reduktion af det krævede ressourceforbrug til procestrinnet bortredigering/afblænding af følsomme data.

A screenshot of a computer Description automatically generated

I mange offentlige myndigheder er ”følsomme data” domænespecifikke, og det vil ikke være tilstrækkeligt at have mulighed for at finde informationer, der kan beskrives med standardentiteterne.  Med KMDtxt et muligt at få trænet modeller, som kan genkende de specifikke entiteter og sætninger, som er afgørende i en domæne-specifik aktindsigtsproces. Dette vil ske ved at en Data Science konsulent fra KMD, i samarbejde med enkelte sagsbehandlere, får konkretiseret, hvilke informationer, som er afgørende at få opmærket for bortredigering. Derefter skal der ske en dataindsamling, og herefter benyttes data til at træne den domæne-specifikke sprogmodel. Når en tilfredsstillende præcision er opnået, kan modellen direkte integreres i KMD WorkZone og anvendes sammen med standardmodellerne via Redaction Suggest funktionaliteten.   

Når der skal trænes en domæne-specifik sprogmodel begyndes der med et datasæt fra kunden og afsluttes med en færdigtrænet AI-model. Denne kan efterfølgende implementeres i kundens KMD WorkZone.