Robot der holder forskellige ting i mange arme

Machine Learning skal gøre kategoriseringen af fx kommuner og regioners indkøb hurtigere og sikrere. Men den avancerede maskine skal trænes tålmodigt op, før dens enorme potentiale viser sig.

Der bliver indkøbt mange bleer til en børnehave i en kommune hvert år. Men hvor mange bleer bliver det til i hele kommunen – og hvad hvis man også tæller bleer brugt på plejehjemmet?

Når fx en kommune eller region har behov for at analysere på det samlede indkøb af alt fra bleer over bananer til byggematerialer på tværs af forvaltninger, går en stor maskine i gang med at analysere fakturaer via tekstgenkendelse og kategorisere hvert enkelt indkøb. Bag maskinen sidder i dag mennesker, som igennem årene har oprettet tusindvis og atter tusindvis af regler for at kategorisere indkøbene rigtigt. Nu skal Machine Learning hjælpe med at gøre kategoriseringen hurtigere, sikrere og med endnu færre fejl.

”Kategoriseringsmotoren er hjertet i KMD Indkøbsanalyse, som giver fx en indkøbsafdeling i en kommune mulighed for at analysere på deres indkøb på tværs af områder. Den bygger på hundredtusindvis af manuelt oprettede regler, så den avancerede motors tekstgenkendelse kan kategorisere indkøbene korrekt, men det er en metode, som er blevet meget tung, efterhånden som vi har fået mange kunder,” siger Jesper Bækgaard, som er Head of Section i Data, IM og Analytics i KMD.

”Derfor har det givet mening for os at kigge på andre teknologier til formålet. Vores teknikere har peget på, at Machine Learning ligger lige til højrebenet til den opgave, fordi teknologien vil kunne overskue uhyggeligt komplekse regler, som vi mennesker ikke kan overskue,” siger han.

Man ved kun, om man er på rette vej ved at behandle sine datasæt med respekt

Mikkel Bernt Buchvardt, Business Intelligence Specialist i KMD

På skuldrene af teknologiske giganter

De mange manuelt oprettede regler bliver lige nu brugt til at lære den nye avancerede maskine op. For maskinen og dens algoritmer kan i princippet ikke selv noget, før mennesker har oplært den. Det ansvar ligger på Mikkel Bernt Buchvardts skuldre.

”Men jeg står jo på skuldrene af giganter i det arbejde, som forskning baner vej for. Det er som at træne en hund, men det der er lidt angstprovokerende er, at selve maskinen har vanvittige potentialer, og det er så mit ansvar at få den til at præstere ved fx at udvælge de rigtige algoritmer samt udvælge og behandle træningsdata,” siger Mikkel Bernt Buchvardt, som er Business Intelligence Specialist i KMD.

”Det er halvt kreativt og halvt research, hvor man lægger en strategi og udvælger de algoritmer, som selve maskinlæringen består af, men hvor man bliver ved med at cykle rundt og prøve nye strategier og nye algoritmer af for at opnå det bedst mulige resultat,” siger han.

Byggestenene i form af algoritmerne kommer fra den forskning i Machine Learning, som bliver foretaget over hele verden. For Mikkel Bernt Buchvardt og teamet er opgaven at implementere algoritmerne og eksperimentere med dem.

Man skal behandle sine datasæt med respekt

Træningen af den avancerede maskine foregår ved at bruge eksisterende data og fodre maskinen med udvalgte mængder, hvor man på forhånd kender resultatet. De mange tests giver derfor mulighed for at måle, hvordan maskinen bliver bedre og bedre til ramme rigtigt i sin kategorisering af indkøb.

”Man ved kun, om man er på rette vej ved at behandle sine datasæt med respekt. Så man snyder ikke. Man lader ikke maskinen kigge. Man tester den på data, den aldrig har set. Så får man hele tiden en idé om, hvor rigtigt den kan ramme,” siger Mikkel Bernt Buchvardt.

”Her kommer den menneskelige faktor i spil. For det er jo os, der udvælger træningsdata og testdata. Her er det vigtigt, at de kommer til at ligne de data, som maskinen kommer til at se i fremtiden så meget som muligt,” siger han.

Det bliver en kategoriseringsmotor, hvor vi med færre ressourcer kan opnå bedre resultater

Jesper Bækgaard, Head of Section i Data, IM og Analytics i KMD 

Anlægger god videnskabspraksis

Disciplinen kaldes populært for data science, og Mikkel Bernt Buchvardt køber i høj grad ind på den videnskabelige metode for at sikre, at maskinlæringen opnår sit potentiale.

”Vi bruger statistiske metoder, men 80 pct. af arbejdet ligger i at forstå forretningsområdet og løsningen, som i dette tilfælde er KMD Indkøbsanalyse, og kigge på processerne og på data. Der er klare retningslinjer for, hvad der er god videnskabspraksis, og den anlægger man her,” siger BI-specialisten.

”På den måde kan man med god samvittighed, når man er færdig, sige, at den her applikation er så og så nøjagtig i sin kategorisering. Det kan man kun sige, hvis man er tro mod statistiske og videnskabelige metoder,” fastslår han.

Maskinen kan se nye sammenhænge

Som ansvarlig for området ser Jesper Bækgaard frem til foråret, hvor den nye Machine Learning-drevne kategoriseringsmotor forventes at erstatte den eksisterende.

”Det bliver en kategoriseringsmotor, hvor vi med færre ressourcer kan opnå bedre resultater. En anden fordel er, at den nye maskine med vores eksisterende regler i ryggen kan lave nye regler og se sammenhænge på tværs. Så når fx en børnehave skifter til et nyt mærke i bleer, så kan maskinen selv se sammenhængen i, at det nye indkøb hører til i kategorien børneble,” siger Jesper Bækgaard.

”For kunderne bliver fordelen, at de hurtigere kan se forbedringer. Vi kan også give dem bedre kvalitet, og så kommer den til at ensrette det, som kunderne ser. Jo mere præcist, jo mere værdi har det,” siger han.

”Vi er et sted, hvor vi samler data i så enorme mængder, at det ofte tager så lang tid for mennesker at analysere og opnå indsigt, at virkeligheden har ændret sig i mellemtiden, og indsigten er forældet,” tilføjer Mikkel Bernt Buchvardt.

”Machine Learning kan hjælpe os til at bryde data ned til noget, vi kan bruge til at træffe rettidige beslutninger baseret på. Det er sindssygt vigtigt, for vores aktuelle arbejde med Machine Learning kan vi bruge til at hjælpe vores kunder med på en lang række andre områder,” understreger han.

Data, IM & Analytics i KMD er da også i gang med en række andre projekter bygget på Machine Learning, som bliver rullet ud i løbet af 2018.