Advanced Analytics

<

Machine Learning og Avanceret Prædiktiv Analyse

Machine Learning (ML) er det seneste ’buzzword’ inden for en række begreber, som dækker over stort set det samme, nemlig data mining, artificial intelligence, deep learning, mønstergenkendelse og statistisk prædiktiv analyse. Machine learning-processen indeholder forskellige faser, hvor Innofactors udviklingsmodel for ML indeholder syv:

Business case: Det er selvfølgelig vigtigt at overveje, om et ML-projekts omkostninger står mål med chancen for succes og den potentielle gevinst. Via Innofactors brede erfaring med ML har vi set mange ML-projekter, og kan derfor rådgive om, hvilke business cases, der er mest lovende.

Problemformulering: Mange, der begynder at arbejde med ML opdager, at det er svært at få formuleret et spørgsmål ud fra de tilgængelige data. Hvilke rækker og søjler kan man have med i sit træningsdatasæt, så man ikke bruger oplysninger fra et tidspunkt efter hændelsen er indtruffet?

Dataforberedelse: Denne del af processen er helt central for, hvor effektivt og hurtigt resten af ML-processen kommer til at forløbe, og det meste af tiden bruges i denne fase. Bearbejdningen af data sørger for, at data kombineres til ét datasæt med en fornuftig balance mellem forskellige udfald, uden for mange blanke felter, det rigtige antal variable etc.

Modeltræning: Med et datasæt kan modelleringsværktøjet undersøge, om der er forskel på populationerne (snydere/ikke-snydere, frafaldere/ikke-frafaldere, maskinnedbrud/ikke-nedbrud). Moderne værktøjer som Azure Machine Learning kan hurtigt og med utrolig lidt justering fra brugeren finde gode systemer. Med det genkendte system kan man forespørge på sager, der ikke var en del af træningsdata, og hvor man endnu ikke ved, hvilken population, de tilhører.

Model evaluering: Ved træning af modellen kan man tilbageholde en del af træningsdatasættet. Da man kender det sande udfald, kan man bede modellen komme med sit estimat og således sammenholde dette med sandheden fra træningsdata. Dette kan bruges til at undersøge, hvor god den trænede model er til at lave forudsigelser. Dette er et vigtigt redskab til, at overbevise forretningsbrugere, ledere, tilsyn, presse og lignende om, at ML-modeller er et godt redskab i hvert enkelt domæne. Det er vigtigt både at validere modellen før man begynder at anvende den, men også løbende.

Implementering: Modellen skal anvendes så nye sager kan tildeles en estimeret værdi eller population (sagerne skal scores). Dette gøres ved, at lægge den på en server. I Azure Machine Learning sættes den nemt op, så den kan kaldes via en web-service.

Uddannelse: Modellen skal kunne anvendes af slutbrugerne, der skal kunne forstå, hvad sandsynlighederne betyder. Desuden skal nogen fra organisationen kunne vedligeholde og videreudvikle modellen.

Innofactor tilbyder

Innofactor kan være behjælpelig med ML-processen fra start til slut:

  • Undersøgelse af bedste business cases, der bedst egner sig til ML.
  • Udvikling af træningsdata eller kravspecifikation til IT- eller BI-afdelingen.
  • Modeltræning og validering. Opsætning af værktøjer.
  • Uddannelse af modeludviklere, så jeres organisation kan vedligeholde og (videre-)udvikle modellerne.

*Alle modeller, kode, metoder etc. ejes af jer.

Interesseret i at vide mere?

Kontakt os og få booket et uforpligtende møde og hør mere om, hvad vi kan gøre for din virksomhed!