Lees meer over: Data & Digitalisering of Datagedreven werken


De valkuilen van Data & Analytics in zeven spreekwoorden

Big data, datamining, deep learning, data science, AI; of het nu om marketing, procesoptimalisatie, diagnoses of DNA-onderzoek gaat, voor alle vraagstukken lijken slimme analysetechnieken dé oplossing. Voorspellingen over de bloeiende markt voor data science en het grote gebrek aan analisten vliegen je om de oren. Maar hoe ga je slim om met deze hype, en haal je écht waarde uit data door de valkuilen te vermijden?


“Zoekt en gij zult vinden”

Start altijd met een concrete businessvraag. Het klinkt heel mooi om “data te laten spreken”. Met zoveel data en analysetechnieken – waarom niet gewoon wat proberen? Omdat statistisch gezien je altijd verbanden zal vinden in data, maar die hoeven niets te betekenen. Bovendien heb je zonder businessvraag geen idee welke data relevant is. Start liever met een concrete vraag als “Hoe kan ik meer winstgevende nieuwe klanten trekken”, “Hoe verlaag ik de kosten van dit klantproces” of “Hoe ontdek ik fraude”. Hoe specifieker, hoe beter. Die concrete vraag vormt dan de leidraad in je analyseproces en dataverzameling.


“De mens leeft niet bij brood alleen”

Een data scientist kan het niet alleen. Om een concrete businessvraag goed op te lossen is meer nodig dan kennis van analysemethoden en -technieken. Er is veel domeinkennis nodig, kennis over het concrete klantproces, marketingvraagstuk of fraudegebied dat je op wil lossen. Deze kennis helpt om de juiste data te verzamelen en de juiste vragen aan de data te stellen. Dagelijkse samenwerking in multidisciplinaire teams is een goede manier om dit te realiseren.


“Eén ei is geen ei…”

Weet wat je doet. Kan je analysevragen oplossen zonder data analist? Je zou het bijna denken, voorspelmodellen zijn tegenwoordig in een handomdraai gemaakt. Maar … fouten nog veel sneller! Er kan veel misgaan in een analyseproces. Een perfect resultaat bijvoorbeeld is voor een goede analist juist reden tot zorg. Want als je 100% correct kan voorspellen welke klanten weg zullen lopen, heb je waarschijnlijk last van zelf verstopte paaseieren. Dat wil zeggen dat je per ongeluk een gegeven hebt meegenomen in je model dat één op één verband heeft met wat je wil voorspellen. Dit verband kan soms  goed verstopt zitten, bijvoorbeeld een gegeven dat in het exitgesprek met klanten wordt genoteerd. Een goede analist kijkt kritisch naar het resultaat, checkt het bij domeinexperts, toetst de afhankelijkheden en verifieert de resultaten met andere bronnen.


“In de beperking toont zich de meester”

Begin klein. Hé, we hebben het toch juist over big data? Jazeker, maar succes met big data heb je pas als je goed kan kiezen. Begin met de concrete businessvraag en pak je project klein en iteratief aan. Begin met makkelijk verkrijgbare data en eenvoudige technieken en kijk of je daarmee al een deel van de vraag kan beantwoorden. Check je resultaten bij domeinkenners en voeg meer data en technieken alleen toe als het nodig is.


“Wie schrijft die blijft”

Documenteren is cruciaal. In het proces van businessvraag naar analyse-antwoord doe je aannames, bouw je domeinkennis op, maak je keuzes voor databronnen, technieken etc. Als je 3 of 6 maanden later de analyse wil herhalen, ben je het meeste weer glad vergeten. De keuzes in het analyseproces bepalen ook wanneer het model toepasbaar is, en wanneer niet. Bijvoorbeeld een model dat is ontwikkeld voor consumentenklanten, kan niet zomaar worden toegepast op zakelijke klanten. Zonder documenteren leren jij en anderen niets van dit hele proces, en moet je bij een volgende vraag weer helemaal opnieuw beginnen. Zonde!


“Met passen en meten wordt de meeste tijd versleten”

Datapreparatie kost tijd. Datapreparatie is het minst sexy en tegelijk het meest succesbepalende onderdeel van het analyseproces. Gemiddeld gaat meer dan 80% van de tijd hieraan op. Voor de voorspelkracht van modellen zijn de keuzes in datapreparatie veel bepalender dan de keuzes in modelleertechnieken. In deze fase is het gebruik van domeinkennis cruciaal.


“Je kunt geen ijzer met handen breken”

Data geeft niet altijd antwoord op je echte vraag. Soms is er simpelweg te weinig informatie om een probleem met data-analyse te kunnen beantwoorden. Soms vind je wel duidelijke verbanden in data, maar begrijp je nog niet waarom dat zo is. Je weet bijvoorbeeld dat klanten in een bepaalde regio sneller jouw dienst opzeggen. Maar pas als je weet waarom ze dit doen, kun je proberen die klanten te behouden. De kennis uit data kan dan aangevuld worden met bijvoorbeeld marktonderzoek.


 

Bovenstaande tips zijn gebaseerd op 25 jaar praktische ervaring met data en analyse. Wil je meer weten over het omzetten van data in waarde voor jouw organisatie? Neem dan contact met mij op via de gegevens links.