blije klanten
Datamining: Technieken en toepassing
Datamining is een combinatie van de woorden ‘data’ en ‘mining’. Bij data gaat het over informatie. Vaak zijn het cijfers, maar het kunnen ook woorden of afbeeldingen zijn. Bij het Engelse woord mining gaat het over graven en delven. De combinatie betekent dan ook het graven naar grote hoeveelheden data. Hiermee kan je patronen herkennen en inzichten verkrijgen over de processen. Het gaat bij datamining dus niet over het verkrijgen van de data, maar het verkrijgen van inzichten over die data.
Technieken
Voor datamining zijn er verschillend technieken. Een paar veelgebruikte varianten vind je hieronder:
- Classificeren: de data rangschikken in groepen. Bijvoorbeeld het indelen van klanttevredenheid over een dienst of product in de groepen laag, midden en hoog.
- Clusteren: de groepen indelen aan de hand van overeenkomende eigenschappen. Bijvoorbeeld de vraag ‘wat is de gemiddelde levensverwachting van mannen ten opzichte van vrouwen?’. Je maakt hier onderscheid tussen twee groepen, en er is een significant verschil te zien tussen de levensverwachting van de groepen.
- Regressie: hier ga je kijken welke variabelen invloed hebben op een gekozen factor. Denk aan dat je gewicht afhankelijk is van onder andere hoeveel calorieën je binnen krijgt en hoeveel je er verbrand.
- Patronen herkennen: kijken naar de patronen er zichtbaar zijn over verloop van tijd. Zo is een patroon bij Bureau Tromp bijvoorbeeld dat deelnemers zich vooral in het voor- en najaar en minder in de zomerperiode.
- Outlier-detectie: zoeken naar verklaringen voor (onverwachte) uitschieters in de dataset. Bijvoorbeeld als je merkt dat de broden bij de supermarkt opeens veel duurder zijn dan normaal. Na een onderzoek blijkt de bakker om de hoek gesloten te zijn, waardoor alle klanten hun broden bij de supermarkt zijn gaan halen.
- Voorspellen: aan de hand van de technieken hierboven, kan je ook meer zeggen over de toekomst. Als er elk jaar minder aanmeldingen zijn in de zomer, kan je hier rekening mee houden voor de volgende jaren. Wel belangrijk hier is dat je nooit met 100% zekerheid iets kunt voorspellen, je hebt altijd te maken met een foutmarge.
Hoe pas je datamining toe?
Voordat je met bovenstaande technieken aan de slag kunt gaan op je dataset, moet je wat voorbereidende stappen nemen. In het kort ziet het proces van datamining er zo uit:
- Extract data: verzamelen van bruikbare en relevante data. De data moet van goede kwaliteit zijn en je moet de juiste interpretatie kennen.
- Store and manage data: sla de data uit stap één in een database die door analisten gebruikt kunnen worden.
- Analyse data: het analyseren van de data. Hiervoor zijn de technieken hierboven geschikt om de relevante informatie uit de data te verkrijgen.
- Present and share data: presenteer de data op een aantrekkelijke en duidelijke manier met visualisaties. Het kan nog een grote uitdaging zijn om de data zo te presenteren dat deze ook goed aankomt bij hen die er iets mee kunnen.
Volg een datamining training bij Bureau Tromp
Dit artikel is slechts een klein onderdeel van hoe je aan de slag gaat met datamining. Als je meer wilt weten om er zelf mee aan de slag te gaan, volg dan de Process Mining Training bij Bureau Tromp.