Onderstaand artikel verscheen in het oktober 2008 nummer van Adforesult en werd geschreven door Bart Clement & Bram van Essen. Het volledige artikel in pdf is hier te downloaden.

Offline wordt het gedrag van klanten al jaren met grote nauwkeurigheid voorspeld en wordt per klant vaak real-time de beste aanbieding doorgerekend. De voorspellingen zijn gebaseerd op grote hoeveelheden gedragsgegevens, contactgegevens, productgegevens en persoonsgegevens van klanten. Deze schijnbaar onoverzichtelijke bron wordt behapbaar gemaakt door toepassing van datamining technieken die patronen en profielen kunnen opsporen in de gegevens.

Ondanks dat het online kanaal al jaren een kanaal is waar enorm veel interactie met de klant plaatsvindt, worden de gegevens die online het gedrag van klanten beschrijven nog steeds niet gebruikt ten behoeve van analyses en geintegreerde marketing. De traditionele statistische technieken om klantgedrag en klantbehoeften te voorspellen zijn echter, onder enkele voorwaarden, ook geschikt om toe te passen op online klantgegevens. In dit artikel laten we aan de hand van voorbeelden zien hoe datamining technieken ook succesvol binnen online marketing kunnen worden ingezet, en geven we aan hoe je als organisatie een vliegende start kan maken met datamining.

Wat is datamining?
Datamining is het toepassen van statistische algoritmen om (verborgen) structuren en patronen in grote databestanden te vinden. Voorbeelden in de marketing zijn het vinden van klanten die met een grote mate van waarschijnlijkheid zullen reageren op een direct mail-actie of het segmenteren van een klantenbestand aan de hand van hun waarschijnlijkheid om op te zeggen en zo input te krijgen voor behoudsactie.

Werkwijze
Het dataminingproces is grofweg in 3 fases in te delen:
1. Definieren datamining vraag
Het kiezen van een geschikte datamining vraag is een belangrijke stap omdat dit de methode van analyse en de richting van de uitkomsten van de analyse bepaalt. Een miningvraag kan zijn: Welk gedrag vertonen bezoekers op de website vlak voordat ze een abonnement opzeggen, zodat je potentiele opzeggers op tijd kunt benaderen, of welke producten kan ik het beste aanbieden aan klanten die recent een doorlopende reisverzekering hebben afgesloten?

2. Kiezen van de juiste datamining techniek.
De tweede stap in het dataminingproces betreft de keuze van de juiste datamining techniek. Iedere datamining techniek heeft specifieke voor- en nadelen. Zo zal de ene techniek wellicht tot betere voorspellingen leiden, terwijl een andere techniek juist beter interpreteerbaar en uitlegbaar is.

3. Samenstellen dataminingtabel,
Deze stap is een belangrijke en zal verreweg de meeste tijd in beslag nemen (tot wel 80%). Allereerst dient de dataminingtabel op het juiste niveau te worden samengesteld. Meestal zul je klantgedrag willen voorspellen en zul je dus je miningtabel op klantniveau moeten samenstellen. Vervolgens moet de miningtabel worden aangevuld met variabelen die mogelijk een verband (correlatie) met de dataminingvraag kunnen hebben. Dit kunnen transactiegegevens, productbezit gegevens en klantcontactgegevens zijn, maar ook samengetrokken variabelen zoals klantwaarde of kanaalpreferentie per klant.

Het samenstellen van een geschikte miningtabel (op Internet gegevens) is tot op heden vaak een probleem geweest. De meeste webanalytics pakketten leggen gegevens namelijk op sessieniveau vast en rapporteren ook op sessieniveau. Omdat we met datamining meestal uitspraken doen over behoefte en gedrag van klanten dient de mining tabel meestal ook op klantniveau te worden opgesteld en zal er dus in het onderliggende datamodel van de webanalytics pakketten nog een aggregatie van sessienoveau naar klantniveau moeten plaatsvinden.

Toepassingen op online klantgegevens

In het grote scala aan statistische technieken en algoritmes onderscheiden wij de volgende drie groepen datamining technieken die zich het best lenen voor online analyses:

  1. Associatieve technieken
  2. Technieken waarbij de te voorspellen variabele een binaire variabele is
  3. Technieken waarbij de te voorspellen variabele een continue variabele is.

Ad 1. Associatieve technieken
Associatieve technieken zijn de meest bekende vorm van datamining. Dit zijn technieken waarmee overeenkomsten binnen groepen en juist verschillen tussen verschillende groepen kunnen worden gebaseerd op geselecteerde variabelen. Bij associatieve technieken wordt datamining gebruikt om associaties en verbanden te leggen zonder dat er een doelvariabele is. Voorbeelden van dergelijke technieken zijn de clusteranalyse en de apriori analyse.

A) Clusteranalyse
Clusteranalyse is vooral bekend uit marktonderzoek en wordt veel ingezet voor klantsegmentatieonderzoeken. Het doel van de analyse is niet het voorspellen van klantgedrag, maar het zoeken naar een beperkt aantal homogene groepen die onderling sterk verschillen. Online kan deze techniek heel goed worden ingezet om websitebezoek te segmenteren. Onderstaand voorbeeld laat dat zien.

Case 1: Een aanbieder van vakantiereizen segmenteert websitebezoek
Een grote aanbieder van vakantiereizen wilde achterhalen wat bezoekers op de website doen. Om hier inzicht in te krijgen is een clusteranalyse uitgevoerd, waarbij alle sessies over de laatste maand zijn meegenomen. Uit de clusteranalyse blijkt dat de volgende groepen sessies bestaan:

  • Korte sessies waarbij slechts op de aanbiedingen werd gefocussed, de zogenaamde ‘pricehunters’
  • Extreem korte sessies, waarin slechts 1 of 2 pagina;s zijn bekeken, zogenaamd ‘verkeerd verbonden’
  • Lange sessies die zich verspreiden over de gehele website, de zogenaamde orientatiesessie
  • Middellange sessie waarbij de manier van boeken wordt onderzocht door de bezoekers, de zogenaamde ‘boekingsvoorbereiding-sessie’
  • Korte sessie waarin de aanbiedingen worden bekeken en de boekingsmodule wordt doorgelopen, meestal eindigend in een boeking, de zogenaamde ‘boekers’.

Een nieuwe clusteranalyse op klantniveau liet zien dat deze verschillende sessies door alle klanten kunnen worden toegepast, en afhankelijk zijn van de fase van het beslisproces waarin de klant zich bevindt. Dit inzicht werd gebruikt om een nieuwe indeling van de website vorm te geven waarbij elk van deze type sessies optimaal werd ondersteund, met andere woorden, de bezoeker werd gefaciliteerd in het behalen van zijn of haar doelen op de website.

B) Apriori analyse technieken
De apriori techniek is uitermate geschikt om transactie data mee te analyseren. De basket analyse is hiervan het bekendste voorbeeld. Binnen (offline) retail is deze techniek veel ingezet om te bepalen welke artikelen veel samen worden gekocht om zo de winkel optimaal in te richten (zodat bier en zoutjes in hetzelfde schap staan). In online retail zijn de mogelijkheden van deze techniek nog vele malen groter, omdat je online geen last hebt van fysieke beperkingen.

Een bekend en succesvol online voorbeeld van toepassing van apriori datamining is Amazon. Door uitgebreide analyse van transactiedata wordt bij ieder product een extra suggestie gegeven (’mensen die dit boek kochten, hebben ook dit boek aangeschaft’).

Ad 2. De doelvariabele is een binaire variabele
Voorbeelden van miningvragen waarbij de doelvariabele een binaire variable is, is het voorspellen van de kans op weglopen. De doelvariabel is in dit geval wegloop (ja/nee). In dit geval zijn technieken als logistische regressie, kansbomen en neurale netwerken geschikte algoritmen.

Case 2: Een uitgeverij voorspelt kans op opzeggen van een abonnement
Een uitgever van een dagblad heeft de laatste jaren steeds meer moeite om abonnees te behouden. Om de uitstroom te verlagen wil de uitgever graag tevoren weten welke abonnees een verhoogde kans hebben om de krant op te zeggen. Hiervoor wordt een churnmodel ontwikkeld. Veel van haar klanten maken gebruik van de website van het dagblad om op de hoogte te blijven van het laatste nieuws. Gemiddeld wordt de website ongeveer drie keer per dag bekeken. Op internet zijn voor abonnees extra diensten gratis beschikbaar gesteld. Hiervoor moet wel op de site worden ingelogd, waardoor bekend is wie, wanneer, hoe vaak en wat op de site bezoekt. Deze gegevens kunnen worden gebruikt om opzeggers te voorspellen.

Er is een miningtabel opgesteld met alle klanten die in de afgelopen 3 maanden hebben opgezegd. Vervolgens wordt een model gemaakt om te voorspellen welke klanten een hoge kans hebben om hun abonnement op te zeggen. Hieruit blijkt dat weglopers in de maand voordat zij opzeggen meerdere keren de contactpagina met de algemene voorwaarden bekijken.

Klanten die hetzelfde gedrag gaan vertonen als de opzeggers, en dus een risicogroep zijn, komen nu in een aparte retentiegroep terecht waar extra marketing middelen worden ingezet om de klant alsnog te bewegen het abonnement te verlengen.

Ad 3. De doelvariabele is een continue variabele
Voorbeelden van miningvragen waarbij de doelvariabele een continue variabele is, zijn het voorspellen van de hoogte van de verwachte omzet per klant voor specifieke online marketing campagnes. In dit geval is de doelvariabele de omzet per klant, en deze kan een onbeperkt aantal waarden aannemen.

Advies
Zoals we hebben laten zien in de voorbeelden kan datamining ook succesvol worden toegepast op webdata en zijn de inzichten die je ermee kunt verwerven van grote waarde. Investeer echter niet meteen veel geld in systemen en tooling, maar begin klein.

Webanalytics is voor veel organisaties nog relatief nieuw. Richt je eerst op de (quick) wins die met webanalytics te bereiken zijn. Als dat proces onder de knie is, kun je als bedrijf eens naar datamining gaan kijken. Neem eens een steekproef uit je webdata en probeer daar een mining table van te maken. Levert dit nieuwe inzichten op, dan kun je hiermee verder gaan.

De praktijk leert dat organisaties vaak nog niet klaar zijn voor structurele datamining op internet gegevens zoals dit voor offline direct marketing al wel is ingebakken in organisaties. Het advies is dan ook om bij deze afdelingen aansluiting te zoeken en langzaam het webkanaal te ontsluiten en onderdeel te maken van het offline datawarehouse. Online marketing hoeft in dit geval niet opnieuw het wiel uit te vinden, maar kan snel de inhaalslag maken en profiteren van het voorbereidende werk van databasemarketing in de afgelopen 20 jaar.

Tags: ,
Plaats een reactie