Meteen naar de inhoud

Database Verrijking / Database Opschoning

Wat is data verrijken?


Data verrijken wordt gedefinieerd als het samenvoegen van gegevens van derden uit een externe gezaghebbende bron met een bestaande database van eerste-partij klantgegevens. Merken doen dit om de gegevens die ze al bezitten te verbeteren, zodat ze beter geïnformeerde beslissingen kunnen nemen. Alle klantgegevens, ongeacht de bron, beginnen in hun ruwe vorm. Wanneer deze verzamelde gegevens in een centrale gegevensbank terechtkomen, worden ze vaak in discrete datasets in het systeem opgenomen. Vaak worden de gegevens dan gedumpt in een data lake, of een datamoeras, vol ruwe informatie die vaak niet bruikbaar is buiten nauwe contexten.

Voordat een bedrijf aan dataverrijking gaat doen, moet het ervoor zorgen dat de klantgegevens een zodanige vorm en kwaliteit hebben dat ze voldoen aan de bedrijfsbehoeften voor ruwe gegevens, bijvoorbeeld door middel van data cleansing services om gegevens schoon te maken, te normaliseren en te standaardiseren.

Dataverrijking maakt deze ruwe gegevens bruikbaarder. Door gegevens van een derde partij toe te voegen, krijgen merken meer inzicht in het leven van hun klanten. De resulterende verrijkte gegevens zijn rijker en gedetailleerder, waardoor merken hun berichtgeving gemakkelijker kunnen personaliseren omdat ze meer over hun klanten weten. Sterke dataverrijkingsprocessen zijn een belangrijk onderdeel van het opbouwen van het gouden klantendossier. Eén dataset alleen, hoe gedetailleerd ook, bevat niet alle gedrags- of transactiegegevens die nodig zijn om een volledig beeld van de klant te krijgen. Daarom zijn praktijken voor dataverrijking van vitaal belang voor de langetermijndoelstelling van marketing om gepersonaliseerde ervaringen te leveren.

Twee soorten dataverrijking


Er zijn evenveel soorten dataverrijking als er bronnen zijn om gegevens uit te halen, maar twee van de meest voorkomende zijn:

Demografische dataverrijking:

Bij demografische dataverrijking worden nieuwe demografische gegevens, zoals burgerlijke staat en inkomensniveau, verkregen en toegevoegd aan een bestaande klantdataset. De soorten demografische gegevens zijn enorm, net als de bronnen. U kunt een dataset krijgen met het aantal kinderen, het type auto, de mediaan van de woningwaarde, enzovoort. Wat telt bij demografische verrijking is wat uw einddoel is. Als u bijvoorbeeld kredietkaartaanbiedingen wilt doen, kunt u een database verwerven die de kredietwaardigheid van een persoon weergeeft. Gegevens die op deze manier zijn verrijkt, kunnen worden gebruikt om de doelgerichtheid van marketingaanbiedingen in het algemeen te verbeteren, wat van vitaal belang is in een tijdperk waarin gepersonaliseerde marketing hoogtij viert.


Geografische gegevensverrijking:

Geografische dataverrijking houdt in dat postgegevens of lengte- en breedtegraden worden toegevoegd aan een bestaande dataset die adressen van klanten bevat. Er zijn een aantal aanbieders die u in staat stellen deze gegevens te kopen, waaronder postcodes, geografische grenzen tussen steden en dorpen, cartografische inzichten, enzovoort. Het toevoegen van dit soort inzicht in uw gegevens is nuttig in een paar contexten. Detailhandelaren zouden geografisch verrijkte gegevens kunnen gebruiken om hun volgende winkellocatie te bepalen. Als de retailer de meeste klanten wil binnenhalen binnen een bepaalde straal, bijvoorbeeld 30 mijl, kan hij zijn verrijkte gegevens gebruiken om die beslissing te nemen. Marketeers zouden geografische verrijking ook kunnen gebruiken om te besparen op bulkmailings van direct mail.
Hoe kunt u gegevensverrijking bereiken om een nauwkeurig, bijgewerkt gouden klantenbestand op te bouwen? Data cleansing services om klantgegevens te cleanen, normaliseren en standaardiseren is één component van succesvolle dataverrijking. Twee andere belangrijke componenten zijn dataverrijkingsdiensten en dataverrijkingstools.

Een dataverrijkingsservice is een middel om interne of externe componenten op te roepen om een bepaalde vorm van verrijking uit te voeren. Een voorbeeld hiervan is een adresvalidatie-/verificatieservice. Leveranciers kunnen ook een negencijferige postcode en geografische coderingsinformatie verstrekken voor een gedetailleerder begrip van een specifiek adres. Een meer gedetailleerd inzicht in demografische informatie is een andere veel voorkomende reden voor een extern beroep op een dataverrijkingsdienst, zoals een beroep op Axciom of Experian met een klantnaam om meer informatie te krijgen over vroegere koopgewoonten, totaal inkomen, demografische voorkeuren, enz.

Dataverrijkingstools worden gebruikt in dataverrijkingsprocessen om dingen te doen zoals het maken van interne berekeningen van de customer lifetime value (CLV) door het optellen van transacties, of het berekenen van de neiging van klanten tot churn en ander gedrag. Het bepalen of een klant een churn-risico of een hoogwaardige klant is, bijvoorbeeld, heeft duidelijke waarde als dataverrijkingstool door inzichten te verschaffen uit ruwe gegevens – in veel of de meeste gevallen met behulp van machine learning om berekeningen op schaal te maken.

Elke vorm van gegevensverrijking is geldig, afhankelijk van uw bedrijfsdoelstellingen. Wat belangrijk is, is het identificeren van het soort gegevens dat u moet zoeken en verzamelen of verwerven om een positieve oplossing te krijgen. Een woord van voorzichtigheid echter. Telkens wanneer u gegevens van derden verwerft of probeert twee datasets van de eerste partij te matchen, moet er een gemeenschappelijke factor zijn die de twee datasets met elkaar verbindt.

Voor anonieme klanten kan dit een apparaat-ID zijn die een mobiel apparaat of een desktopcomputer aangeeft. Voor bekende klanten kan dit een voor- en achternaam of een postadres zijn. Zelfs een e-mailadres kan als identifier worden gebruikt om twee verschillende datasets te matchen en samen te voegen. Anders wordt de oorspronkelijke dataset niet verrijkt omdat er niets is dat aantoont dat de twee datasets betrekking hebben op dezelfde klanten.

Het proces van gegevensverrijking gaande houden
Net als elk ander aspect van gegevensbeheer, is gegevensverrijking niet iets wat u één keer kunt doen en daarna nooit meer. Klantgegevens, hoe gedetailleerd ook, zijn in wezen een momentopname in de tijd. Inkomensniveaus stijgen en dalen, de burgerlijke staat kan veranderen, en het type auto en het fysieke adres kunnen veranderen. Zelfs namen kunnen veranderen, vooral als iemands burgerlijke staat verandert.

Gezien de mogelijkheid van al deze veranderingen, moeten gegevensverrijkingstools en -processen op continue basis draaien. Het alternatief is verouderde informatie die ertoe kan leiden dat klanten irrelevante aanbiedingen krijgen omdat uw gegevens zes maanden verouderd zijn. Het bijhouden van al deze informatie is een titanische onderneming, vooral voor grotere databases, dus het is geen verrassing dat meer dan 50 procent van de bedrijven meer tijd besteedt aan het opschonen van gegevens dan aan het gebruik ervan.

De tijd die het kost om gegevens up-to-date te houden, is een sterk argument om het proces te automatiseren. Machine learning-algoritmen die continu worden uitgevoerd, kunnen het proces van gegevensverrijking aanzienlijk stroomlijnen omdat ze records veel sneller kunnen matchen en samenvoegen dan een menselijke data steward. Dit leidt tot een dataverrijkingsproces dat 24 uur per dag, zeven dagen per week draait en resulteert in gegevens die altijd zo actueel mogelijk zijn. Uiteindelijk stelt dit merken in staat om een hoog niveau van verrijking te handhaven en het proces in realtime in beweging te houden om de klantbetrokkenheid te verbeteren.

Een goed functionerend dataverrijkingsproces is essentieel voor een modern merk. Het up-to-date houden van data zorgt ervoor dat het merk zich nauwkeuriger kan richten op consumenten, of dit nu geografisch is voor het plaatsen van een nieuwe winkel of demografisch voor het rijker targeten van de volgende beste aanbiedingen. Nauwkeuriger targeting leidt tot betere ervaringen, wat onvermijdelijk meer gegevens oplevert en ervoor zorgt dat u kunt blijven werken met de meest actuele klantgegevens die mogelijk zijn.