Impact story

Verbeter de wereld, begin bij data

In iedere organisatie valt of staat besluitvorming, bedrijfsvoering, dienstverlening en het bepalen van strategie met de juiste kwaliteit van de beschikbare data. Denk bijvoorbeeld aan hulpverleningsdiensten die zonder goede data in hun navigatiesysteem niet op tijd op de juiste locatie komen of een asset management organisatie die zonder goede data over hun assets niet een efficiënt onderhoudsplan kan maken. Wageningen Environmental Research ontwikkelt methodes om vanuit de gebruiker geredeneerd de kwaliteit van met name ruimtelijke data te controleren en te verbeteren.

Motivatie

Data is steeds vaker dé basis voor beslissingen en werkprocessen en dus wordt het belang van goede data kwaliteit steeds groter. De cruciale vraag is echter, wanneer is de kwaliteit van de data goed genoeg? De benodigde kwaliteit is namelijk sterk afhankelijk van het doel waarvoor het gebruikt wordt. Data kan heel goed bruikbaar zijn voor het uitvoeren van een scenariostudie om een beleidsoptie door te rekenen, terwijl dezelfde data niet geschikt is voor rechtsbesluiten. Dit noemen we “fitness for use”. Als de kwaliteit van data onvoldoende bekend is, dan is niet na te gaan in hoeverre data geschikt is om gebruikt te worden voor een bepaalde toepassing.

Een datagestuurde omgeving vraagt om de juiste datakwaliteit

Oplossing

Het is van groot belang om zowel data-experts als de gebruikers nauw te betrekken bij het opzetten en uitvoeren van een kwaliteitscontrole. Wageningen Environmental Research heeft hiervoor een methode ontwikkeld. Hierbij is het belangrijk dat de kwaliteitseisen relevant zijn voor het beoogde gebruik en in lijn zijn met wat de gebruiker belangrijk vindt. Samen met de gebruiker bepalen we op welke kwaliteitseisen gecheckt moet worden en wat de  voor die eisen de minimale normen zijn. Dit kunnen de gebruikelijke kwaliteitseisen zijn zoals nauwkeurigheid en compleetheid, maar soms kan bijvoorbeeld de reputatie van een leverancier van data ook van belang zijn. Als compleetheid als kwaliteitseis is afgesproken dan moet ook bepaald worden wanneer de data compleet genoeg is voor die specifieke toepassing; is dat bijvoorbeeld bij 80% of 99%? Tenslotte stellen we toetsen op per kwaliteitseis, zodat de kwaliteitscontroles uitgevoerd kunnen worden.

Impact en toekomstperspectief

Door het stimuleren van meervoudig gebruik van data zal de beoordeling van de 'fitness for use' steeds belangrijker worden bij het bepalen van datakwaliteit. Het gebruik van ruimtelijke data is echter heel divers en de kwaliteitsbeoordeling wordt daarom steeds complexer. De invulling van het begrip kwaliteit verschuift van datagericht naar contextbepaald. Daarmee verandert het van een absoluut begrip in een relatief begrip. Onze methode start vanuit een ander vertrekpunt, namelijk de gebruiker en het beoogde gebruik.

Het blijkt dat voor de gebruiker soms andere kwaliteitseisen belangrijker zijn dan de 'klassieke' kwaliteitseisen actualiteit, nauwkeurigheid, volledigheid en juistheid die onderzoekers in hun datakwaliteitsonderzoeken meestal gebruiken. De empirische benadering in onze methode geeft gebruikers de kans om het kwaliteitsonderzoek te laten matchen met hun eigen waarden en ideeën over kwaliteit. De methode draagt bij aan meer inzicht over de kwaliteit van de data zoals het nu is, maar schept ook perspectief voor verbeteringen.