BLOG: Prof. dr. ir. Arnold Bregt over datakwaliteit

Het streven is om in elke nieuwsbrief van het Alterra expertisecentrum Kwaliteit van Ruimtelijke Data een opinie over het belang van datakwaliteit te publiceren. Deze keer stelden we onze drie standaardvragen aan prof. dr. ir. Arnold Bregt van Wageningen University, Laboratorium voor Geo-informatiekunde en Remote Sensing.

  1. Weet u van een geval (een dataset? Een organisatie?) waarbij (het gebrek aan) datakwaliteit heeft geleid tot problemen?
  2. Ziet u trends op het gebied van datakwaliteit?
  3. Als u €1.000.000 aan datakwaliteit mocht besteden, wat zou u dan als eerste doen?

Weet u van een geval (een dataset? Een organisatie?) waarbij (het gebrek aan) datakwaliteit heeft geleid tot problemen?

Voorbeeld

Een probleem met datakwaliteit? Nou, een mooi voorbeeld van een probleem met datakwaliteit was een paar jaar geleden de poging van Apple om een eigen versie van Google Maps op de markt te brengen. Met veel bombarie werd in 2012 Apple Maps gelanceerd, maar al gauw bleek dat het niet goed zat. De gebruikers kregen verkeerde navigatie-aanwijzingen. Apple, doorgaans duur maar goed, sloeg toen de plank behoorlijk mis. Dat was niet alleen vervelend voor de gebruikers. Ook Apple’s imago liep daarbij een deuk op.

De trend die ik zie is dat datakwaliteit voorheen nogal op de data zelf gericht was. Compleetheid, actualiteit, nauwkeurigheid, de bekende kwaliteitskenmerken. Dat is aan het verschuiven naar “fitness for use”. Gaandeweg komt er meer aandacht voor het gebruiksaspect. Dat betekent wel dat datakwaliteit een relatief begrip in plaats van een absoluut begrip wordt en dat maakt het moeilijker te hanteren. Deze verschuiving gaat niet erg snel, want datakwaliteit was vooral iets voor geodeten en die zijn juist erg op de data gericht, maar zo langzamerhand wordt de belangstelling breder en verschuift het. Ik heb er een heel aardig boekje over liggen uit 2012: Fundamentals of Spatial Data Quality, door Devillers & Jeansoulin. Jammer genoeg wordt dat nog niet zo nagevolgd.

Als u €1.000.000 aan datakwaliteit mocht besteden, wat zou u dan als eerste doen?

Een miljoen besteden

Als ik dat geld beschikbaar had zou ik direct 2 promovendi aanstellen. De ene zou zich moeten richten op de kwaliteit van ruimtelijke data bij het gebruik ervan in een bepaald domein. Welke eisen aan de data stelt dat gebruik? De andere promovendus moet aan de gang met de communicatie over datakwaliteit. Want dat moet beter.
Daarnaast zou ik een populair boekje of een website laten samenstellen, mooi vormgegeven. Zou moeten gaan over, laten we zeggen, “documented effects of spatial data quality”. Dus over praktijkgevallen van mensen en data in diverse landen. Want het is natuurlijk een internationaal onderwerp. Er is zelfs net een nieuwe ISO norm uitgekomen (ISO 19157:2013 Geographic information -- Data quality).
De rest van het geld zou ik besteden aan een klein project om te laten zien hoe je de kwaliteit in een aantal gevallen echt kan verbeteren, bijvoorbeeld door betere communicatie.