Nieuws

De Staat van Landbouw, Natuur en Voedsel: Wagenings huzarenstukje in datamanagement

Gepubliceerd op
30 november 2022

Wie alles wil weten over hoe landbouw, natuur en voedsel ervoor staan in Nederland, hoeft voortaan nog maar één website te raadplegen. Het portaal De Staat van Landbouw, Natuur en Voedsel maakt kerncijfers over diverse onderwerpen inzichtelijk: van stikstof, klimaat en handel tot weidevogels en voedselverspilling. Achter deze cijfers gaat een groot aantal databronnen schuil. Bijzonder: de data uit al deze bronnen zijn bijeengebracht, geharmoniseerd en gevalideerd dankzij één data science-oplossing: het datawarehouse van Wageningen University & Research.

Stel, je bent als beleidsadviseur, Tweede Kamerlid of onderzoeker op zoek naar betrouwbare informatie over het agrofooddomein. Je wilt bijvoorbeeld weten hoe het zit met de ammoniakuitstoot van de verschillende veehouderijsystemen. Om in dit soort behoeften te kunnen voorzien, is goed datamanagement cruciaal.

Wageningen University & Research heeft de afgelopen jaren fors geïnvesteerd om sneller en beter in de behoefte aan domeininformatie te kunnen voorzien en om deze beschikbare data uit verschillende bronnen bovendien op één centrale plek te beheren: het datawarehouse. Kennis over data, die voorheen decentraal was opgeslagen, is nu direct bij die data te vinden; een cruciale voorwaarde om verschillende databronnen te kunnen combineren. De Staat van Landbouw, Natuur en Voedsel is de nieuwste toepassing die hierop is gebaseerd. In een paar klikken selecteer je als gebruiker de relevante datasets en grafieken en word je verwezen naar andere plekken waar informatie over dit onderwerp te vinden is.

Publieke en WUR-data

Het datawarehouse is gevuld met informatie over alles wat met landbouw, voedsel en natuur te maken heeft. Voor een deel zijn het data verzameld of geproduceerd door Wageningen University & Research zelf. Het kan ook gaan om data van derden, al dan niet publiek. “Experts binnen het groene domein met verstand van datamanagement hebben hun kennis van al die data beschreven”, zegt Mark Dolman, product owner datamanagement bij Wageningen Economic Research.

Experts binnen het groene domein met verstand van datamanagement hebben hun kennis van al die data beschreven. Doordat we die informatie nu opslaan, kunnen we de juiste combinaties met andere bronnen maken en waardevolle validatieregels toevoegen.
Mark Dolman, product owner datamanagement

“Deze ‘metadata’ maken het mogelijk om datasets te combineren, afhankelijk van de indicatoren waar je als gebruiker naar op zoek bent. Een feit in een willekeurige databron over ‘30 ton perspulp’ krijgt pas betekenis als je weet dat het gaat om gedroogde bietenperspulp van een bepaald bedrijf in een bepaald jaar. Deels zit die informatie wel in de bron, maar dit soort belangrijke informatie is vaak niet expliciet vermeld. Die informatie is cruciaal om data te valideren en de juiste conclusies te kunnen trekken. Het maakt bijvoorbeeld voor je milieu-impact heel veel uit of het gedroogd of vochtig is en of de pulp van bieten of van andere gewassen afkomstig is. Doordat we die informatie nu opslaan, kunnen we de juiste combinaties met andere bronnen maken en waardevolle validatieregels toevoegen.”

Gebruiksvriendelijk beschreven

Doordat de data heel gebruiksvriendelijk zijn beschreven, hoef je als gebruiker volgens Dolman geen expert te zijn om het datawarehouse te doorzoeken: “Alle data zijn te vertalen naar indicatoren en figuren zoals je die op de Staat van Landbouw, Natuur en Voedsel aantreft: van productie- en consumptiedata tot mineralenkringlopen, antibioticagebruik en broeikasemissies. Op de website zie je precies welke onderdelen je kunt selecteren. Doordat alle databronnen eenduidig beschreven zijn, kun je als gebruiker zelf een product op maat samenstellen, zoals de Staat van Landbouw, Natuur en Voedsel. Daar kun je dan weer op voortbouwen, bijvoorbeeld door nieuwe selecties van data toe te voegen of nieuwe berekeningen toe te voegen.”

Gigantische tijdwinst

Dat levert een gigantische tijdwinst op, stelt Dolman: “Onderzoekers zijn gemiddeld 60% van hun tijd bezig met het verzamelen van data voordat ze er überhaupt iets mee kunnen. Voordat je data kunt interpreteren, moet je die eerst harmoniseren, valideren, opschonen en samenbrengen. Al die stappen zijn al in het datawarehouse doorlopen. Dat is pure winst voor de gebruiker. De onderzoeker kan meer tijd besteden aan analyse en daar profiteren beleidsmakers en andere partners ook van. Daarnaast kun je altijd onderzoeken reproduceren.”

Onderzoekers zijn gemiddeld 60% van hun tijd bezig met het verzamelen van data voordat ze er überhaupt iets mee kunnen. Voordat je data kunt interpreteren, moet je die eerst harmoniseren, valideren, opschonen en samenbrengen. Al die stappen zijn al in het datawarehouse doorlopen.
Mark Dolman, product owner datamanagement

Van A tot Z ontzorgd

Het datawarehouse verbetert dus zowel de toegang tot informatie als de informatie zelf. Dolman: “We ontzorgen de gebruiker in alle facetten die vereist zijn bij goed datamanagement. Gebruikers hebben op basis van valide, geharmoniseerde en met kennis verrijkte data op een veilige manier meer en sneller inzicht. Bij de Staat van Landbouw, Natuur en Voedsel draait het vooral om data visualiseren, maar dat is het topje van de ijsberg. Juist die voorafgaande, kennisintensieve stappen zijn afzonderlijk al van onschatbare waarde. Dat geldt niet alleen voor ons als onderzoeksinstituut, maar ook voor onze partners en klanten.”