Nieuws

Goed archiveren van data noodzakelijk

Gepubliceerd op
21 maart 2014

In het rapport ‘Embedded data scientist’ pleiten Frits van Evert en Hugo Besemer, beiden van Wageningen UR (University en Research centre) voor een standaard format voor de beschrijving van datasets. Een consistent beleid voor de keuze van locatie en opslagmedia is nodig om te voorkomen dat alleen de onderzoeker zelf nog weet waar de data zijn bewaard en hoe ze geïnterpreteerd moeten worden.

Onderzoek verricht. Rapport uitgegeven of publicatie geaccepteerd. De data worden vervolgens in een folder op de computer of netwerkschijf opgeslagen of op een DVD gebrand. Alleen de auteur weet waar. En alleen de auteur weet de data te lezen en te wegen.

Organisatie en toegang onderzoeksdata

Dat kan anders. Dat moet wellicht anders. Het was aanleiding voor Wageningen UR Library om na te gaan wat onderzoekers weerhoudt van een bestendig en ook voor derden toegankelijk beheer van data. Frits van Evert, onderzoeker bij Plant Research International en ‘data cruncher’, heeft zich al meerdere malen het hoofd gebogen over bestaande en nieuwe mogelijkheden om data te organiseren en toegankelijk te maken. Hij is door de bibliotheek gevraagd zich als ‘embedded scientist’ onder zijn collega’s te begeven en hen te bevragen op kansen en obstakels bij data archivering.

Aanbevelingen en tools datasets

In het rapport Embedded data scientist beschrijft Frits van Evert samen met Hugo Besemer van Wageningen UR Library zijn bevindingen en komt tot een aantal aanbevelingen. Zij pleiten onder andere voor een standaard format voor de beschrijving van datasets, bijvoorbeeld met de zogenaamde ‘Linked Open Data technology’, en om onderzoekers daarvoor training en tools te geven. Het is ook nodig om bij datasets een duidelijk onderscheid te maken tussen opslag tijdens gebruik (storing), archivering (archiving) en de voorwaarden voor in bewaring geven bij een archief (depositing) waarbij passende afspraken moeten worden gemaakt en maatregelen getroffen.

Consistent beleid data archivering

Er moet een consistent beleid komen voor de keuze van locatie voor de opslag van data en voor de verwijzingssystematiek (citering) naar datasets voor publicaties, concluderen beide auteurs. Ook moet er een methodiek komen voor het respecteren of garanderen van intellectueel eigendom en voor het deponeren van datasets onder embargo.