Project

Geautomatiseerd meta-data repository voor Wageningse modellen en data

Internationale en nationale overheden en organisaties dringen er bij onderzoekers steeds meer op aan om onderzoeksassets, zoals primaire onderzoeksgegevens en softwareproducten (waaronder modellen) vrij ter beschikking te stellen.

Dit maakt het mogelijk om gegevens en resultaten te delen en te koppelen en meer interdisciplinair onderzoek te doen. Om effectief gebruik te kunnen maken van deze assets moeten een aantal zaken worden overbrugd:

  •  Afstemming van referentiekaders tussen onderzoeksdomeinen
  •  Intelligente en flexibele koppeling van assets (modellen en gegevens)
  •  Optimale vindbaarheid van asset.

Om assets die beschikbaar zijn via het internet ook daadwerkelijk te vinden, zijn filters nodig. Deze filters worden vaak aangestuurd door metadata of keywords. Deze moeten een juiste representatie zijn van hetgene wat wordt gezocht.

Bij het publiceren van data voegen mensen metadata en/of keywords toe. Dit is tijdrovend en subjectief omdat mensen werken vanuit een bepaalde context.

Doel van dit project is te onderzoeken in welke mate taalprocessingsoftware kan bijdrage aan het automatisch genereren van gestructureerde gegevens uit ongestructureerde gegevens en modellen om de koppeling en vindbaarheid te optimaliseren.

Aanpak en tijdspad

Activiteiten zijn:

  • Afstemmen met project eFoodLab (AFSG) en NMDC. 
  • Afstemming Wageningen UR-brede referentievocabulaires met bibliotheek en AFSG.
  • Onderzoek naar mogelijkheden van het automatisch genereren van metadata door taalprocessing software.

Resultaten

Beoogde resultaten zijn:

  • Wetenschappelijke publicatie
  • Eindrapportage resultaten 2011 en 2012.