Project

Big data for healthy resources utilisation

Door de intrede van geavanceerde sensing- en monitoringtechnologie wordt in de agri-foodsector steeds meer gebruik gemaakt van de mogelijkheden van het Internet of Things als ontsluiting voor digitale data. Er is sprake van Big Data als de data als 1) veel data (near) real-time en snel beschikbaar is, 2) dat afkomstig is uit meerdere bronnen en 3) deze data flexibel verrijkt kan worden met andere (ongestructureerde) data. Het verder ontwikkelen van kennis voor toepassing van deze technologieën is essentieel voor een duurzame toekomst van de sector, meer in het bijzonder op het gebied van resource efficiency. 

Met dit project willen we onze know-how met betrekking tot het toepassen van het Big Data concept vergroten. Voor de analyse van Big Data wordt gebruik gemaakt van nieuwe data gedreven (mathematische) analyse methodieken. Om Livestock Research een positie te verschaffen op het terrein van Big Data is het noodzakelijk dat expertise wordt opgebouwd in de analyse van Big Data volgens de nieuwste inzichten. Doel is om, gecombineerd met de domeinkennis, data te combineren, te analyseren en te interpreteren. Om integratie over de verschillende disciplines te bewerkstelligen is gekozen voor show cases voor de melkveehouderij en voor de varkenshouderij (zie use cases).

De te ontwikkelen expertise zal zich met name richten op het toepassen van een data-driven aanpak van problemen. Dit houdt het toepassen van een Big Data benadering voor het verzamelen, combineren en analyseren van grote hoeveelheden (niet-)gestructureerde data in genoemde cases en het daarbij efficiënt inpassen en ontwikkelen van (specifieke) domeinkennis. Hierbij wordt buiten de reguliere paden gekeken qua partners en databronnen. Dit onderzoek zal bijdrage aan het beantwoorden van de vraag of een Big Data benadering meer oplevert dan traditioneel experimenteel onderzoek. Daarnaast is het doel is om een lerende community rond BigData op te bouwen die snel kan leren en flexibel kan zijn in de uitvoering.

Wat in dit project geleerd is:

-     Er is kennis en expertise opgedaan in verschillende machine learning methoden en hoe ze werken, wat ze kunnen en wat niet. De “use cases” en publicaties maken deze resultaten zichtbaar.

-     Domeinkennis blijkt heel belangrijk bij het voorbereiden/opschonen van de data en interpretatie van de modellen. Domeinkennis kan bijdragen bij het bepalen van welke aanvullende data nodig zijn.

-     Binnen het dierdomein zijn we een van de weinige groepen die focussen op voorspellingen gebaseerd op historische en beschikbare data. Dan zit veel informatie in.

-     Machine learning doet het soms beter dan de conventionele statistische modellen, maar niet altijd. De ervaring is dat er nog altijd veel voorbereiding aan een dataset gedaan moet worden.

Publicaties