Nieuws

Natuurbehoud van bovenaf

Gepubliceerd op
2 juli 2018

Opzichters in natuurreservaten worden vaak geconfronteerd met problemen rondom stropen. Om deze problemen tot een minimum te beperken, is het noodzakelijk om de dieren die in deze parken te leven te tellen en lokaliseren. Vanaf de grond tellen is een arbeidsintensieve taak waarvoor een groot aantal opzichters nodig is. Vaak worden er helikoptervluchten gebruikt om doorsneelijnen te bestrijken en worden de populaties dan geëxtrapoleerd. Om het inspectiegebied te vergroten, is een semi-automatische aanpak door middel van drones (or Unmanned Aerial Vehicles, UAV’s) ideaal.

De speld in een hooiberg

In tijden van betaalbare UAV’s is het eenvoudig om foto’s vanuit de lucht te verkrijgen. Deze afbeeldingen worden vervolgens door opzichters doorzocht op zichtbare dieren. Dit houdt in dat men door vele afbeeldingen moet zoeken waarin een dier erg lastig zichtbaar is, zelfs voor ervaren opzichters. Figuur 1 laat de afbeelding zien zoals deze door de UAV gemaakt is en figuur 2 laat het rood omcirkelde en ingezoomde deel zien.

Zoals in de hierboven genoemde voorbeelden te zien is, is het vinden van dieren op luchtfoto’s moeilijk; het is vergelijkbaar met het zoeken naar de speld in een hooiberg. In de resolutie van de foto’s zijn dieren klein (gemiddelde grootte van 30x18 pixels), schaars en heterogeen in uitstraling. Daarnaast lijkt het omringende landschap erg op de dieren (bijvoorbeeld dode boomstammen) en is het divers (grondopmaak, verlichting etc.). Deze karakteristieken maken de identificatie van dieren op luchtfoto’s een grote uitdaging. Een opzichter zou daarom meerdere dagen nodig hebben om alle dieren te identificeren.

De hoofdvraag bij dit probleem is hoe men goede kwaliteit annotaties kan verkrijgen in de benutte tijd van opzichters. De oplossing is een combinatie van crowdsourcing en Geospatial Computer Vision.

Waarschijnlijkheidsberekening van aanwezige dieren

Eerst is het reservaat gefotografeerd in een veldonderzoek, waarna de verkregen afbeeldingen in subframes van 224 x 224 pixels werden gesneden. De ground truth was door middel van crowdsourcing door vrijwilligers van Micromappers verkregen. Een deep learning model wordt vervolgens gebruikt om voor elke foto de waarschijnlijkheid van dieren te bepalen. Niet alle afbeeldingen bevatten echter dieren en de verschillen tussen achtergronden zijn enorm, waardoor het trainen van een dergelijk model erg lastig is. De uitkomst is hierdoor dat de CNN (Convolutional Neural Network), en elke andere standaard, overal dieren detecteren.

Het trainen van de CNN kan gerealiseerd worden door het in acht nemen van de volgende karakteristieken:

  • Curriculum learning: Begin met afbeeldingen die alleen dieren bevatten, gebruik daarna de volledige dataset.
  • Class weights: Fouten tellen zwaarder mee op de dieren-klasse.
  • Hard negative mining: Straf de meest waarschijnlijke fouten af na 100 epochs.

Het resultaat is veel minder valse positieven voor de CNN tijdens de detectiefase (Figuur 3), daarom zullen gebruikers alleen een deel van de tegels hoeven te controleren (Figuur 4), waardoor kostbare tijd en middelen bespaard worden.

Figuur 3. Resultaten zijn veel minder false positives tijdens de detectiefase (870 voor de CNN).

Figuur 3. Resultaten zijn veel minder valse positieven tijdens de detectiefase (870 voor de CNN).

Figuur 4. False positives van de standaard (rood) en CNN (blauw) laten minder false positives voor de CNN zien.

Figuur 4. Valse positieven van de standaard (rood) en CNN (blauw) laten minder valse positieven voor de CNN zien.