Administratieve druk op boeren verlagen met AI

- dr. HCJ (Hans) Vrolijk
- Hoofd WOT Economische Informatievoorziening
Omdat boeren steeds meer gegevens moeten administreren, onderzoekt het Centrum voor Economische Informatievoorziening of AI hen geen werk uit handen kan nemen. Een digitale assistent die data uit bestaande facturen kan halen, kan hun administratiedruk verlichten. De eerste pilot is veelbelovend.
De dataverzamelaars van het Centrum voor Economische Informatievoorziening (CEI) zitten vaak gewoon bij de boer aan de keukentafel om de papieren administratie door te nemen. ‘Elk bedrijf is anders’, zegt Hans Vrolijk, tot voor kort het hoofd van het CEI, tonderdeel is van Wageningen Social & Economic Research. ‘Bij sommige bedrijven zit alles nog in een multomap. Bij andere kunnen we met de gegevens van hun accountantskantoor aan de slag.’ Het CEI verzamelt de gegevens van 1500 referentiebedrijven. Samen zijn die representatief zijn voor de hele Nederlandse landbouw- en tuinbouwsector.
Die data gaat niet alleen over hun financiën. Het CEI verzamelt ook gegevens over bijvoorbeeld het gebruik van gewasbeschermingsmiddelen en antibiotica of hoeveel mest er wordt uitgereden. ‘De Nederlandse overheid en de EU gebruiken onze rapporten om hun landbouwbeleid te evalueren, ook op het gebied van duurzaamheid. Milieuprestaties zoals het reduceren van broeikasgasemissies of het nutriëntenoverschot worden steeds belangrijker, net als de vraag of duurzaam boeren loont.’ Daarmee zou de administratieve druk bij boeren wel eens toe kunnen nemen.

Daarom onderzocht het CEI in een eerste pilot, onder leiding van Vrolijk, of kunstmatige intelligentie uitkomst kon bieden. Kan een AI-assistent facturen leren lezen, gegevens verzamelen en die correct labelen? Het antwoord: steeds beter.
Van ruwe data naar indicatoren
Om een AI-assistent te trainen zijn gegevens nodig. Laat het CEI eigenlijk altijd op zoek zijn naar geschikte en betrouwbare datastromen. Die rekent het centrum om tot relevante indicatoren voor de staat van de Nederlandse land- en tuinbouw, visserij en bosbouw, zoals bedrijfsopbrengst, mestproductie of antibioticagebruik. Om het gezinsinkomen uit de landbouwsector te berekenen kijkt het centrum bijvoorbeeld naar de opbrengsten, uitgaven, en arbeidsuren. Een indicatie van het gebruik van gewasbeschermingsmiddelen kan afgeleid worden uit de facturen van de leveranciers van die producten. Het CEI rekent de gegevens door en splitst ze uit per bedrijfstype en -omvang.
“Facturen bevatten niet alleen maar financiële informatie. Ze leggen vast wat het bedrijf in komt en weer uit gaat”
- Naam
- Vrij in te vullen veld voor functieomschrijving
Boerenbedrijven delen steeds meer data, en niet alleen met de Nederlandse overheid. De EU vraagt om duurzaamheidsrapportages en ook keurmerken willen weten hoeveel impact de bedrijven op het milieu hebben. Daarbij wordt een steeds groter deel van de boerenadministratie digitaal. Facturen worden per email verzonden en steeds vaker worden die facturen centraal opgeslagen. ‘Daar zagen wij een kans’, vertelt Vrolijk. ‘Zou een digitale dataverzamelaar de informatie uit die facturen niet kunnen ontsluiten? Dat scheelt boeren administratieve druk en voor het CEI betekent het ook een stap vooruit in efficiëntie.’
Facturen leren lezen
‘Facturen bevatten niet alleen financiële informatie,’ legt Vrolijk uit. ‘Ze leggen vast wat het bedrijf in komt en weer uit gaat: producten die worden verkocht, afval dat wordt afgevoerd, medicijnen die worden ingekocht. Die rijke informatiestroom bestaat dus al, en dat is heel handig. Niemand hoeft extra werk te verrichten om deze documenten aan te maken.’ Facturen zijn dus de aangewezen bron om een AI-assistent mee te trainen. Tijdens het ontwikkelen werkten de onderzoekers met e-facturen, PDFs of zelfs scans van papieren documenten. ‘Die kunnen allemaal leesbaar worden gemaakt.’

Het model moest twee taken leren uitvoeren: de gegevens op de factuur herkennen en vervolgens ook juist labelen. ‘Niet alles wat op een factuur staat is relevant, zoals het adres van de leverancier of de namen van de verzender. Dat was het eerste dat de AI moest leren: relevante informatie onderscheiden van de rest van het document. Vervolgens moet het die informatie ook categoriseren. Zijn dit financiële gegevens, hebben ze te maken met gewasbescherming, of gaat dit over bemesting?’
Informatie interpreteren
Die tweede stap, het correct labelen van de herkende informatie, daar moesten de onderzoekers het model nadrukkelijk op trainen. ‘De productregels vinden lukt heel goed, maar die informatie interpreteren kan lastiger gaan’, vertelt Vrolijk. Hij geeft het voorbeeld van een factuur voor het afvoeren van tomatenplanten. ‘Dat is geen verkoop, maar een afvalstroom. In het trainingsproces hebben we daar extra aandacht aan gegeven, omdat de AI-assistent dat onderscheid niet vanzelfsprekend maakte. Er staan immers ook tomaten op de factuur.’
Er waren ook praktische uitdagingen. Facturen zijn niet gestandaardiseerd en dus geeft elk bedrijf relevante informatie op een andere manier weer. ‘Stel een boer heeft 30 liter gewasbeschermingsmiddel aangeschaft. Op de factuur staan misschien alleen zes eenheden van vijf liter. In zo’n geval moet het model zelf de rekensom nog maken, en het totaal eventueel ook nog omrekenen naar de standaardeenheid van het centrale systeem.’
“Elk moment waarop er nog een specialist meekijkt, is ook weer feedback waarmee het model zichzelf kan verbeteren”
Met striktere voorbeeldsets, voldoende ingebouwde checks, en door twijfelgevallen nog aan een menselijke dataverzamelaar voor te leggen, kan de kans op fouten steeds verder omlaag worden gebracht. ‘Elk moment waarop er nog een specialist meekijkt, is ook weer feedback waarmee het model zichzelf kan verbeteren.’
Efficiënter werken
Hoe snel zullen boeren de vruchten plukken van een digitale dataverzamelaar? Daarover kan Vrolijk nog niet in detail treden. ‘Vooral omdat het afhangt van hoe je deze technologie zou willen implementeren. Het model zou bijvoorbeeld al bij de toeleveranciers, die de facturen opstellen, aangesloten kunnen worden op de gegevensstroom. Je kunt er ook een centrale service van maken, waar boeren zelf hun documenten uploaden zodat die verwerkt kunnen worden. Die oplossingsrichtingen verdienen elk hun eigen onderzoek.’
Voor het CEI zelf ligt het anders. ‘Als we het model in zijn huidige vorm implementeren, zouden we intern al efficiënter kunnen gaan werken’, stelt Vrolijk. ‘In vergelijking met de commerciële software die we nu gebruiken om informatie uit facturen te halen, vind ik de digitale dataverzamelaar eigenlijk veelbelovender. Dus binnen één of twee jaar verwacht ik dat het CEI met kunstmatige intelligentie werkt om de feiten sneller en zuiverder boven water te krijgen.’
Contact
Neem contact op met onze expert:
dr. HCJ (Hans) Vrolijk
Hoofd WOT Economische Informatievoorziening