Zaaien met Data, Oogsten met AI
Het is bijzonder hoe de kunstmatige wereld van AI en Data Science zich laat verbinden met de natuur. In deze blogpost duiken we in de mogelijkheden van AI binnen het groene domein.
Sinds december 2024 ben ik werkzaam als lector Data Intelligence voor Duurzame Transities binnen HAS green academy. Dit lectoraat is opgericht vanuit het besef dat we met (ruimtelijke) data en AI gericht kunnen werken aan transities in klimaat, energie en biodiversiteit. Denk daarbij bijvoorbeeld aan:
• Klimaatadaptatie in steden: hitte-eilanden in kaart brengen, groene daken monitoren, wateroverlast voorspellen;
• Energietransitie: locaties voor zonnepanelen, windmolens en laadinfrastructuur bepalen;
• Biodiversiteit: veranderingen in landschap en natuurgebieden volgen en het effect van maatregelen zichtbaar maken.
Binnen al deze gebieden wordt gigantisch veel data verzameld. Maar is deze data ook bruikbaar voor AI-algoritmes?
Data groeit als kool
In het groene domein zien we een enorme groei aan beschikbare data: zo beschikt een kas over duizenden (sensor) datapunten, meten we van een koe continu haar bewegingen en melkproductie, en voorzien satellieten ons 24/7 van real-time ruimtelijke informatie.
Daarnaast neemt met de opkomst van Generative AI de hoeveelheid data ook nog eens gigantisch toe. De verwachting is dat we medio 2027 wereldwijd minimaal 1 Yottabyte (= 10²⁴ bytes) aan data hebben opgeslagen. En ieder jaar verdubbelt deze hoeveelheid!
Voorbeeldprojecten
Met ons team van plm. tien onderzoekers werken we dagelijks aan projecten in samenwerking met ministeries, provincies, waterschappen, universiteiten, maar ook commerciële bedrijven. Zo werken we op dit moment bijvoorbeeld aan:
• Een beeldherkenningsalgoritme waarmee we gezondheid en gedrag van dieren analyseren;
• Een oplossing om de bodemdraagkracht voor tanks van onze genietroepen te kunnen voorspellen;
• Een digital twin waarmee we beleidsmakers adviseren over de locatiekeuze van aanbieders van (on)gezond voedsel.
Onderzoekslijnen
De projecten van ons lectoraat spelen zich allemaal af in het groene domein, maar de toepassingen zijn dus heel divers. Om onze activiteiten te structureren, hebben we gekozen voor de volgende onderzoekslijnen:
1. Kennismodellering
2. Remote sensing en sensoring
3. Digital twins
4. Generative/agentic AI
5. Data en ethiek
In deze blogpost gaan we op iedere onderzoekslijn dieper in.
Kennismodellering
De enorme groei aan beschikbare data klinkt misschien mooi, maar is ook zorgelijk. Semantiek lijkt vaak minder van belang met de opkomst van generatieve AI. Het internet wordt ‘vergiftigd’ met een explosie aan ongevalideerde data. Dit zet de betrouwbaarheid van AI-output ernstig onder druk (zie Data & Analytics BLOG #16: Kennismodellering en LLM’s, op zoek naar de waarheid).
Het is dan ook niet vreemd dat datamodellering – met name in de wetenschap – aan een opmerkelijke opleving is begonnen. Klassieke methoden zoals ERM (*) en NIAM voorzien in een groeiende behoefte om kennis te modelleren, ook in het groene domein. Maar ook wordt steeds vaker gekeken naar knowledge graphs: flexibele netwerken van objecten en relaties. In plaats van rigide ERM-schema’s kun je met knowledge graphs eenvoudig nieuwe typen objecten en verbanden toevoegen, wat ze bijzonder geschikt maakt voor onderzoek en innovatie.
(*) ERM viert in 2026 haar 50-jarig bestaan!
Remote sensing, digital twins en generative/agentic AI
De technologieën remote sensing, digital twins en generatieve AI spelen een sleutelrol in het groene domein.
Remote sensing is de technologie waardoor we, op basis van drones en satellieten, objecten en patronen kunnen herkennen. Satellieten zoals Sentinel-1 en Sentinel-2 leveren continu data over het aardoppervlak.
Met sensoren meten we bijvoorbeeld temperatuur, luchtvochtigheid en bodemvocht op groene daken, in voedselbossen en in kassen. Dat leidt tot dagelijks tot tientallen miljoenen sensorwaarnemingen die een rijk beeld geven van onze leefomgeving.
Met behulp van digital twins maken we een digitaal model van bijvoorbeeld een kas, een supermarkt of een akkerbouwbedrijf. Dergelijke modellen maken het mogelijk om scenario’s door te rekenen en effecten van keuzes te testen. Denk bijvoorbeeld aan vragen zoals:
• Wat zijn verwachte gezondheidseffecten als je een supermarkt pal naast een middelbare school plaatst?
• Wat gebeurt er met biodiversiteit als je een nieuwe vierbaans-weg in een natuurgebied aanlegt?
Ook de toepassingsmogelijkheden van generative/agentic AI in het groene domein zijn enorm, meer hierover in een volgende blogpost.
Data en ethiek: zonder vertrouwen geen impact
Waar data en AI komen kijken, ontstaat ook een ethische agenda. Bias ligt op de loer als datasets niet representatief zijn of historische ongelijkheden klakkeloos worden overgenomen. Dit gevaar ligt ook op de loer in het groene domein.
Andere ethische kwesties in het groene domein betreffen onder meer privacy, mensenrechten, dierenrechten. HAS green academy beschikt over een Ethische Advies Commissie heeft. Ieder onderzoek waarbij er de geringste twijfel is over een ethische kwestie, wordt voorgelegd aan deze commissie.
Ten slotte
Ook in het groene domein wordt dus enorm veel data verzameld. Eerlijk is eerlijk: helaas wordt deze data vaak in geïsoleerde Excel-bestanden opgeslagen. Ook bij ons is de Hel van Excel (zie Data & Analytics BLOG #3: The danger of Exceleration) dus aanwezig.
Om deze risico’s tegen te gaan, besteden we binnen het lectoraat veel aandacht aan datakwaliteit. Bijvoorbeeld door bij ieder project te starten met een duidelijk Data Management Plan. Zonder goede data heeft het geen zin om met AI te beginnen.
Zaaien met data, oogsten met AI!
P.S.
Een volledige versie van de inaugurele rede van Harm Bodewes is te vinden op Inaugurele Rede Harm Bodewes – Lector Data Intelligence voor duurzame transities – HAS green academy.





