Duurzaam datamanagement: voor nu en later
Een boot met bijna teveel reddingssloepen, zo is het datamanagementsysteem voor Kustgenese 2.0 te omschrijven. Het waterdichte systeem is vorig jaar september in het leven geroepen met als belangrijkste taak: het duurzaam opslaan van zowel ruwe als gestandaardiseerde data. Dat is makkelijker gezegd dan gedaan. Want hoe creëert u op de juiste manier een sustainable datamanagementsysteem, met waardevolle data voor nu en later, dat óók nog eens gebruikersvriendelijk is?
Het afgelopen jaar werkte Rinse Wilmink, adviseur waterveiligheid kust bij Rijkswaterstaat, aan het opzetten van het datamanagementsysteem. Samen met de technisch manager stuurde hij de meetcampagne aan om vervolgens ook het datamanagementproces te begeleiden. Rinse vertelt: ‘De data die we verzamelen, dient als fundament voor een nieuw beleidsadvies voor de Nederlandse kust. Het wetenschappelijk onderzoek is afhankelijk van deze data.’
Het proces
De meetcampagne ging september 2017 van start en liep eind mei 2018 af. Het was een van de eerste grootschalige meetprojecten sinds lange tijd en is van groot belang voor toekomstige projecten. Alle data is inmiddels verzameld en het eindproduct is in zicht. Rinse: ‘We moesten het wiel deels opnieuw uitvinden. Datamanagement vraagt namelijk om een hoge mate van consistentie en zorgvuldigheid. Wij mensen herkennen onregelmatigheden gemakkelijk, maar computers kunnen dit niet altijd. Daarom is het belangrijk voor ons om op de juiste manier om te gaan met datastromen, zodat we onregelmatigheden vermijden.’
Rijkswaterstaat won de verzamelde data op 3 verschillende manieren in: door visjes te vangen, zandmonsters te nemen en binaire gegevens te verzamelen met sensoren aan afgezonken meetframes. Omdat de data op een andere manier werd ingewonnen levert een vistelling andere data op dan een binaire getallenreeks. De uitdaging is om deze diverse input naar gelijkwaardige én duurzame output te vertalen.
Obstakels
‘Tijdens het inwinnen van de data waren er weinig obstakels die niet direct door het ervaren team aangepakt werden’, vertelt Rinse. ‘De meeste problemen doken pas op tijdens het verwerken van de data. We hadden aan de voorkant niet voorzien dat dataverwerking zo’n gedoe met zich meebrengt. Een goed proces is niet zomaar opgezet, maar als team hebben we de klus geklaard. Het kostte veel tijd om af te stemmen wat we gingen doen met de dataverwerking. Het belangrijkste data-focuspunt is niet voor iedere partij hetzelfde. Daarnaast wil je aan het eind van de rit ook alle data weer op ‘gelijk’ niveau hebben. Daar moesten afspraken voor gemaakt worden. Dit vroeg om veel inhoudelijke discussies en diverse overleggen.’
Kwaliteitslabel & toegang
‘Het volledige proces is gedocumenteerd zodat we nu en in de toekomst precies weten wat er allemaal met de verzamelde data gebeurd is’, vertelt Rinse. ‘Alle verzamelde data maken we toegankelijk in een online database. In deze omgeving staan zowel de ruwe data als de bijbehorende verwerkingssoftware opgeslagen. Op dit moment hebben alleen onderzoekers die bij het project betrokken zijn toegang tot de database. Volgend jaar plaatsen we verwerkte data naar een publiekelijke dataviewer waar in theorie iedereen deze kan opvragen. Dit noemen we open data. Hier staan alleen data opgeslagen die vooraf bewerkt zijn, zodat er een redelijke mate van betrouwbaarheid is. Het kwaliteitsstempel is vooraf bepaald door de betrokken onderzoekers. Ook zijn er bindende afspraken gemaakt over het dataeigendom: wie mag de data inzien en wie mag ermee publiceren?
De toekomst
‘Datamanagement is misschien niet het meest sexy werk maar wel ongelofelijk belangrijk. Het is een onmisbaar onderdeel in het project. Ook leert het ons veel over het verbeteren én het op de juiste manier aanvliegen van toekomstige projecten. Alle leerervaringen van Kustgenese 2.0 worden nu al toegepast in het Onderzoeks- en Monitoringsprogramma Houtribdijk. Daarnaast kijkt ook het Kennis en Innovatieprogramma Markerwadden (KIMA) met interesse naar de ontwikkelingen op het gebied van datamanagement binnen Kustgenese 2.0.’ Naast het opslaan en verwerken van waardevolle data leverde het datamanagementsysteem ook intern een hoop belangrijke inzichten op. Rinse legt uit: ‘Het heeft ons veel geleerd over projectmatig samenwerken met diverse partners. We hebben nu duidelijker in beeld bij welke partijen specifieke rollen en verantwoordelijkheden moeten liggen. Het proces heeft alle partijen dichter bij elkaar gebracht. Het is een mooi project waar we met z’n allen keihard aan hebben gewerkt. En nu het eindresultaat in zicht komt zeker iets waar we trots op mogen zijn.’