Van data informatie maken
Kustgenese 2.0 levert een schat aan waardevolle data op voor onderzoekers en wetenschappers. Hoe gaan we daar mee om? Hoe werkt het datamanagement en wat willen we uiteindelijk met al die gegevens?
Kees den Heijer van Deltares is verantwoordelijk voor het datamanagement van het project. Hierbij werkt hij samen met Rina Clemens, groepshoofd data-analyse en informatievoorziening bij Ingenieursbureau Witteveen+Bos. Kees vertelt over de actuele status van het verzamelen, opslaan en gebruiken van de data. ‘Inmiddels is de meeste data van de eerste meetcampagne uit sensoren, meetinstrumenten en zandmonsters verzameld en vastgelegd in een ‘data repository’.
Plek voor ruwe gegevens
De data repository is een plek waar we de ruwe data neerzetten die rechtstreeks uit de meetinstrumenten komen. Dit kunnen eenvoudige tekstbestanden zijn, maar ook grote binaire bestanden die ruimtelijke data bevatten en uitsluitend met speciale software gelezen kunnen worden.’ Nadat de ruwe gegevens in de data repository zijn opgeslagen, worden deze geüniformeerd tot standaard data.
Opwerken tot standaard data
Er is een grote variëteit aan data. Dat maakt het een uitdaging om alles netjes te uniformeren tot standaard data, zegt Kees. Hoewel de meeste data van de eerste meetcampagne, enkele honderden gigabytes, nu uit de instrumenten is gehaald, is het ‘opwerken’ van al die gegevens nog steeds gaande, weet Kees. ‘Het opwerken wordt gedaan door algoritmen, speciale formules die bedoeld zijn om te zorgen dat de data volgens de passende standaarden wordt bewerkt en opgeslagen.’
Uniek
Op termijn moeten alle gegevens ook beschikbaar komen voor andere onderzoekers en wetenschappers. ‘Dat is vrij uniek. Zeker voor een project van deze omvang, gebeurt het niet vaak dat alle data worden vrijgegeven. Aan ons om dat op een gestructureerde, gemakkelijk oproepbare manier te doen. Over hoe dat systeem eruit komt te zien, dat eigenlijk een soort online database moeten worden, denken we nu na.’
Vragen
Rina: ‘We buigen ons nu ook over vragen als: hoe kunnen wij de gegevens zo goed mogelijk presenteren? Welke eisen en voorwaarden moet je kunnen stellen aan de data om de juiste uitkomsten te krijgen? In welke bestandformaten willen we de gegevens presenteren? Aan welke eisen moet de informatie voldoen om zo breed mogelijk gedeeld te kunnen worden? Kees: ‘Uiteindelijk creëren we een plek waar iedereen alle informatie uit Kustgenese 2.0 kan oproepen. We verwachten dat dit over twee jaar het geval is.’