Hoe halen we nuttige kennis uit grote hoeveelheden meetgegevens?

De toenemende rol van data en informatie in onze samenleving wordt ook wel de ‘Big Data revolutie’ genoemd. De verwachting is dat de beschikbaarheid van extreem grote hoeveelheden data na de eerdere industriële revoluties opnieuw een revolutie zal inluiden die de manier waarop wij leven, werken en denken ingrijpend zal veranderen. De data die hierdoor gegenereerd worden kunnen we zien als de olie van 21e eeuw. Door ze te bewerken en te “raffineren” tot hoogwaardige informatie kunnen we de grote maatschappelijk problemen van de toekomst met succes te lijf gaan. Binnen het vakgebied van data science zal het gaan over de vraag hoe je wetenschappelijk verantwoorde conclusies kan trekken uit grote, heterogene, incomplete en onverifieerbare gegevens. Daarbij is het doel om de betrouwbaarheid van de conclusies te vergroten en aanwezige patronen ten onrechte worden gebruikt om conclusies op te baseren. Dit betekent dat er methoden en technieken nodig zijn die de controleerbaarheid, herhaalbaarheid en vergelijkbaarheid kunnen garanderen, ook als bestanden veranderen, verloren gaan of simpelweg te groot zijn om lange tijd te bewaren.