De ontwikkeling van een FAIR Expertise Hub voor de sociale wetenschappen

In het tijdperk van big data en computationele methoden is het voor wetenschappers in toenemende mate gebruikelijk om met datasets te werken die oorspronkelijk niet zijn bedoeld voor onderzoeksdoeleinden, zoals administratieve data en media content (waaronder tweets). Hoewel dit bronnen zijn voor nieuwe inzichten en kennis, ontbreekt bij dergelijke datasets vaak gepaste documentatie en informatie over de manier waarop ze zijn gecreëerd. Dit maakt het werk voor onderzoekers zwaarder en in sommige gevallen ook minder betrouwbaar. Het project ‘Building a FAIR Expertise Hub for the social sciences’, dat recent financiering heeft ontvangen van het Platform Digitale Infrastructuur Social Science and Humanities (PDI-SSH), is erop gericht om deze kwesties aan te pakken door de dataverstrekkers in de sociale wetenschappen te ondersteunen om het FAIR-gehalte (vindbaar-, toegankelijkheid, interoperabiliteit en herbruikbaarheid) van hun data te verbeteren. 

De FAIR richtlijnen zijn voorgesteld in een artikel dat gepubliceerd is in 2016. Het doel van de FAIR principes is om de transparantie en herbruikbaarheid te vergroten, door de mogelijkheden voor mensen en machines te bevorderen om data te vinden en te hergebruiken. ‘Dit klinkt misschien abstract, maar het heeft aan aantal praktische implicaties,’ licht Angelica Maineri, de projectmanager van de FAIR Expertise Hub, toe. ‘Om een voorbeeld te geven: de FAIR principes omvatten het labelen van datasets met een “globally unique and persistent identifier”, dus een unieke volgorde van alfanumerische karakters die zijn toegekend aan een specifiek digitaal object. Op een bepaalde manier is dit hetzelfde als de unieke numerieke reeks die wordt toegewezen aan burgers (het Burgerservicenummer). Een ‘persistent identifier’ maakt het mogelijk om de identiteit van een burger te verifiëren (of de herkomst van een dataset), en om persoonlijke gegevens in verschillende serviceverleners van de overheid aan elkaar te linken (of om te achterhalen in welke publicaties een bepaalde dataset is gebruikt.)’

De FAIR richtlijnen worden aanbevolen door de meeste onderzoeksorganisaties en -financiers ter wereld, maar de daadwerkelijke implementatie ervan is niet altijd eenvoudig, stelt Maineri: ‘Aan de ene kant zijn de bestaande middelen om aan een aantal van de FAIR principes te voldoen niet ver genoeg ontwikkeld om breed te worden toegepast. Aan de andere kant is het ook moeilijk voor dataverstrekkers om de meest passende ondersteuningsmiddelen te kiezen aangezien er veel mogelijkheden beschikbaar zijn. In dit gefragmenteerde landschap wil de FAIR Expertise Hub dataverstrekkers ondersteunen die FAIR principes willen implementeren maar die nog niet de kennis, vaardigheden en prikkels hebben om dit te doen.’ 

Dankzij specifieke tools die zijn ontwikkeld in de FAIR community en die worden gepromoot door de FAIR Expertise Hub, zullen dataverstrekkers in staat zijn om beslissingen te nemen over de FAIR standaarden die ze willen aannemen, en een strategie ontwikkelen om deze te implementeren. Een data steward aan de Erasmus Universiteit Rotterdam (EUR) en een computer scientist aan de VU Amsterdam zullen dataverstrekkers in dit proces ondersteunen, terwijl ze er ook voor zorgen dat dit overeenkomt met internationale standaards voor verschillende onderzoeksdomeinen en voor dataverstrekkers in hetzelfde domein. 

Het project is een samenwerkingsverband tussen de Erasmus School of Social and Behavioural Sciences aan de EUR, het Computer Science Department van de VU en DANS-KNAW. ODISSEI zal als de nationale datainfrastructuur voor Nederlandse sociale wetenschappen de uitwisseling tussen de uitvoerders van het project en de dataverstrekkers faciliteren. 

De FAIR Expertise Hub heeft als doel om praktische en gepaste aanbevelingen te geven. Om dit te bereiken zullen projectleden binnenkort gesprekken gaan voeren met belangrijke stakeholders in het Nederlandse sociale data landschap, om lacunes en wensen gerelateerd aan het implementeren van de FAIR principes te identificeren. ‘Hoewel de FAIR Expertise Hub primair zich tot de dataverstrekkers zal richten, zullen de voordelen veel verder strekken. Het FAIR maken van databronnen opent nieuwe mogelijkheden voor onderzoek, wat uiteindelijk bijdraagt aan een beter begrip van de maatschappij’, sluit Maineri af.

Als je ideeën wil uitwisselen of wil bespreken hoe de FAIR Expertise Hub je kan helpen om een FAIR implementatiestrategie te ontwikkelen, neem dan contact op met Angelica Maineri (angelica@odissei-data.nl). 


Foto door Scott Graham op Unsplash