Nieuwe versie van de ODISSEI-portal bevat metadata in Croissant-formaat

9 October 2024

Snel open datasets vinden

Naast de mogelijkheid om te filteren op publicatiejaar of onderwerp, kunnen gebruikers nu openbare datasets met een creative commons licentie selecteren. Datasets die een toegangsbeperking hebben, hebben in de terms velden van de metadata een connectie met het prototype van de Data Access Broker (DAB) die de gebruiker naar meer informatie leidt over de toegangsprocessen bij de specifieke instellingen die de data beheren. In toekomstige versies wordt de DAB uitgebreid om automatisch de licentiecondities te verwerken.  

Metadata export in Croissant-formaat

Het Portal maakt het nu ook mogelijk om metadata in het nieuwe Croissant-formaat te downloaden, waardoor metadata beter geschikt wordt voor machine learning. Croissant is gemeenschappelijk ontwikkeld door wetenschappers en bedrijven met een actieve bijdrage van DANS en Harvard. Het bouwt voort op schema.org. Croissant wordt al door verschillende tools en repositories ondersteund en sinds versie 2.6 is het ook onderdeel van de hoofdcode van de Dataverse software. Dit verbetert de FAIRness van de metadata die in het Portal beschikbaar is en ondersteunt uitwisseling met andere tools en repositories zoals (commerciële) platforms als Kaggle en HuggingFace.

Metadata verrijkt

Een belangrijk onderdeel van de ODISSEI-portal is onze pipeline om metadata te verrijken. Metadata wordt van de instellingen verzameld, geharmoniseerd en verrijkt door gestandaardiseerde trefwoorden toe te voegen. In het bijzonder voegen wij termen toe uit de European Social Sciences Language Thesaurus (ELSST), een belangrijke vocabulaire die door veel sociaal wetenschappelijke archieven wordt gebruikt en wordt beheerd door CESSDA. De verrijkingen in het Portal maken het voor gebruikers mogelijk om gerelateerde datasets van verschillende instellingen te vinden op basis van de gestandaardiseerde ELSST termen.

Presentaties van het Portal

Een webinar is gepland om onderzoekers wegwijs te maken in het Portal. Het Portal zal ook gepresenteerd worden op de ODISSEI-conferentie. Het Portal wordt verder ontwikkeld en verbeterd tot het einde van 2024 als onderdeel van het ODISSEI Roadmap project. Vanaf 2025 wordt het Portal geïntegreerd in het werk, gericht op zoeken en vinden van data in de FAIR workstream van het SSHOC-NL project – een samenwerking tussen ODISSEI en CLARIAH. 

Voor aanvullende informatie of vragen over het Portal of om feedback te geven, neem contact op met: info@odissei-data.nl