ODISSEI-portal

De ODISSEI-portal brengt metadata van een grote verscheidenheid aan onderzoeksbestanden in één centrale omgeving samen en maakt semantisch zoeken mogelijk om de vindbaarheid en de toegang tot data te vergemakkelijken. Leveranciers die toegang bieden tot hun metadata zijn onder andere het Centraal Bureau voor de Statistiek (CBS) en het LISS panel.

Via de ODISSEI-portal kunnen onderzoekers hoogwaardige metadata vinden van de belangrijkste Nederlandse sociaalwetenschappelijke datacollecties. Momenteel bevat de portal metadata uit de catalogi van het CBS, het LISS panel, het DANS SSH Data Station, de Historische Steekproef Nederland (HSN) en DataverseNL. Binnenkort wordt de collectie uitgebreid met metadata uit alle datasets die in het ODISSEI Observatorium (EVS, GGP, SHARE, ESS, NTR, HSN) zijn ontwikkeld. De catalogus van de ODISSEI-portal wordt daarnaast regelmatig bijgewerkt met nieuwe metadata over datacollecties buiten de traditionele repositories.

Hoe werkt de portal?

De ODISSEI-portal biedt uitgebreide informatie op het niveau van variabelen

In tegenstelling tot de meeste catalogi die alleen met metadata op hoog aggregatieniveau werken zoals een titel of een beschrijving van de dataset, voegt de ODISSEI-portal rijke informatie toe op het niveau van variabelen. Om geavanceerde, semantische zoekopdrachten te kunnen uitvoeren, creërt de portal structuren die op grafieken gebaseerd zijn en die een onderlinge sterke verbondenheid hebben. Alle metadata worden opgeslagen in een kennisgrafiek.

Dataharmonisatie vindt plaats via het CESSDA Metadata Model (CMM)

Om datasets van verschillende providers met elkaar te verbinden, worden trefwoorden gekoppeld aan gecontroleerde woordenlijsten (Controlled Vocabularies, CV’s) zoals ELSST (European Social Sciences Language Thesaurus). Het CESSDA-consortium heeft ELSST-woordenlijsten vertaald in verschillende talen. Door ze te koppelen aan de metadata van de portal kunnen gebruikers metadata in de brontaal vinden, maar ook een vertaling ervan.

De portal als pijplijn om machineleesbare metadata op te nemen uit externe repositories

Via een pijplijn haalt de ODISSEI-portal machineleesbare metadata op uit externe repositories. Elk record bevat gedetailleerde informatie over het opnameproces. Daarnaast kunnen metadata vanuit de portal in verschillende formats worden geëxporteerd zoals de formats JSON en Croissant-ML.

Je hebt de gewenste dataset gevonden. Hoe nu verder?

De portal biedt ook geharmoniseerde informatie over de toegangsvoorwaarden voor datasets. Via de ODISSEI Data Access Broker (DAB) kunnen gebruikers open access datasets downloaden en datasets met toegangsbeperkingen aanvragen van verschillende aanbieders. Onduidelijke licenties en vage toegangsvoorwaarden vormen grote obstakels voor Open Science en zelfs voor open data. De DAB harmoniseert de toegangsvoorwaarden en verwerkt ze automatisch voor zowel onderzoekers als dataleveranciers zodat het aanvraagproces sneller en minder tijdrovend verloopt.

Transfer naar de analyseomgeving

Nadat de onderzoeker als gebruiker is aangemeld zorgt de ODISSEI Data Access Broker ervoor dat gegevens van de betreffende eigenaar aan de gebruiker beschikbaar kunnen worden gesteld. In dit proces worden data overgebracht naar de daarvoor bestemde TRE zoals de Secure Analysis Environment (SANE), de ODISSEI Secure Supercomputer (voor grote, complexe of gevoelige datasets die bij het CBS zijn opgeslagen), of naar de computer van de gebruiker (in geval van kleine bestanden en/of open data).

Workflow van het transferproces van de ODISSEI-portal via de Data Access Broker