De oplossing
SANE volgt de Five Safes-principes en maakt gebruik van de ISO 270001-gecertificeerde diensten van SURF. De beveiligde omgeving heeft strenge pentests doorstaan en garandeert dataleveranciers een hoog beveiligingsniveau. SANE is momenteel beschikbaar via SURF Research Cloud. Dit systeem gebruikt SRAM om dataleveranciers en onderzoekers bij elkaar te brengen.
Tinker en Blind SANE
Tinker SANE
Met Tinker SANE kunnen onderzoekers direct werken met gevoelige gegevens binnen de SANE-omgeving, terwijl data-extractie wordt voorkomen.
- De dataleverancier beheert de vrijgave van de output
- Volledige toegang tot analyse
Blind SANE
Blind SANE is ideaal in gevallen waarin de dataleverancier geen volledige toegang kan verlenen. Onderzoekers dienen analysescripts in en de dataleverancier voert ze veilig uit in SANE.
- Beveiligde uitvoering van analyses
- Geen directe toegang tot gegevens
Beschikbare gegevens
Verschillende bij ODISSEI aangesloten dataleveranciers stellen gevoelige gegevens beschikbaar via SANE. ODISSEI faciliteert de toegang tussen dataleveranciers en onderzoekers, en biedt zes weken gratis toegang. De volgende datasets zijn momenteel beschikbaar via SANE:
- FIRMBACKBONE
Het FIRMBACKBONE Handelsregister. Dit is het handelsregister van FIRMBACKBONE over Nederlandse organisaties die bij de Kamer van Koophandel (KVK) zijn geregistreerd. Er zijn twee ‘waves’ beschikbaar: 21 december 2023 en 5 februari 2024. (doi: 10.34894/0HFSQZ).
De FIRMBACKBONE dataset over Werkgelegenheid omvat Nederlandse organisaties die geregistreerd zijn bij de Kamer van Koophandel en ondervraagd zijn door LISA tussen 2019 en 2022. De dataset, op vestigingsniveau, haalt werkgelegenheidsgegevens primair uit enquêtes met daarop enkele imputaties en aanpassingen. Er zijn vier ‘waves’ beschikbaar. (doi: 10.34894/V4NWYG). - YOUth Video’s van Ouder-Kind Interactie (PCI) laten ouder-kind interacties zien aan de hand van gestructureerde taken, waaronder lichte stress (opvoeden, opruimen) en vrij spel. Deze video’s zijn gecodeerd op basis van bepaald gedrag om de kwaliteit van de interactie te beoordelen. (doi: 10.60641/7tty-4e58).
- Fijnmazige Demografie van het LISS panel bevat gedetailleerde variabelen zoals provincie, gemeente of postcode van verblijfsplaats en land van oorsprong (CBS-classificatie), die afgeschermd zijn vanwege de privacy-regulering. Er kan veilig toegang tot de data worden verkregen via de SANE-omgeving. Publiek beschikbare sociaal-demografische data van LISS is toegankelijk via het LISS Data Archive (doi: 10.57990/qn3k-as78).
Gegevens opvragen & SANE opzetten
Als de onderzoeker hulp wenst van ODISSEI bij het contact leggen met de beoogde dataleverancier, worden de volgende stappen doorlopen. Het eenvoudige proces voor het opzetten van SANE zonder tussenkomst van ODISSEI wordt beschreven op de pagina SURF servicedesk.
Stap 1: Dien je verzoek om gegevenstoegang in
Onderzoekers moeten een aanvraagformulier invullen, met basisgegevens voor de verwerking van het toegangsverzoek.
Stap 2: Goedkeuringsproces
ODISSEI stuurt het verzoek door naar de dataleverancier. De dataleverancier kan om aanvullende informatie vragen of de onderzoeker vragen een geheimhoudingsverklaring te ondertekenen. ODISSEI ziet toe op dit proces om een soepele goedkeuring te garanderen.
Stap 3: SANE-omgeving opzetten
Zodra de toegang is goedgekeurd, werkt ODISSEI samen met de onderzoeker en de dataleverancier om de SANE-omgeving te configureren. SANE wordt meestal binnen 30 minuten opgezet.
Stap 4: Gratis toegang en verder gebruik
- Een standaard SANE-omgeving kost tussen de € 25,- en € 300,- per maand, afhankelijk van de rekenvereisten.
- Onderzoekers verbonden aan organisaties die aangesloten zijn bij ODISSEI kunnen zes weken gratis toegang krijgen tot de hierboven genoemde datasets.
- Na zes weken is voor voortgezet gebruik alternatieve financiering nodig, doorgaans via een SURF E-infra grant (toekenning duurt ongeveer twee weken).
Waarom SANE?
Vlottere toegang tot gegevens
SANE vergemakkelijkt de toegang tot vertrouwelijke datasets en helpt dataleveranciers de risico’s te minimaliseren met behoud van volledige controle en naleving van de AVG.
Uitbreiding van bestaande datasets
Met extra gegevensbescherming maakt SANE het veilig delen van gevoelige gegevens mogelijk. Dit zorgt voor uitgebreidere datasets voor onderzoek zonder risico’s op openbaarmaking.
Vertrouwde analysetools
SANE ondersteunt veelgebruikte tools zoals RStudio en Jupyter Notebooks. Tinker SANE draait op een standaard Windows-machine.
Generieke oplossing
SANE is een standaardoplossing die normen vastlegt voor ontwikkelaars om aanpasbare, compatibele analytische tools te creëren, waardoor het toekomstbestendig en onafhankelijk is.
Hoge beveiligingsnormen
SANE, onderdeel van de ISO 27001 certificering van SRAM en SRC, heeft in november 2023 met succes een onafhankelijke penetratietest ondergaan. SURF voert bovendien regelmatig audits uit om de beveiliging continu te verbeteren.
Schaalbare cloudinfrastructuur
SANE is oneindig schaalbaar op SURF HPC Cloud en kan op elke cloud-provider of op locatie draaien, met flexibele infrastructuuropties.
Photo by Markus Spiske on Unsplash