Secure ANalysis Environment (SANE)

SANE is een van de buitenwereld afgesloten virtuele computeromgeving waar onderzoekers met toestemming van dataleveranciers toegang hebben tot gevoelige gegevens voor analyse met behulp van vooraf goedgekeurde software zoals R en Python. In deze omgeving houden dataleveranciers volledige controle over de data, en kunnen onderzoekers hun gegevens veilig analyseren.

De uitdaging

De oplossing

SANE volgt de Five Safes-principes (safe data, projects, people, settings, outputs) en maakt gebruik van de ISO 270001-gecertificeerde diensten van SURF. De beveiligde omgeving heeft strenge pentests doorstaan en garandeert dataleveranciers een hoog beveiligingsniveau. SANE is momenteel beschikbaar via SURF Research Cloud. Dit systeem gebruikt SRAM om dataleveranciers en onderzoekers bij elkaar te brengen.

Tinker en Blind SANE

Tinker SANE

Met Tinker SANE hebben onderzoekers volledige toegang tot gevoelige gegevens, maar is het niet mogelijk deze zonder toestemming uit SANE te exporteren. Na afloop van de analyse worden de resultaten door de dataleverancier gecontroleerd en bij goedkeuring vrijgegeven

Blind SANE

In Blind SANE dienen onderzoekers een analyseschema in die door de dataleverancier in SANE wordt uitgevoerd. Deze manier van werken wordt toegepast als de dataleverancier geen toegang kan geven tot de volledige datasets in SANE.

Waarom SANE?

Faciliteren van toegang tot gegevens

SANE verruimt de toegang tot vertrouwelijke datasets voor onderzoekers door tools aan te bieden waarmee dataleveranciers het risico op inbreuk op vertrouwelijke informatie zo laag mogelijk kunnen houden. In overeenstemming met de Algemene verordening gegevensbescherming (AVG) houden dataleveranciers volledige controle over hun gegevens.

Uitbreiding van bestaande datasets

SANE biedt een veilige omgeving voor data-analyse en voegt een extra laag bescherming toe. Dataleveranciers kunnen gevoelige gegevens voor onderzoeksdoeleinden dan ook met een minimaal risico op openbaarmaking delen. Dat maakt het voor onderzoekers mogelijk rijkere datasets voor hun projecten te gebruiken.

Vertrouwde analysetools

Via SANE kunnen onderzoekers werken met vertrouwde analysetools. Tinker SANE is een standaard Windows-machine en zowel Tinker als Blind SANE bevatten een uitgebreide reeks analysetools. Rstudio en Jupyter Notebooks zijn vooraf geïnstalleerd.

Generieke oplossing

SANE biedt standaardspecificaties voor ontwikkelaars bij ODISSEI en CLARIAH zodat zij aanpasbare analytische tools kunnen maken die voor veel verschillende dataleveranciers gebruikt kunnen worden. Dat betekent dat individuele aanpassingen overbodig zijn en dat SANE een waardevolle en toekomstbestendige oplossing is die onafhankelijk functioneert van bestaande aanbieders.

Schaalbare cloudinfrastructuur

Omdat SANE een cloudgebaseerde infrastructuur heeft, is het systeem vrijwel oneindig schaalbaar. Op dit moment draait SANE op SURF HPC Cloud, en ben je slechts een paar kliks verwijderd van een machine met 64 GB RAM of een A10 GPU. In de toekomst kan SANE op elke cloudprovider draaien, waaronder Microsoft Azure en Amazon Web Services (AWS), en binnenkort ook on-premise bij de dataleverancier.

Hoge beveiligingsnormen

SANE is een specifieke configuratie van SRAM (SURF Research Access Management) en SRC (SURF Research Cloud) en heeft in november 2023 een onafhankelijke pentest doorstaan die werd uitgevoerd door een gespecialiseerd bedrijf. Dat houdt in dat SANE deel uitmaakt van de ISO 27001-certificeringen van SRAM en SRC. ISO 27001 is de internationale norm voor informatiebeveiliging. SURF voert periodiek interne audits en assessments uit om SANE continu te verbeteren en het Information Security Management System up-to-date te houden.

SANE opzetten, hoe werkt dat?

  • Pasklare oplossing

    Dataleveranciers kunnen SANE in samenwerking met de onderzoeker meestal binnen 30 minuten opzetten.
  • Projectbegroting

    Een standaard SANE-omgeving kost tussen de € 25 en € 300 per maand, afhankelijk van de computationele eisen. De grants voor Small Compute Applications zijn beschikbaar voor het gebruik van SANE.
  • Een samenwerking aanvragen

    In dit proces is de dataleverancier beheerder en de onderzoeker een reguliere gebruiker. Om deze samenwerking aan te vragen neem je contact op met de servicedesk van SURF.

Eventuele vragen over het gebruik van SANE kunnen worden gesteld aan SANE-projectmanager Lucas van der Meer.

Over de partners

ODISSEI
De nationale onderzoeksinfrastructuur voor de sociale wetenschappen in Nederland die baanbrekend onderzoek faciliteert met data, expertise en middelen.
SURF
Een samenwerkingsverband van Nederlandse onderwijs- en onderzoeksinstellingen die zich richten op het verbeteren van digitale dienstverlening en het bevorderen van kennisdeling door innovatie.

CLARIAH
A distributed research infrastructure for the humanities and social sciences, providing access to extensive digital data collections and user-friendly applications.

Photo by Markus Spiske on Unsplash