Effecten van ruimtelijke-contextuele kenmerken op het persoonlijk inkomen

Ana Petrović (TU Delft), Maarten van Ham (TU Delft), David Manley (University of Bristol)

De buurt waarin je woont heeft een grote invloed op je individuele inkomen. Maar wat is precies de relatie tussen die twee? Het onderzoek van Ana Petrović (TU Delft), Maarten van Ham (TU Delft) en David Manley (University of Bristol) richt zich op de invloed van ruimtelijke ongelijkheid op individuele sociaaleconomische status. Hiervoor hebben ze gegevens van het CBS gebruikt, onder andere (geanonimiseerde) datasets over inkomen per woonadres door de tijd heen. De gegevens zijn geanalyseerd in de ODISSEI Secure Supercomputer.

De onderzoekers hebben een verkennende analyse gedaan van de woonomgeving op verschillende schalen. Hiervoor hebben ze grids – concentrische cirkels om elke individueel persoon – gemaakt. De grids hebben ze voor verschillende schalen gemaakt, variërend van 100 meter tot 10 kilometer. Ana: “Voor elke schaalgrootte hebben we twee contextuele kenmerken berekend: het aandeel bewoners met een niet-Westerse achtergrond en het aandeel bewoners met een laag inkomen. Deze kenmerken hebben we gelinkt aan individuele kenmerken zoals inkomen. De resultaten variëren sterk tussen de verschillende schaalgroottes, wat het belang van het meten van spatiële contextuele kenmerken op verschillende schaalgroottes aantoont.”

Computerkracht

Al met al had het onderzoek 3,4 miljard datapunten om te analyseren. In de Remote Access-omgeving van het CBS zou het minimaal vier maanden hebben gekost om de dataset door te rekenen. Voor dergelijke gevallen heeft ODISSEI, in samenwerking met CBS en SURFsara, de ODISSEI Secure Supercomputer ontwikkeld. Hiervoor is beveiligde CBS-omgeving gekopieerd naar de Cartesius supercomputer van SURFsara.

Lykle Voort, een van de ontwikkelaars van SURFsara: “Voor de analyse van Ana waren computers met minimaal 64GB aan werkgeheugen nodig. Omdat het hier ging om heel veel combinaties van gegevens, is uiteindelijk een cluster ingezet van 25 nodes met 24 cores en 64GB aan werkgeheugen elk. In totaal zijn dat dus 600 processor cores. Ter vergelijking: een laptop heeft er doorgaans 2 of 4.” Ana: “Zonder de ODISSEI Secure Supercomputer hadden we ons onderzoek praktisch niet kunnen uitvoeren. We hebben zelfs een variabele extra en een langere periode kunnen berekenen.”

Open Access

Ana: “We gaan de resultaten open access publiceren. In vervolgonderzoek willen we de ruimtelijke structuur van de sociale omgeving, de trends van ruimtelijke segregatie op meerdere schalen en de gevolgen van deze processen voor individuen nog beter begrijpen. Ook ons vervolgonderzoek zal erg veel datapunten hebben en we hopen opnieuw van de ODISSEI Secure Supercomputer gebruik te kunnen maken.”

Presentatie TU Delft-pilot (2-10-2018) (pdf)
Presentatie onderzoeksresultaten (25-9-2019) (pdf)