Effects of spatial contextual characteristics on personal income

Ana Petrović, Maarten van Ham (TU Delft), David Manley (University of Bristol)

Wat is de relatie tussen de buurt waarin je woont en je individuele inkomen? Dat is de onderzoeksvraag die dit pilotproject (afgerond najaar 2019) heeft beantwoorden.

Om dit te onderzoeken hebben de onderzoekers registerdata gebruikt voor de volledige Nederlandse populatie, ge-geocodeerd in grid cells van 100 bij 100 meter, geaggregeerd op honderd verschillende schaalgroottes. Op basis hiervan creëerden zij gebieden (concentrische cirkels om elke individuele cel) met verschillende stralen, variërend van 100m tot 10km. Voor elke schaalgrootte zijn twee contextuele kenmerken berekend: het aandeel bewoners met een niet-Westerse achtergrond en het aandeel bewoners met een laag inkomen. Deze kenmerken zijn vervolgens gelinkt aan individuele kenmerken zoals inkomen. De resultaten variëren sterk tussen de verschillende schaalgroottes, wat het belang van het meten van spatiële contextuele kenmerken op verschillende schaalgroottes aantoont.

Om de grote databestanden te kunnen analyseren waren computers met minimaal 64GB aan werkgeheugen nodig. Omdat het hier ging om heel veel combinaties van gegevens, is uiteindelijk een cluster ingezet van 25 nodes met 24 cores en 64GB aan werkgeheugen elk. In totaal zijn dat dus 600 processor cores. Ter vergelijking: een laptop heeft er doorgaans 2 of 4. Met dit cluster lukte het om de laatste stap in de analyse uit te voeren in anderhalve week.

In de Remote Access-omgeving van het CBS zou het minimaal vier maanden (maar wellicht twee jaar) hebben gekost om de dataset door te rekenen. Deze rekentijd was via de ODISSEI Secure Supercomputer (OSSC) beduidend korter, wat betekende dat meer variabelen over een langere periode konden worden meegenomen in de analyse.

Presentatie TU Delft-pilot (2-10-2018) (pdf)
Presentatie onderzoeksresultaten (25-9-2019) (pdf)