Ola Hall

Hushållsdata, satellitbilder och maskininlärning inom utvecklingsforskning: Är det (till slut) dags för satellitbilder inom samhällsvetenskap?

Syftet med det här projektet är att förbättra kunskapen om hur den afrikanska landsbygden och särskilt jordbruket har förändrats och hur det har påverkat bland annat fattigdomen i regionen. Traditionellt så förutsätter ett sådant syfte att en kombination av typiska samhällsvetenskapliga metoder används, framför allt hushållsintervjuer och fältobservationer, något som vår forskargrupp har lång erfarenhet att arbeta med. Projektet adresserar även den omtvistade teoretiska frågan om vad som driver jordbrukets strukturomvandling. I det här projektet kommer vi att tillämpa ett för samhällsvetenskap helt nytt angreppssätt. Vi kommer att applicera metoder som påminner om de som tillämpas för bland annat ansiktsigenkänning. Istället för ansikten så kommer vi att analysera detaljerade satellitbilder över jordbrukslandskap. Målet är att genom maskininlärning träna en algoritm att känna igen byar som t ex är fattiga eller byar där jordbruksproduktionen ökar. Eftersom satellitbilder är yttäckande på ett helt annat sätt än urvalsstudier och kan förekomma flera gånger per år så kommer vi att kunna följa utvecklingen över tid och rum på ett helt nytt sätt. Projektet är välförsett med hushållsdata för perioden 2001 – 2017 så vi kommer att kunna göra en noggrann utvärdering av resultatet och metoden. Det är troligt att kunskapen från det här projektet kommer att kunna föras till den samhällsvetenskapliga verktygslådan, i sin helhet eller delvis.
Slutredovisning
Scientific Final Report MXM19-1104:1

Project: Mixing household surveys, satellite imagery and machine learning in human development studies: Is it (finally) time for satellite imagery in social science research?
Project period: 2020–2022
Principal Investigator: Ola Hall

1. Project Aim and Research Questions

Projektet syftade till att öka förståelsen för jordbrukets och landsbygdens omvandling i samtida subsahariska Afrika, med särskilt fokus på fattigdomsminskning, fördelningsdynamik och underliggande drivkrafter. Det adresserade en långvarig teoretisk debatt inom agrara studier: huruvida jordbrukets omvandling i första hand genererar inkluderande tillväxt, såsom förespråkas inom modeller för pro-poor agricultural growth, eller om den driver differentiering och utarmning, såsom föreslås inom neo-marxistiska perspektiv.

Det övergripande syftet operationaliserades genom fyra centrala forskningsfrågor:

1. Vilka är de fördelningsmässiga dynamikerna i förändringar av fattigdom och jordbruksavkastning över tid?

2. Hur är jordbrukets omvandling relaterad till kommersialisering, och vilka är de fördelningsmässiga konsekvenserna?

3. Vilka är konsekvenserna av pluriactivity (inkomstdiversifiering utanför det egna jordbruket)?

4. Hur varierar dessa processer rumsligt och hur hänger de samman?

Metodologiskt föreslog projektet en mixed-methods-design som integrerar hushållsdata, högupplösta satellitbilder, nattljusdata, vegetationsindex, deep learning, transfer learning och ekonometrisk modellering.

2. Methodological Development and Data Integration

Projektet implementerade det föreslagna analytiska arbetsflödet som beskrivs i ansökan (se Figure I, p. 13 i ansökan).

Det analytiska flödet bestod av:
• Sammanställning och harmonisering av enkätdata (Afrint och andra hushållsdataset)
• Extraktion av högupplösta satellitbilder tagna dagtid
• Integrering av nattljusdata (DMSP-OLS och VIIRS)
• Användning av vegetationsindex (MODIS, TERRA, AQUA)
• Träning av konvolutionella neurala nätverk (CNNs)
• Transfer learning
• Ekonometrisk modellering med multilevel-specifikationer

Omfattande dataset sammanställdes, inklusive:
• Afrint paneldata (cirka 3,000 hushåll)
• Utökade enkätdata som omfattar upp till 100,000 hushåll i subsahariska Afrika
• DHS-data på bynivå
• Nattljusdata som täcker den afrikanska kontinenten
• Satellitmosaiker dagtid för flera länder, inklusive Tanzania

Projektet operationaliserade fattigdom, intensifiering, kommersialisering och pluriactivity på bynivå, i enlighet med den ursprungliga designen. Deep learning-metoder utvecklades och utvärderades för prediktion av fattigdom baserat på satellitbilder. Empiriska tester visade att CNN-baserade modeller överträffade mänskliga experter i rangordning av fattigdomsnivåer från satellitbilder (Sarmadi et al., 2024; Wahab & Hall, 2022). Samtidigt visade forskning om tolkbarhet att modellerna i huvudsak fångade storskaliga geografiska signaler snarare än finfördelade multidimensionella fattigdomskarakteristika (Watmough et al., 2025; Hall et al., 2022). Detta föranledde vidare arbete om explainable AI och domänbias.

3. Empirical Findings

3.1 Agricultural Transformation and Rural Differentiation

Longitudinella analyser på bynivå visade breda förbättringar i levnadsstandard på landsbygden i flera afrikanska kontexter, men också ökande differentiering, särskilt relaterad till mark- och tillgångsinnehav (Andersson Djurfeldt, 2022). Livsmedelsöverföringar och translokala försörjningsstrategier framträdde som centrala mekanismer som upprätthåller landsbygdshushåll över rural–urban rum (Andersson Djurfeldt, 2022, Journal of Rural Studies).

Fallstudiebaserad forskning om kassavaindustrin i Ghana dokumenterade jordbrukets omvandling på lokal nivå driven av kommersialisering och teknologisk förändring (Andersson et al., 2024). Forskning om yield gaps visade att socioekonomiska och institutionella faktorer är avgörande vid sidan av agronomiska variabler (Hall et al., 2024; Wahab et al., 2020; Sussy et al., 2019).

Dessa resultat bidrar till den debatt som formulerades i den ursprungliga ansökan genom att visa att jordbrukets omvandling kan generera både inkluderande förbättringar och differentieringsprocesser, beroende på kontext och skala.

3.2 Satellite Imagery, Poverty Mapping and AI

Projektet har avsevärt fördjupat den metodologiska förståelsen av fattigdomsskattning baserad på Earth Observation-data:

• Översiktsartiklar sammanfattade forskningsläget (Hall et al., 2023; Hall et al., 2022).
• Empiriska studier visade CNN-modellers överlägsenhet jämfört med mänskliga bedömare (Sarmadi et al., 2024).
• Bias- och tolkbarhetsproblem identifierades (Watmough et al., 2025).
• Experiment med stora språkmodeller för rangordning av fattigdom genomfördes (Sarmadi et al., 2025).
• Drönarbaserade metoder granskades och placerades inom den rumsliga samhällsvetenskapen (Hall & Wahab, 2021).

Resultaten bekräftar möjligheten att skatta välfärdsproxyvariabler från satellitbilder, men visar också begränsningar vad gäller kausal tolkning och representation av multidimensionell fattigdom — frågor som förutsågs i den ursprungliga vetenskapsteoretiska diskussionen.

4. Theoretical and Methodological Contributions

Projektet bidrar till:

Agrar teori:
Genom empirisk analys av rumsliga och fördelningsmässiga dynamiker tillhandahålls evidens relevant för debatten mellan pro-poor growth- och differentieringsperspektiv.

Mixed methods research:
Projektet operationaliserar en realistisk mixed-methods-ram som kombinerar AI-härledda indikatorer med ekonometrisk kausal modellering, i enlighet med det ursprungliga förslaget.

Remote sensing in social science:
Det visar både möjligheterna och begränsningarna i att ersätta eller komplettera enkätbaserade data med satellitbaserade indikatorer.

Explainable AI in development research:
Projektet fördjupar förståelsen av tolkbarhet, bias och kausala begränsningar inom fattigdomskartläggning.

5. Policy Relevance and Broader Impact

Projektet adresserar direkt problemet med ”data poverty” i subsahariska Afrika som beskrevs i den ursprungliga ansökan.
Bidragsförvaltare
Lunds universitet
Diarienummer
MXM19-1104:1
Summa
SEK 5 139 000
Stödform
Mixade metoder
Ämne
Kulturgeografi
År
2019