Jonas Helgertz

SwedPop – en vidareutveckling av en nationell datainfrastruktur genom automatiserad transkribering och länkning, ett historiskt personnummer, och förbättrad tillgänlighet

Projektet syftar till att utöka omfattningen och tillgängligheten av svenska historiska befolkningsdata, en viktig nationell datainfrastrukturtillgång. För det första kommer projektet att transkribera och tillgängliggöra samtliga födelseböcker för perioden 1800-1899 genom implementering av maskininlärningsmetoder för automatisk handskriftsigenkänning. Tillsammans med redan tillgängliga databaser som innehåller individdata om dödlighet och emigration, kommer dessa att användas för att utforma och implementera en metod för att generera ett historiskt personnummer. Detta kommer inte bara att underlätta för framtida forskning genom att erbjuda ett enkelt sätt att kombinera olika historiska dataset, utan också öka den vetenskapliga integriteten i framtida forskning på historiska individdata. För det tredje kommer projektet att utveckla och tillgängliggöra en pipeline för länkning av historiska individdata med hjälp av maskininlärning. Detta kommer inte bara att höja länkningskvaliteten mellan redan befintliga data, utan också avsevärt underlätta och standardisera länkningen av individdata som för närvarande och i framtiden genereras. För det fjärde kommer en långsiktigt hållbar modell för lagring och tillgängliggörande av funktionaliteter och data att utvecklas. Testade och standardiserade protokoll för datasäkerhet och lagring, tillsammans med innovativa webbaserade gränssnitt för datauttag, kommer att säkerställa enkel och oavbruten tillgång till data under lång tid framöver.
Bidragsförvaltare
Lunds universitet
Diarienummer
IN25-0029
Summa
SEK 29 970 000
Stödform
RJ Infrastruktur för forskning
Ämne
Ekonomisk historia
År
2025