Arbetarrörelsens minne. Digitalisering av års- och verksamhetsberättelser från LO-förbundens fackliga organisationer 1880-2020
Arbetarrörelsen spelade en avgörande roll för den svenska demokratins utveckling. Inte minst var fackförbunden viktiga vid utformandet av välfärdsstaten och den svenska arbetsmarknadsmodellen. Fackförbunden och Landsorganisationen har också haft stort internationellt inflytande. Deras arkiv erbjuder en unik potential, även i internationell jämförelse, att skapa långa sammanhängande serier av dokumentation över den mest betydelsefulla civila sammanslutningen i Sverige. För att åstadkomma detta behöver materialet digitaliseras och göras sökbart.
Projektet avser att digitalisera verksamhetsberättelser och årsredovisningar från lokala, regionala, nationella och internationella fackliga organisationer från 1880-talet fram till idag. Det digitaliserade materialet kommer att göras sökbart genom indexering och datorlingvistiska sökmetoder som hittar alla förekomster av ett ord, oavsett böjningsform och stavning, vilket markant förbättrar åtkomsten till särskilt de äldre texterna. Arbetarrörelsens arkiv och bibliotek, Folkrörelsearkivet för Uppsala län, Archiv der sozialen Demokratie och Internationella institutet för socialhistoria ansvarar gemensamt för att databasen utvecklas, bevaras och tillgängliggörs för forskare. Det ger förutsättningar för varaktig drift och god tillgänglighet. Tillsammans erbjuder arkivinstitutionerna ett rikt arkivbestånd på lokal till internationell nivå.
Slutredovisning
Slutredovisning, Labour’s Memory (IN20-0040)
SYFTE & UTVECKLING
Syftet med infrastrukturprojektet har varit att tillgängliggöra historiskt källmaterial från den fackliga rörelsen, från lokala organisationer i Sverige till globala federationer. Mängden av organisationer i denna sociala rörelse är stor, och arkivmaterialet är komplext. Genom infrastrukturen skapar vi ingångar till detta material och möjliggör systematiska sökningar som hittills varit ogenomförbara. De öppnar upp för både nya forskningsfrågor och för tillgång till historiska källdokument för fackföreningsorganisationernas medlemmar och för allmänheten. Dessutom har syftet varit att utveckla arkivinstitutioners arbetsprocesser för handskriftstolkning med hjälp av språkmodeller (Large Language Models – LLM) och sökoptimering genom att använda datalingvistiska metoder.
PROJEKTETS RESULTAT HITTILLS
Fyra arkivinstitutioner med olika tekniska förutsättningar deltog i projektet. International Institute for Social History (IISH) i Amsterdam och Archiv der soziale Demokratie (AdSD) i Bonn hade båda arbetsprocesser för att digitisera och( tillgängliggöra arkivmaterial integrerade i sin verksamhet. Arbetarrörelsens arkiv och bibliotek (ARAB) i Huddinge och Folkrörelsearkivet för Uppsala län (FAC) i Uppsala saknade detta när projektet startade. Ett resultat är därför att detta arbetssätt numera är en del av dessa två institutioners vardagliga arbete. Teknisk utrustning i form av reprostationer, servrar och mjukvara för att texttolka materialet med Optical Character Recognition (OCR) och Handwritten Text Recognition (HTR), paketera och arkivera det och publicera det på internet är på plats.
Projektet arbetade även fram metoder och mjukvara för handskriftsigenkänning och HTR-tolkning av bildmaterial, samt lematisering och named entity recognition i textmassor. Dessa resultat har presenterats på konferenser och till viss del publicerats. Den öppna källkoden finns publicerad på GitHub.
Vidare har projektet resulterat i ett stort antal digitiserade årsredovisningar från den fackliga rörelsen. IISH och AdSD, vars arkiv håller materialet från de internationella fackliga organisationerna, har digitiserat allt material de satte ut att bidra med till projektet. De har publicerat delar av det och kommer att färdigställa denna sista fas under våren 2026. FAC, som håller det svenska lokala och regionala materialet från Uppsala län, har digitiserat (reprofotograferat) allt material som identifierades vid projektets inledning. Det handskrivna materialet har texttolkats och publicerats; det maskinskrivna och stencilerade texttolkas löpande. ARAB, som håller arkiven för de svenska fackliga organisationerna på nationell nivå, har koncentrerat sig på att digitisera material och publicera material från ett urval av organisationer, för att kunna ge bredd till samlingen. Arbetet med att färdigställa allt material i ARAB:s samlingar kommer att fortgå löpande, som en del av institutionens verksamhet.
Plattformen laboursmemory.org, där de fyra arkivens material finns publicerat, tillsammans med sökverktyg och instruktioner, lanserades den 7 november 2025.
ANVÄNDNING OCH PÅBÖRJAD FORSKNING
Den forskning som hittills har påbörjats med hjälp av infrastrukturen har främst rört metoder för handskriftstolkning och datalingvistiska metoder för normalisering av språk, samt Named Entity Recognition (NER). Vidare har forskning bedrivits i användarstudier på infrastrukturens potentiella användargrupper. Arbetet med projektet har löpande presenterats på konferenser för att dels informera potentiella användare om infrastrukturens existens, dels för att ta in synpunkter för att kunna finjustera den. Vidare har artiklar publicerats av deltagare i projektet och ett antal studentarbeten på mastersnivå har genomförts. En mätning av trafiken till webbtjänsten sedan lanseringen visar att materialet används, så tillvida att det läses av användare. Interaktion med användare sker även i frågor som rör tekniska problem, eller önskemål om förbättringar.
PROBLEM OCH AVVIKELSER FRÅN PLANEN
Arbetet i projektet drog i gång på allvar 2021, men fick planeras om på grund av covid-19-pandemin. De inledande workshops som planerats, vars syfte var att svetsa samman projektgruppen och utarbeta gemensamma arbetssätt, fick hållas digitalt. Detta ledde till att projektet inledningsvis led av ett visst stuprörsarbete. Projektdeltagarna arbetade inom sina expertisområden, men samordningen mellan dem blev lidande då gemensamma möten inte kunde arrangeras som planerat och vanan vid att arbeta online ännu inte var så stor. Detta förbättrades med tiden, men det påverkade projektarbetet till en början.
Arbetet med att skanna och processa bildmaterialet har tagit fler personalresurser i anspråk än vad som planerades i ansökan. Dessutom kom livet emellan med såväl sjukskrivningar som barnledighet, varför en omfördelning av resurser i projektet har skett från budgetposterna Lön/LKP till Drift. Vidare krävdes större insatser från tekniska konsulter för att ta fram de serverlösningar vi valde att använda, något som också påverkade kostnaderna för Drift. Det har dock inte påverkat själva målet med projektet. Materialet har digitiserats, infrastrukturen är på plats och den används.
Lösningen med en IIIF-läsare på en gemensam plattform (Omeka) som anropar lokala IIIF-servrar på arkiven, var inte uttänkt i projektansökan, som utgår från lokal e-arkivering och leverans av visningskopior till en gemensam plattform. Den valda lösningen var en upptäckt på vägen, och en bättre lösning. Det decentraliserar ansvaret för vad som presenteras till de enskilda arkiv som äger dem eller ansvarar inför deponenterna. Samtidigt är det en flexibel lösning som öppnar för att fler arkivinstitutioner kan ansluta, om de förvaltar en egen IIIF-server.
Ett visserligen förutsett metodiskt problem var de enskilda arkivens förhållande till GDPR och hanteringen av känsliga personuppgifter (bl.a. uppgifter om facklig tillhörighet). Den förblev ett problem längre än väntat, då Riksarkivets klargörande författning kom först vid projektets slutskede hösten 2024 (RA-FS 2024:8) och fortfarande håller på att implementeras på arkiven. Försiktighetsmässigt lades en tidsgräns på 90 år för publicering av klubbars och avdelningars verksamhetsberättelser på laboursmemory.org, 70 år för förbund på riksnivå. Det yngre materialet blir dock tillgängligt med ett inloggningskonto för dem som kan beredas tillstånd att ta del av det. FAC exporterar till Enskilda e-arkivets plattform och ARAB upprättar en liknande lösning. Det internationella materialet har av respektive ansvarig arkivinstitution bedömts inte innehålla uppgifter som berörs av GDPR och därför publicerats i sin helhet.
INTEGRERING I ORGANISATIONEN OCH LÅNGSIKTIGT UNDERHÅLL
Arbetet med digitisering, arkivering och distribution av arkivpaket är nu en integrerad del av de deltagande arkivinstitutionernas verksamhet. Varje institution ansvarar för sin samling och genom IIIF-standarden (International Image Interoperability Framework, en standard för transport och visning av bilder på webben) tillgängliggörs den i webbtjänsten laboursmemory.org. Genom IIIF kan det digitiserade materialet även tillgängliggöras i andra sammanhang om institutionerna så önskar. Allt material är producerat och publicerat enligt FAIR-principerna om öppen data. Det är något som garanterar projektets långsiktighet.
Webbtjänsten, med samlingen av material från de fyra deltagande institutionerna, drivs och uppdateras av ARAB och ingår nu i institutionens långsiktiga arbete för att tillgängliggöra arkivmaterial för forskning.
TILLGÄNGLIGHET & OPEN SCIENCE
Det digitala materialet och all metadata är publicerade öppet på laboursmemory.org. Plattformen är byggd på OpenSource-progamvaran Omeka S. Arkiverings- och publiceringssystemet som används av ARAB och FAC är OpenSource, Archivematica. IIIF-servern som används för att distribuera arkivpaketen är Archival-IIIF, även den OpenSource. LMming, den egenutvecklade programvaran för metadata-hantering, språknormalisering och NER-processer, är OpenSource och publicerad på GitHUB.
INTERNATIONELLA SAMARBETEN
Projektet var från första början ett internationellt samarbete, då både IISH i Amsterdam och AdsD i Bonn ingick i projektgruppen. Under arbetets gång har dessutom viktiga lärdomar dragits från det samarbete som ARAB har med andra arbetarrörelsearkiv runt om i världen, genom organisationen International Association of Labour History Institutions (IALHI). Detta resulterade bland annat i att två av de deltagande arkivarierna i projektet kunde delta i ett kunskapsutbyte med Amsab-Instituut voor Sociale Geschiedenis i Gent för projektets räkning.
PUBLIKATIONER
Se bifogad publikationslista
LÄNKAR TILL WEBBTJÄNSTER FRAMTAGNA I PROJEKTET
www.laboursmemory.org (Den publicerade samlingen och söktjänsten)
https://backstage.laboursmemory.org (användarresurs för ARAB:s och FAC:s personal).
https://iiif.arbark.se (ARAB:s IIIF server)
https://iiif.fauppsala.se (FAC:s IIIF server)
SYFTE & UTVECKLING
Syftet med infrastrukturprojektet har varit att tillgängliggöra historiskt källmaterial från den fackliga rörelsen, från lokala organisationer i Sverige till globala federationer. Mängden av organisationer i denna sociala rörelse är stor, och arkivmaterialet är komplext. Genom infrastrukturen skapar vi ingångar till detta material och möjliggör systematiska sökningar som hittills varit ogenomförbara. De öppnar upp för både nya forskningsfrågor och för tillgång till historiska källdokument för fackföreningsorganisationernas medlemmar och för allmänheten. Dessutom har syftet varit att utveckla arkivinstitutioners arbetsprocesser för handskriftstolkning med hjälp av språkmodeller (Large Language Models – LLM) och sökoptimering genom att använda datalingvistiska metoder.
PROJEKTETS RESULTAT HITTILLS
Fyra arkivinstitutioner med olika tekniska förutsättningar deltog i projektet. International Institute for Social History (IISH) i Amsterdam och Archiv der soziale Demokratie (AdSD) i Bonn hade båda arbetsprocesser för att digitisera och( tillgängliggöra arkivmaterial integrerade i sin verksamhet. Arbetarrörelsens arkiv och bibliotek (ARAB) i Huddinge och Folkrörelsearkivet för Uppsala län (FAC) i Uppsala saknade detta när projektet startade. Ett resultat är därför att detta arbetssätt numera är en del av dessa två institutioners vardagliga arbete. Teknisk utrustning i form av reprostationer, servrar och mjukvara för att texttolka materialet med Optical Character Recognition (OCR) och Handwritten Text Recognition (HTR), paketera och arkivera det och publicera det på internet är på plats.
Projektet arbetade även fram metoder och mjukvara för handskriftsigenkänning och HTR-tolkning av bildmaterial, samt lematisering och named entity recognition i textmassor. Dessa resultat har presenterats på konferenser och till viss del publicerats. Den öppna källkoden finns publicerad på GitHub.
Vidare har projektet resulterat i ett stort antal digitiserade årsredovisningar från den fackliga rörelsen. IISH och AdSD, vars arkiv håller materialet från de internationella fackliga organisationerna, har digitiserat allt material de satte ut att bidra med till projektet. De har publicerat delar av det och kommer att färdigställa denna sista fas under våren 2026. FAC, som håller det svenska lokala och regionala materialet från Uppsala län, har digitiserat (reprofotograferat) allt material som identifierades vid projektets inledning. Det handskrivna materialet har texttolkats och publicerats; det maskinskrivna och stencilerade texttolkas löpande. ARAB, som håller arkiven för de svenska fackliga organisationerna på nationell nivå, har koncentrerat sig på att digitisera material och publicera material från ett urval av organisationer, för att kunna ge bredd till samlingen. Arbetet med att färdigställa allt material i ARAB:s samlingar kommer att fortgå löpande, som en del av institutionens verksamhet.
Plattformen laboursmemory.org, där de fyra arkivens material finns publicerat, tillsammans med sökverktyg och instruktioner, lanserades den 7 november 2025.
ANVÄNDNING OCH PÅBÖRJAD FORSKNING
Den forskning som hittills har påbörjats med hjälp av infrastrukturen har främst rört metoder för handskriftstolkning och datalingvistiska metoder för normalisering av språk, samt Named Entity Recognition (NER). Vidare har forskning bedrivits i användarstudier på infrastrukturens potentiella användargrupper. Arbetet med projektet har löpande presenterats på konferenser för att dels informera potentiella användare om infrastrukturens existens, dels för att ta in synpunkter för att kunna finjustera den. Vidare har artiklar publicerats av deltagare i projektet och ett antal studentarbeten på mastersnivå har genomförts. En mätning av trafiken till webbtjänsten sedan lanseringen visar att materialet används, så tillvida att det läses av användare. Interaktion med användare sker även i frågor som rör tekniska problem, eller önskemål om förbättringar.
PROBLEM OCH AVVIKELSER FRÅN PLANEN
Arbetet i projektet drog i gång på allvar 2021, men fick planeras om på grund av covid-19-pandemin. De inledande workshops som planerats, vars syfte var att svetsa samman projektgruppen och utarbeta gemensamma arbetssätt, fick hållas digitalt. Detta ledde till att projektet inledningsvis led av ett visst stuprörsarbete. Projektdeltagarna arbetade inom sina expertisområden, men samordningen mellan dem blev lidande då gemensamma möten inte kunde arrangeras som planerat och vanan vid att arbeta online ännu inte var så stor. Detta förbättrades med tiden, men det påverkade projektarbetet till en början.
Arbetet med att skanna och processa bildmaterialet har tagit fler personalresurser i anspråk än vad som planerades i ansökan. Dessutom kom livet emellan med såväl sjukskrivningar som barnledighet, varför en omfördelning av resurser i projektet har skett från budgetposterna Lön/LKP till Drift. Vidare krävdes större insatser från tekniska konsulter för att ta fram de serverlösningar vi valde att använda, något som också påverkade kostnaderna för Drift. Det har dock inte påverkat själva målet med projektet. Materialet har digitiserats, infrastrukturen är på plats och den används.
Lösningen med en IIIF-läsare på en gemensam plattform (Omeka) som anropar lokala IIIF-servrar på arkiven, var inte uttänkt i projektansökan, som utgår från lokal e-arkivering och leverans av visningskopior till en gemensam plattform. Den valda lösningen var en upptäckt på vägen, och en bättre lösning. Det decentraliserar ansvaret för vad som presenteras till de enskilda arkiv som äger dem eller ansvarar inför deponenterna. Samtidigt är det en flexibel lösning som öppnar för att fler arkivinstitutioner kan ansluta, om de förvaltar en egen IIIF-server.
Ett visserligen förutsett metodiskt problem var de enskilda arkivens förhållande till GDPR och hanteringen av känsliga personuppgifter (bl.a. uppgifter om facklig tillhörighet). Den förblev ett problem längre än väntat, då Riksarkivets klargörande författning kom först vid projektets slutskede hösten 2024 (RA-FS 2024:8) och fortfarande håller på att implementeras på arkiven. Försiktighetsmässigt lades en tidsgräns på 90 år för publicering av klubbars och avdelningars verksamhetsberättelser på laboursmemory.org, 70 år för förbund på riksnivå. Det yngre materialet blir dock tillgängligt med ett inloggningskonto för dem som kan beredas tillstånd att ta del av det. FAC exporterar till Enskilda e-arkivets plattform
INTEGRERING I ORGANISATIONEN OCH LÅNGSIKTIGT UNDERHÅLL
Arbetet med digitisering, arkivering och distribution av arkivpaket är nu en integrerad del av de deltagande arkivinstitutionernas verksamhet. Varje institution ansvarar för sin samling och genom IIIF-standarden (International Image Interoperability Framework, en standard för transport och visning av bilder på webben) tillgängliggörs den i webbtjänsten laboursmemory.org. Genom IIIF kan det digitiserade materialet även tillgängliggöras i andra sammanhang om institutionerna så önskar. Allt material är producerat och publicerat enligt FAIR-principerna om öppen data. Det är något som garanterar projektets långsiktighet.
Webbtjänsten, med samlingen av material från de fyra deltagande institutionerna, drivs och uppdateras av ARAB och ingår nu i institutionens långsiktiga arbete för att tillgängliggöra arkivmaterial för forskning.
TILLGÄNGLIGHET & OPEN SCIENCE
Det digitala materialet och all metadata är publicerade öppet på laboursmemory.org. Plattformen är byggd på OpenSource-progamvaran Omeka S. Arkiverings- och publiceringssystemet som används av ARAB och FAC är OpenSource, Archivematica. IIIF-servern som används för att distribuera arkivpaketen är Archival-IIIF, även den OpenSource. LMming, den egenutvecklade programvaran för metadata-hantering, språknormalisering och NER-processer, är OpenSource och publicerad på GitHUB.
INTERNATIONELLA SAMARBETEN
Projektet var från första början ett internationellt samarbete, då både IISH i Amsterdam och AdsD i Bonn ingick i projektgruppen. Under arbetets gång har dessutom viktiga lärdomar dragits från det samarbete som ARAB har med andra arbetarrörelsearkiv runt om i världen, genom organisationen International Association of Labour History Institutions (IALHI). Detta resulterade bland annat i att två av de deltagande arkivarierna i projektet kunde delta i ett kunskapsutbyte med Amsab-Instituut voor Sociale Geschiedenis i Gent för projektets räkning.
PUBLIKATIONER
Se bifogad publikationslista
LÄNKAR TILL WEBBTJÄNSTER FRAMTAGNA I PROJEKTET
www.laboursmemory.org (Den publicerade samlingen och söktjänsten)
https://backstage.laboursmemory.org (användarresurs för ARAB:s och FAC:s personal).
https://iiif.arbark.se (ARAB:s IIIF server)
https://iiif.fauppsala.se (FAC:s IIIF server)