Mats Malm

Nya vägar till det förflutna. Det litterära kulturarvet som källmaterial för humaniora och samhällsvetenskap

Skönlitteraturen är en unik källa till vår historia: den är inte en historisk representation av fakta, men den gestaltar och bearbetar olika tiders samhälleliga och individuella problem och frågor. Skönlitteraturen är alltså ett centralt källmaterial inte bara för litteratur- och språkforskare, utan också för historiker, sociologer, antropologer, idéhistoriker och en lång rad andra humanistiska och samhällsvetenskapliga forskningsinriktningar. Eller, rättare: den kan bli det, om den digitaliseras och görs tillgänglig för utforskning med avancerade verktyg. Den internationella utvecklingen är intensiv, och det svenska materialet blir alltså utgångspunkten för innovativa internationella samarbeten som inbegriper helt nya former av teoretiskt och metodologiskt utbyte över ämnesgränserna. Detta projekt avser att ställa ett sådant material till forskningens förfogande genom att digitalisera den svenska skönlitteratur som publicerades separat under hela 1800-talet. Materialet speglar ett sekel som kännetecknas av intensiv kulturell och samhällelig förändring. Det utgör därmed en rik grund för analyser av utveckling och förändring på en lång rad områden. Hela materialet görs tillgängligt för forskningen i tre portaler med olika nyutvecklade redskap för att utforska det, och nerladdningsbart. Det blir också tillgängligt för allmänheten, skolor och bibliotek, som därmed får nya möjligheter att närma sig och levandegöra det litterära kulturarvet.
Slutredovisning
Litteraturbanken, ideell förening, beviljades år 2019 bidrag för att etablera en korpus med 1800-talets separatpublicerade skönlitterära verk författade på svenska. Samlingen skulle ställas till forskningens och allmänhetens förfogande, läs- och sökbar på litteraturbanken.se samt nerladdningsbar för de forskare och projekt som har tillgång till mer sofistikerade analysredskap. Medlen fick disponeras till och med utgången av 2023, men Riksbankens Jubileumsfond godkände en förlängning på ett år.
De ekonomiska delarna av projektet är nu avslutade: alla leveranser från Uppsala universitetsbibliotek och Kungliga biblioteket är utförda och betalda.
Tillgängliggörandet i litteraturbanken.se, där varje verk också får ett beständigt ID, är ännu inte avslutat: arbetet med databasfiler och annan hantering beräknas vara avslutat i början av 2026.
De analysredskap, utöver Litteraturbankens vanliga sökverktyg, som utvecklats inom projektet har tillgängliggjorts i en preliminär version på https://littlabb.dh.gu.se. Redskapen är av två slag: ett för spårning av textuella överensstämmelser mellan olika verk i korpusen och ett för spårning av grafiska överensstämmelser: bokhistoriska element som illustrationer, anfanger med mera.
Materialet tillgängliggörs också i Alvin (alvin.org) för bokhistorisk tillgång och i Språkbankens avdelning KORP, där det kopplas till en mängd språkteknologiska redskap. Allt som är digitaliserat vid UUB och Riksarkivet Fränsta finns också i Alvin. Delar av digitaliseringar som gjorts vid KB finns också i Alvin, främst 1800-talsmaterial. Organisationerna ansvarar för det långsiktiga bevarandet och Svenska Akademien ansvarar för det långsiktiga bevarandet av Litteraturbanken. Materialet är Public Domain.
Projektets katalogiseringsarbete har utgått från den nationella databasen Libris, som saknade många av posterna. Libris har alltså kompletterats avsevärt genom projektet. Allt som digitaliserats genom projektet kommer också att finnas tillgängligt i Libris. Det mesta är redan inlagt.


Utfall mot plan
Enligt projektplanen skulle 8 600 böcker digitaliseras, främst genom Uppsala universitetsbibliotek och Riksarkivets digitiseringscentrum i Fränsta. Det visade sig att samtidigt som ett antal böcker som inte fanns i Libris påträffades i UUB:s samlingar och kunde tillföras, var det ett stort antal böcker i Libris som inte fanns i UUB:s samlingar. Det mesta kunde i stället beställas från Kungl. biblioteket.
Antalet böcker har totalt visat sig vara något mindre än beräknat. Antalet sidor per bok, som uppskattades till i snitt 250 per bok, visade sig vara något lägre. Kostnaderna för 1800-talet blev alltså lägre än planerat. Efter avstämning med RJ utsträckte vi tiden till 1789–1912. Därmed täcker projektet nästan det hela så kallade långa 1800-talet. Rättighetsproblematiken gör att bortfall av verk som kan tillgängliggöras ökar mot slutet av perioden.

Beräknat antal böcker att digitalisera: 8 600
Antal faktiskt digitaliserade böcker inom projektet: 9 070
Beräknat antal böcker för 1800-talet, inkl. tidigare digitaliserat material: 11 200
Faktiskt antal böcker för 1800-talet, inkl. tidigare digitaliserat material: c:a 10 500
Antal digitaliserade böcker 1789–1799: 474
Antal digitaliserade böcker 1900–1912: c:a 2 200

Tillgängliggjort material
I februari 2025 hade 6 233 böcker från projektet införlivats i litteraturbanken.se: de resterande kommer att vara införlivade inom ett år och först då kommer projektet i sin helhet att vara avslutat. I huvudsak är det material från 1901–1912 som ännu inte införts i databaserna. Materialets fördelning på genrer är än så länge preliminär eftersom beräkningen inte inkluderar det material som ännu inte införts, men för just 1800-talet bör de preliminära siffrorna vara i hög grad rättvisande. I det hittills tillgängliggjorda materialet är c:a 5% barnlitteratur och 6% finlandssvenskt.

Forskning
Det är alltså inte riktigt än som hela materialet kan användas för avgränsade och komparerande studier av perioden 1800–1900 – eller 1789–1912, men materialet har redan kommit många forskare till nytta. Till de större projekt som utnyttjar materialet hör:
Hur skönlitteraturen gjorde svenskan modern. Fiktionsprosa, författare och språkförändring 1830–1930” (ledare David Håkansson, Uppsala universitet), finansierat av Vetenskapsrådet (https://www.vr.se/swecris.html#/project/2020-02617_VR).
”Språkförändring och sakprosa – en storskalig studie av den moderna svenskans historia (1800–1950)” (ledare Sara Stymne, Uppsala universitet), finansierat av Vetenskapsrådet (https://www.vr.se/swecris.html#/project/2024-01027_VR).
I RJ-programmet ”Change is key!” (ledare Nina Tahmasebi, Göteborgs universitet, https://www.changeiskey.org) inbegriper en delstudie (2026–2027) av Mats Malm som baseras på det sena 1800-talets material.
I en programansökan under arbete, ledd av Jacob Habinek, Linköpings universitet, kommer 1800-talsmaterialet att vara av fundamental betydelse för genomförandet.
Genom att materialet knyts till Språkbankens ordforskningsplattform KORP (https://spraakbanken.gu.se/korp) kommer den språkvetenskapliga forskningen att kunna utföra analyser av 1800-talets språk med betydligt större täckning än tidigare.
Materialet används också i det nystartade skandinavisk-amerikanska samarbetsprojektet ScanTextS (Scandinavian Text reuSe detection) som leds av Nils Holger Németh Berg, Syddansk universitet och Tim Tangherlini, Berkeley.
Materialet ligger också till grund för pågående planering av ett dansk-svensk-norskt samarbete kring 1800-talet.
Bidragsförvaltare
Litteraturbanken
Diarienummer
In19-0176:1
Summa
SEK 10 446 000
Stödform
RJ Infrastruktur för forskning
Ämne
Litteraturstudier
År
2019