Torsten Johansson

Digitalisering av ett urval av äldre svenska dagstidningar

Dagstidningarna har i två sekler setts som garanter för demokrati och fritt meningsutbyte och de är oumbärliga informationskällor för forskare. Papperet de tryckts på har däremot dålig beständighet. För att bevara informationen för framtiden har dagspressen mikrofilmats sedan 1950-talet, men dessa samlingar kräver Fysisk tillgång och sökmöjligheterna i materialet är begränsade.
Modern digital teknik har fört utvecklingen framåt. Genom att konvertera den digitala bilden till maskinläsbar text (OCR-tolkning) möjliggörs fritextsökningar, vilket underlättar för den som söker svar på specifika frågor och öppnar för helt nya typer av undersökningar.
KB och Riksarkivet har sedan 2010 byggt upp en produktionslinje för massdigitalisering av dagspress och KB har konstruerat ett gränssnitt för materialet. Nu pågår arbetet med att fylla gränssnittet, en verksamhet som kan följas på .
För att nyttiggöra denna struktur är det nödvändigt att få ut material direkt till forskningen över nätet. KB:s nuvarande budgetramar medger endast digitalisering av de löpande inkomna pliktleveranserna. Samtidigt kolliderar forskarsamhällets behov av fritt tillgängligt material med upphovsrättens begränsningar.
Detta projekt syftar till digitalisering av ett strategiskt urval dagstidningar för en period då materialet är upphovsrättsligt fritt. På så sätt kommer forskningsinfrasfrukturen att kunna substantiellt förbättras trots de tvingande begränsningarna.
Slutredovisning

1.1.    Digitalisering av ett urval av äldre svenska dagstidningar IN15-0452:1 Slutrapport

Bakgrund

Dagstidningarna har i två sekler setts som garanter för demokrati och fritt meningsutbyte och de är centrala informationskällor för forskare inom humanistiska och samhällsvetenskapliga forskningsområden.

Dagstidningar har vanligtvis producerats utan höga krav på hållbarhet, papperet de trycks på har ofta låg beständighet. För att bevara informationen för framtiden har dagspressen mikrofilmats sedan 1950-talet, en lösning som innebär en avsevärd bevarandepotential men som inte underlättar sökmöjligheter och användande av materialet.

Den digitala tekniken har radikalt förändrat förutsättningarna. Genom att konvertera den digitala bilden till maskinläsbar text (OCR-tolkning) möjliggörs fritextsökningar, vilket underlättar för den som söker efter specifik information och öppnar för helt nya forskningsstrategier.

Kungliga biblioteket (KB) och Riksarkivet (RA) har sedan 2010 byggt upp en produktionslinje för massdigitalisering av dagspress och KB har utvecklat ett gränssnitt för tillgängliggörande av de digitala samlingarna. KB:s budgetramar medger endast digitalisering av de löpande inkomna pliktleveranserna. Den retrospektiva digitaliseringen av KB:s dagstidningssamlingar har genomförts med extern finansiering.


Sammanfattning av projektet

Det här redovisade projektet har fokuserat på digitalisering av ett strategiskt urval dagstidningar för en period då materialet är upphovsrättsligt fritt. Projektet har därmed som syfte att ge digital tillgång till dagspress utan upphovrättsmässiga begränsningar.

KB har erhållit ett anslag på 10 414 268 kr, som ska täcka digitalisering av 44 tidningstitlar för perioden 1645-1895.

Den ursprungliga uppskattningen av samlingens omfång var cirka 1 200 000 sidor. Detta visade sig emellertid vara en underskattning och den exakta siffran blev till slut 1 395 102 sidor.

Digitaliseringsarbetet utfördes av RA/MKC i Fränsta och pågick fram till och med december 2017. Vid en genomgång i slutet av december 2017 visade det sig att fem årgångar ej hade blivit digitaliserade (Post- och inrikes tidningar samt Norrköpings tidningar, totalt 7 848 sidor). Dessa digitaliserades under februari 2018 och är inkluderade i det slutgiltiga sidantalet i stycket ovan.

Det tidningsmaterial vi har arbetat med har varit av varierande tillstånd: från stabil till omfattande nedbrytning. Det slutgiltiga genomsnittliga sidpriset landade på 7,14 kronor.



1.2.    Preparering, registrering och leverans av tidningar på Kungl- biblioteket


Sedan projektstarten i januari 2016 har 1 395 102 sidor preparerats, registrerats och levererats till RA/MKC.

Digitaliseringen utgick ifrån KB:s reservexemplar i den mån sådana fanns att tillgå. Fanns inte reservexemplar så digitaliserades KB:s nationalexemplar. Cirka 85 % av de digitaliserade tidningarna var reservexemplar.

Under projektets första tid var arbetet med att hitta exemplar i KB:s arkiv tämligen tidsödande. Under maj 2016 initierades dock ett projekt med att registrera placering och period för KB:s samtliga tidningsbuntar i Statens biblioteksdepå, där alla tidningar från 1851 och framåt finns arkiverade. Det projektet är nyligen klart och det underlättade storligen den senare delen av projektet och kommer även att så göra i framtida digitaliseringsprojekt.



1.3.    Tillgängliggörande av de digitaliserade tidningarna i KB:s visningstjänst tidningar.kb.se
Tidningarna tillgängliggjordes löpande på tidningar.kb.se allteftersom de blev digitaliserade och arkiverade. Alla tidningssidor finns nu sökbara i tjänsten och det rör sig de om de i bilaga redovisade titlar.[1]


1.4.    Hur har projektet presenterats?
Projektet och dess framåtskridande har presenterats på Kungliga bibliotekets hemsida, Twitter, Facebook och Mynewsdesk vid ett flertal tillfällen.[2][3][4] Artiklar om projektet och dagstidningsdigitalisering har publicerats i Biblioteksbladet 2017[5] och i Släkthistoriskt forum 2017[6][7][8]. Sveriges släktforskarförbund har dessutom kontinuerligt uppdaterat sin hemsida med nyheter kring projektet.[9][10][11] Pressutskick till utvalda tidningar och andra intressenter har också skett vid två tillfällen.
Utvecklingen i projektet uppdateras löpande i tidningstjänstens användarforum.[12] Intresset för projektet kan också spåras i tidningstjänstens externa besöksstatistik som har gått från ett snitt på 150 användare per dygn vid projektets start till över 500 unika användare per dygn i dagsläget.

Tidningsenhetens medarbetare lägger mycket tid på att upplysa om projektet i olika sammanhang. Under 2017 genomfördes större presentationer av projektet på Släktforskardagarna i Halmstad [13] och på Bokmässan i Göteborg.



1.5.    Har projektet resulterad i nya forskningssamarbeten eller nya forskningsuppgifter?
Det finns flera exempel på forskning där det upphovsrättsfria tidningsmaterialet används som grunddata.

Humlab, vid Umeå Universitet, har använt sig av de upphovsrättsfria svenska dagstidningarna från ”data.kb.se” i sitt projekt ”Digital lägg – om pressens gränssnitt 1800”.[14]

Ekonomiforskarna Hanna Stenbacka Köhler och Isaiah Hull från Riksbanken och Hanna Armelius på Finansdepartementet har använt "tidningar.kb.se" i sitt arbete med att konstruera ett osäkerhetsindex.[15][16]

Det kan också konstateras att antalet besökare vid dagstidningsterminalerna i KB:s mikrofilmsläsesal i Humlegården har stigit kraftigt samtidigt som antalet frågor via mail, telefon och sociala medier också har ökat betydligt allteftersom projektet har fortskridit.


Från och med januari 2018 har även Sveriges samtliga universitets- och högskolebibliotek möjligheten att visa allt innehåll i tidningar.kb.se för sina forskare och studenter. Hittills har 16 bibliotek anslutit sig.[17]
Detta är resultatet av det avtal som KB slöt med Bonus Copyright Access under sensommaren 2017, ett avtal som sträcker sig fram till och med 2019-06-30.

KB har också inlett ett samarbete med Språkbanken vid Göteborgs universitet kring tekniska lösningar för att förbättra resultaten vid OCR-tolkning.

Samtliga filer som producerats i projektet fram till och med 2017-12-31 har levererats till Språkbanken och införlivats i deras textkorpus.


1.6.    Ekonomisk redovisning 2016-01-01-2018-03-31

KB har erhållit ett anslag på 10 414 268 kr, som ska täcka digitalisering av cirka 45 tidningstitlar för perioden 1645-1895.

Vi uppskattade ursprungligen samlingen till cirka 1 200 000 sidor. Detta visade sig emellertid vara en underskattning och den exakta siffran blev till slut 1 395 102 sidor.

Själva digitaliseringsarbetet utfördes av RA/MKC i Fränsta och pågick fram till och med december 2017. Vid en genomgång i slutet av december 2017 visade det sig att sammanlagt fem årgångar ej hade blivit digitaliserade. Det rör sig om titlarna Post- och inrikes tidningar samt Norrköpings tidningar och är inalles 7 848 sidor. Detta meddelades till fonden per e-post den 5 februari 2018. Dessa digitaliserades februari och mar 2018 och är inkluderade i det slutgiltiga sidantalet i stycket ovan.

Tillståndet hos det tidningsmaterial vi har arbetat med har varierat avsevärt vilket också påverkat kostnadsbilden. Det slutgiltiga genomsnittliga sidpriset hamnade på 7,14 kronor.

Kostnaden för arbetet som lades ner på MKC fördelas enligt följande:

2016    2 594 687 kr
2017    7 314 077 kr
2018 (resterande 5 årg.)    48 951 kr
Tot.    9 957 715 kr


Av beviljade medel har Kungliga biblioteket via rekvisition begärt ut 10 400 000 kr. Av dessa har alltså 9 957 715 kr använts och kvar av rekvirerade medel återstår 442 285 kr. Dessa kommer att återlämnas till fonden. Kungliga biblioteket behöver därför information om till vilken bank och vilket kontonummer dessa medel skall överföras.

1.7.    Hur integreras arbetet i organisationen? Hur kommer det att vidareföras?

Bidraget från Riksbankens Jubileumsfond till detta projekt har avsevärt stärkt tillgången till historiska dagstidningar. En betydande del av Sveriges äldsta dagstidningar kommer efter projektet att vara tillgängliga för forskningen och allmänheten.

Digitaliseringen av dagstidningar är i dag en central del av vår verksamhet, tyvärr rymmer inte Kungliga bibliotekets budget löpande medel för digitalisering av de historiska samlingarna. För att kunna göra detta behöver vi fortsatt stöd och vi söker därför kontinuerligt bidragsgivare och samarbetspartners som kan möjliggöra detta. Digitaliseringen innebär att forskare och den intresserade allmänheten får tillgång till ett historiskt källmaterial som speglar samhällets utveckling och förändring. Digital tillgänglighet medför således även demokratiska vinster.

Det finns ett stort intresse för detta material och speciellt för dagspressen från det lokala Sverige, de delar av landet som ofta hamnar i skuggan av storstadsregionerna.
Det är också allt mer tydligt att det på medieområdet sker en koncentration kring de större städerna och storstäderna, parallellt med avfolkningen av landsbygden, vilket också belyser vikten av att digitalisera det historiska och regionala samlingarna. Vårt mål är att efter detta projekt söka medel för att kunna digitalisera den resterande delen av de äldsta tidningssamlingarna.



1.8.    Projektrapportering från KB till Riksbankens Jubileumsfond
•    Halvårsrapport: 2016-06-13
•    Ettårsrapport: 2017-01-23
•    Artonmånadersrapport: 2017-07-10
•    Följebrev till delredovisning: 2017-07-12
•    Revisionsrapport: 2017-07-21 (lämnad i portal)
•    Resultat av en efterkontroll i IN15-0452:1: 2018-02-05
•    Digitalisering av ett urval av äldre svenska dagstidningar IN15-0452: Slutrapport: 2018-04-24






Torsten Johansson
Newspaper Division
National Library of Sweden
+46 10 7093402
torsten.johansson@kb.se





Referenser

1.    Se bilaga ”RJ, titlar”
2.    http://www.kb.se/aktuellt/nyheter/2016/Slaktforska-och-folj-1800-talets-nyhetsrapportering--KBs-soktjanst-for-dagstidningar-vaxer/
3.    http://www.kb.se/aktuellt/nyheter/2017/Annu-mer-historiska-nyheter-i-KBs-onlinetjanst2/
4.    http://www.kb.se/aktuellt/nyheter/2017/En-miljon-fria-tidningssidor-i-KBs-soktjanst/
5.    http://biblioteksbladet.se/skatten-i-kallarhalan/
6.    Svensson, Hanna; ”En skattkista för tidningsälskare”; Släkthistoriskt forum; nr 1, 2017, s 18-21. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
7.    Lindström, Christer; ”Tidningarna gav svar på sekelgammal gåta”; Släkthistoriskt forum; nr 1, 2017, s 22. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
8.    Söderström; Olle och Svensson, Hanna; ”Upphovsrätt bakom tidningstrasslet”; Släkthistoriskt forum; nr 1, 2017, s 23. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
9.    https://www.genealogi.se/om-roetter/nyhetsarkivet/nyheter-2017/123-nyheter/2013/1792-soek-och-finn-bland-hundratusentals-tidningssidor
10.    https://www.genealogi.se/123-nyheter/2013/1874-en-miljon-fria-tidningssidor-digitaliserade-hos-kb
11.    https://www.genealogi.se/123-nyheter/2013/1900-nya-tidningssidor-i-kb-s-digitala-tjaenst
12.    http://feedback.tidningar.kb.se/viewtopic.php?id=84
13.    http://www.sfd2017.se/program/massprogram-och-tider/digitalisering-av-historiska-dagstidningar-pa-kungliga-biblioteket
14.    http://www.humlab.umu.se/sv/forskning-utveckling/paagaaende-projekt/digitala-laegg/
15.    http://www.policyuncertainty.com/sweden_monthly.html
16.    http://www.sciencedirect.com/science/article/pii/S016517651730109X?via%3Dihub
17.    http://feedback.tidningar.kb.se/viewtopic.php?id=113


Bilaga


RJ, titlar

Titel:    Antal nr.    antal sidor    År fr.o.m.    År t.o.m.
ALFWAR OCH SKÄMT    158    670    1842    1843
BAROMETERN    7 430    29 650    1841    1895
BORÅS TIDNING    6 048    24 559    1839    1895
CARLSCRONAS TIDNINGAR    108    436    1761    1764
CARLSCRONAS WEKOBLAD    9 860    40 637    1754    1878
DAGLIGT ALLEHANDA    24 445    161 651    1767    1849
FALKÖPINGS TIDNING    3 670    14 638    1857    1896
GÖTEBORGS HANDELS- OCH SJÖFARTSTIDNING    18 042    83 845    1832    1895
GÖTEBORGSPOSTEN    11 151    46 833    1859    1895
GÖTHEBORGS ALLEHANDA    9 192    38 305    1774    1843
GÖTHEBORGSKA NYHETER    4 349    35 790    1765    1848
HÄRNÖSANDSPOSTEN    6 682    25 788    1842    1895
INRIKES TIDNINGAR    7 399    36 154    1760    1820
JÖNKÖPINGSPOSTEN    3 579    16 075    1865    1895
KARLSHAMNS ALLEHANDA    5 935    22 481    1848    1896
KARLSKRONA WECKOBLAD    2 588    11 109    1879    1895
KRISTIANSTADSBLADET    6 408    25 596    1856    1895
LUNDS WECKOBLAD    8 222    37 257    1775    1897
MALMÖ ALLEHANDA    6 724    27 778    1827    1893
NERIKES ALLEHANDA    6 800    27 520    1844    1895
NORDEN    279    1 326    1856    1861
NORRBOTTENSKURIREN    2 735    11 128    1861    1896
NORRBOTTENSPOSTEN    2 926    11 778    1847    1895
NORRKÖPINGS TIDNINGAR    16 194    69 183    1787    1895
NORRKÖPINGS WECKOTIDNINGAR    1 206    5 522    1758    1786
NORRLÄNDSKA KORRESPONDENTEN    2 432    9 616    1851    1873
NYA DAGLIGT ALLEHANDA    10 971    46 173    1859    1895
NYA KARLSKRONA WECKOBLAD    51    218    1878    1878
NYA WERMLANDSTIDNINGEN    5 287    22 011    1851    1895
NYA WEXJÖBLADET    4 847    20 051    1847    1895
NYTT ALLVAR OCH SKÄMT    445    1 786    1844    1851
NYTT OCH GAMMALT    1 533    13 724    1783    1812
POST- OCH INRIKES TIDNINGAR    21 057    104 446    1821    1895
POSTTIDNINGAR    12 243    62 886    1645    1820
STOCKHOLMS DAGBLAD    22 405    118 683    1824    1895
STOCKHOLMSPOSTEN    16 425    66 005    1778    1833
SUNDSVALLS TIDNING    2 658    10 889    1880    1895
SUNDSVALLS TIDNING NORRLÄNDSKA KORRESPONDENTEN    917    3 740    1873    1879
UMEBLADET    3 431    14 114    1847    1896
UPSALA    6 284    27 061    1845    1895
WERMLANDSTIDNINGEN    395    1 574    1844    1850
VESTMANLANDS LÄNS TIDNING    5 951    24 066    1831    1896
WEXJÖBLADET    2 348    9 580    1810    1855
ÖSTGÖTA CORRESPONDENTEN    7 933    32 770    1838    1895
Totalt    299 743    1 395 102         


Bidragsförvaltare
Kungliga biblioteket
Diarienummer
IN15-0452:1
Summa
SEK 10 414 000,000
Stödform
RJ Infrastruktur för forskning
Ämne
Historia
År
2015