Digitalisering av Bidrag till Sveriges officiella statistik (BiSOS)
Projektet avser att överföra bokverket BiSOS till digital form och att publicera det fritt tillgängligt på Internet. BiSOS är det viktigaste och mest omfattande verket med svensk officiell statistik från 1800-talets mitt till 1900-talets början. 1914 ersätts BiSOS av serien Sveriges officiella statistik. BiSOS är indelat i 23 ämnesområden. Verket är i stort format (30 x 25 cm) och består av 200000 sidor text och tabeller fördelat på cirka 200 volymer eller flera tusen häften. BiSOS är mycket använt och hårt slitet. Serien, som skapades under SCBs första 50 år, är idag en guldgruva för studium av Sverige och kontakter med omvärlden.
Den tillhör forskningens infrastruktur och Sveriges kulturarv. Textmaterialet kommer att texttolkas (OCR-tolkas) och göras sökbart med modern teknik. Vid BiSOS tillkomst publicerades statistiken även på franska. Den digitala utgåvan kommer att bli sökbar på både svenska och franska. För att få bästa möjliga tillgänglighet av materialet planeras en presentation på SCBs webbplats. SCB-biblioteket planerar också att katalogisera alla häften i det nationella bibliotekssystemet Libris med länkar till det digitala verket. Statistiska centralbyrån åtar sig att sörja för att den digitala versionen av BiSOS arkiveras på ett korrekt sätt. Projektet kommer att genomföras i samråd med Kungliga biblioteket.
Digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) och andra tryckta statistiska publikationer - slutrapport
1. Projektets syfte samt eventuella ändringar i syftet under projektperioden
1.1. BiSOS digitalisering. (Dnr: In2006-0242:1-IK)
Projektet 2007-2010 pågick och syftade till att med strukturellt stöd digitalisera och tillgängliggöra bokverket Bidrag till Sveriges officiella statistik (BiSOS) för alla och envar på internet. BiSOS är det viktigaste och mest omfattande verket med svensk officiell statistik från mitten av 1800-talet till 1900-talets början. Verket är indelat i 23 ämnesområden eller serier. Totalt består verket av 145 000 sidor text och tabeller fördelat på 1495 häften med utvik i färg, gråskala och svartvit.
Riksbankens Jubileumsfond (RJ) bekostade digitalisering, dvs. bildfångst (skanning), teckenigenkänning (OCR-tolkning) och framställning av publiceringsfärdig pdf-publikation samt bilder i formatet TIFF, medan SCB bekostade upphandling, projektledning, preparering av materialet, kvalitetssäkring och publicering på SCB:s webbplats samt katalogisering i den nationella biblioteksdatabasen LIBRIS.
Efter genomförd upphandling tecknades avtal i juli 2007 med Logica (tidigare VM-data) om tjänsten digitalisering. Som underleverantör för hela tjänsten använde Logica Infodisk Modo (tidigare Infodisk Media), Riga, Lettland. I maj 2009 var BiSOS digitalisering färdig. Tidsplanen hölls. Arbetet kostade totalt 1,2 milj. kr av det beviljade anslaget på 4 milj. kr.
1.2. BiSOS återstående anslag
BiSOS återstående anslag uppgick till 2,8 milj. kr. Efter förfrågan godkände RJ 2009-03-01 SCB:s reviderade plan för användning av återstående anslag under 2009-2010 (enligt e-post 2009-03-03 från Maria Wikse, RJ). Genom en särskild option i avtalet med Logica kunde detta ske utan förnyad upphandling.
I SCB:s reviderade plan ingick preparering av materialet, bildfångst, teckenigenkänning (OCR-tolkning), framställning av publiceringsfärdiga pdf-publikation, bilder i formatet TIFF och kvalitetssäkring samt förstudien av tabellanalysverktyget. SCB skulle bekosta projektledning, förberedelse för och publicering på sidan Historisk statistik på SCB:s webbplats och katalogisering i LIBRIS.
1.2.1. Fortsatt digitalisering av tryckta statistiska publikationer
Följande publikationer skulle digitaliseras
• föregångare till BiSOS 1811-1857
• 4 serier i Sveriges officiella statistik 1911-2001
• De 6 tidiga serierna av statistiska meddelanden 1912-1953 samt Statistiska centralbyråns stencilerade publikationer 1952-1963
• Index Statistiska meddelanden 1963-2001
• Statistisk tidskrift 1860-1913, som innehåller Sveriges officiella statistik i sammandrag. Sammandragen är föregångare till Statistisk tidskrift för Sverige
• 4 serier med statistik från Kommerskollegium 1899-1962
• Återstående monografier i serien Historisk statistik för Sverige
Precis som för BISOS tillhör denna statistik forskningens infrastruktur och även Sveriges kulturarv. Genom digitalisering kan originalpublikationerna skyddas från slitage och bevaras. Att den digitala versionen blir fritt tillgänglig över internet är till nytta inte enbart för forskningen utan även för den enskilde medborgaren.
1.2.2. Verktyg för analys och teckenigenkänning av tabeller (VATT) : en förstudie
Många kunder eller användare har behov av att återanvända och bearbeta tabellerna. Att teckentolka tabellerna kräver idag stora manuella insatser, eftersom tabeller är uppställda på allehanda sätt. För att tillgodose denna efterfrågan behövs ett tabellanalysverktyg som på ett kostnadseffektivt sätt kan få över statistiska uppgifter till databaser eller kalkylark.
SCB ville i en förstudie undersöka, om det finns något tabellverktyg tillgängligt på marknaden, som kunde anpassas till en statistikproducents behov, eller, om det inte fanns, avsåg SCB att beräkna kostnaden för att utveckla ett sådant verktyget. I förstudien skulle från det material som SCB har digitaliserat tas fram ett antal typfall på hur tabeller har varit uppbyggda sedan 1811. Denna förstudie har inte kunnat genomföras, se avsnitt 3.
2. Projektets resultat och resonemang om dessa
2.1. Publicering på SCB:s webbplats
Det viktigast resultatet av projektet ”Digitalisering av Bidrag till Sveriges officiella statistik (BiSOS)”, inklusive fortsatt digitalisering av tryckta statistiska publikationer för BiSOS återstående anslag, är att de digitaliserade publikationerna har publicerats på SCB:s webbplats under Hitta statistik > Historisk statistik och därmed blivit fritt tillgängliga för alla och envar på internet. Dessutom katalogiseras både den digitaliserade och den tryckta versionen i den nationella biblioteksdatabasen LIBRIS.
2.2. Bildfiler i formatet TIFF
Ett annat resultat är att bildfångstens kvalitet är så hög att denna aldrig behöver göras om. Det var inte möjligt att inom projektets ekonomiska ramar OCR-tolka tabellerna med tillfredsställande kvalitet. Vi bedömde att det var bättre att spara alla bildfiler i formatet TIFF, vilket är viktigt av flera skäl. Formatet är arkivgodkänt av Riksarkivet. Vi har tillgång till originalen och kan, när tekniken medger, göra en bra OCR-tolkning av tabeller. Bilderna arkiveras/sparas okomprimerat i formatet TIFF.
2.3. Överföring av tabelldata till databaser eller kalkylark
Detta kommer SCB att dra nytta av i det kommande projektet ”Verktyg för analys och teckenigenkänning av tabeller (VATT) – en förstudie”.
2.4. Teckenigenkänning (OCR-tolkning)
Innehållsförteckningar är viktiga, eftersom dessa oftast innehåller många relevanta ord, och därför bör vara så korrekta som möjligt. Kraven på OCR-tolkning fastställdes till följande krav på korrekthet på tecken- och ordnivå:
• Svenska innehållsförteckningar: 99,9 %
• Franska och engelska innehållsförteckningar: 99,5 %
• Annan text: 85 %.
Ett särskilt problem med text från 1800-talet är att stavningssättet var ett annat än det som används idag. Språkdata vid Göteborgs universitet har Olof Dahlins ordbok från 1855 i digital version och SCB har fått lov att låta leverantören använda denna vid OCR-tolkningen. För att få den kvalitet vi eftersträvar på OCR-tolkningen jämför man alla ord mot denna ordbok. Om ordet inte finns i ordlistan visas det för OCR-operatören som då manuellt godkänner alternativt korrigerar ordet. På detta sätt har korrektheten blivit betydligt högre än i våra krav. Dahlins ordbok blir kompletterad med nya ord och det är denna ”nya” Dahlins ordbok som vi skickar tillbaka till Språkdata för framtida forskning. OCR-verktyget klarade även av frakturstil utan ändring av SCB:s krav på korrekthet.
2.5. URN:NBN:SE – identifikator för digitala häften och bildfiler.
I väntan på att e-plikt (leveransplikt av elektroniska publikationer till Kungl. biblioteket (KB) ska komma för digitaliserade tryckta publikationer, har den unika identifikation URN:NBN:SE:SCB används. URN:NBN betyder Universal Resource Name och detta namn ändras aldrig. SCB är Statistiska centralbyråns domän. Från URN:NBN länkas till rätt fil via en särskild dator på KB, som håller reda på den aktuella url-adressen. URN:NBN är framtidssäker och har använts som identifikator för våra digitaliserade böcker och för bildfiler i formatet TIFF.
2.6. Arbetssätt och metoder
Här ges några exempel på arbetssätt och metoder både vid upphandling och i digitaliseringsarbetet:
• Leverantörens arbetsmetoder och rutiner har granskats för att minimera SCB:s arbete med kvalitetssäkring.
• Beskrivningsblad för att kommunicera med leverantören har skapats.
• En särskild inledningssida har införts för att beskriva föregångare, efterföljare och översiktspublikationer, samt digitaliseringsinformation och URN:NBN.
• Dokumentegenskaper har beskrivits med metadata för att förbättra sökresultaten.
• Vissa inställningar har införts för att presentera det digitala häftet på ett optimalt sätt för användaren, t.ex. att hela bokuppslag alltid visas.
2.7. Mervärden och förbättringar
Projektet strävade att bevara det goda i det tryckta originalet och samtidigt åstadkomma en användarvänlig digital version. Resultatet blev mervärden eller förbättringar jämfört med den tryckta förlagan
• Skapad innehållsförteckning om sådan saknas.
• Innehållsförteckning finns alltid i början av ett häfte och är klickbar.
• I innehållsförteckningen har vid behov även länkats till annan innehålls- eller tabellförteckning.
• Bokmärken har länkats till lägsta nivå.
• Liggande tabeller eller text har vridits till stående.
• Serie- och/eller volymuppgift har lagts till titelsidan om de saknas i den tryckta förlagan.
• Om en karta, utvikssida eller sida i ett häfte saknades, har inför digitalisering inlån skett från ett annat bibliotek. Det finns exempel på att den digitala versionen har blivit det enda fullständiga exemplaret.
2.8. Användaren i centrum
Projektet har arbetat med användaren i centrum. Angreppssättet har varit att få användarvänliga pdf-publikationer tillgängliggjorda på ett användarvänligt sätt. Varje serie inleds med en kort presentation på under Hitta statistik > Historisk statistik.
2.9. Några mängduppgifter
Totalt har 450 000 sidor eller 2 800 böcker digitaliserats.
Vad som har digitaliserats av BiSOS återstående anslag och vad som återstår redovisas i Publikationslistan.
3. Oförutsedda tekniska och metodiska problem
3.1. BiSOS
Synergieffekter av bra och kompletterande kompetenser och erfarenheter i projektgruppen medförde att upphandlingsunderlaget fick en så hög kvalitet att Infodisk Media, Riga, aldrig kunde säga: ”Det finns inte med i upphandlingsunderlaget”. I de lägen då de i Riga inte har vetat vad och hur de ska göra och vad vi har menat i underlaget, har vi alltid kunna förklara och visa hur det ska gå till, alternativt gett ett förslag på en framkomlig väg. Denna kunskap har vi också överfört till Riga så deras kompetens har höjts avsevärt. Vi har kunnat göra det eftersom vi hela tiden när vi skrev underlaget tänkt oss in i en situation hur vi skulle göra det själva. BiSOS slutfördes enligt tidsplan. Vid avslutningsmötet i maj 2009 presenterade leverantören en bra redogörelse av hur digitaliseringen hade gått till och att digitaliseringen av BiSOS var komplex samt framhöll vikten av ett nära samarbete mellan kund och utförare (Se Publiceringslistan).
3.2. Användning av BiSOS återstående anslag
Det finns flera orsaker till att BiSOS återstående anslag för det som planerades inte har räckt. Planeringen var inte detaljerad och noggrann på samma sätt som för BiSOS digitalisering. Kostnaden för preparering av materialet inför digitalisering m.m. har uppgått till 85 889 kr. I planen var detta uppskattat till 41 800 kr. Förklaringar är dels byte av personal, dels att de mallar som använts vid produktion av bokverket BiSOS varit enhetligare än de mallar som har kommit till användning vid produktion av 1900-talsserierna, dels hade antalet böcker skattats till 1 232 men utfallet blev 1 634 och till sist var antalet sidor som digitaliserats 4 % fler än planerat beroende på tunnare papper jämfört med BiSOS.
Förstudien för att undersöka om det finns något tabellanalysverktyg (VATT) tillgängligt på marknaden har inte kunnat fullföljas. När förstudien startat med framtagande av typtabeller och planering av studiebesök framgick vid slutet av år 2009 att denna inte skulle rymmas inom återstående medel. Det är emellertid angeläget att verktyget med syfte att få in tabellerna i databaser eller Excel blir förverkligat. SCB har därför för avsikt att fullfölja detta i ett senare projekt när resurser kan ges.
Vad som har digitaliserats för BiSOS återstående anslag framgår av Publikationslistan.
4. Arbetets integrering i myndigheten samt hur arbetet kommer att vidareföras
Själva arbetet med digitaliseringen har ökat kunskaperna om historisk statistik hos bibliotekspersonal, kundservice och övriga enheter på SCB.
Information om vilken statistik som har digitaliserats har lagts ut på SCB:s webbplats i anslutning till det ämnesområde statistiken tillhör. Kunskapen om och tillgängligheten till digitaliseringen har därmed ökat för SCB:s personal.
5. Nya forskningsfrågor som har genereras genom projektet
Digitaliseringen underlättar användning av BiSOS och andra digitaliserade publikationer vid skrivning av forskningsrapporter eller uppsatser.
En del tidigare mindre använda serier har resulterat i rapporter vid universiteten på grund av digitaliseringen.
Webbstatistik över de digitaliserade publikationerna i SCB:s biblioteks regi visar att användningen av de digitala versionerna är större än de tryckta. Mest använt är Statistisk årsbok för Sverige och Befolkningsstatistiken (BiSOS A).
6. Olika typer av förmedling av projektets resultat såsom publikationer, seminarier, föreläsningar, länkar till egna hemsidor
Presentation av BiSOS digitalisering på konferensen Mötesplats inför framtiden vid bibliotekshögskolan i Borås oktober 2007
SCB:s externa programråd för demokratistatistik 2008-02-26
Nordiskt statistikbiblioteksmöte i Stockholm 2008
Presentation i SCB:s monter på Bok- och biblioteksmässan september 2008
Presentation av Digitaliseringen vid nätverksmötet statistik för forskningsbibliotekarier i oktober 2009
Nordiska statistikbiblioteksmötet i Köpenhamn i juni 2009
Nordiska statistikermötet i Köpenhamn augusti 2010
SCB:s externa kommunikationsråd 2010-12-10
På SCB:s webbplats har under Hitta statistik skapats ingången Historisk statistik, som innehåller de digitaliserade publikationerna.
Webbstatistik om användning av de digitaliserade publikationerna under Historisk statistik på SCB:s webbplats.
7. Ekonomi
Under fliken ekonomi i webb-formuläret har ekonomin redovisats. Under Övriga kostnader har SCB tagit upp betalningar till de leverantörer som medverkat i tjänsten digitalisering.
8. Publikationslista
1. Bakgrund till det material som skall digitaliseras. – I: Avtal 2007-07-02 mellan SCB och VM-data Infra Solutions AB. Bilaga 1. Tjänstebeskrivning. Revision 1 2008-11-01.
Framtagen inför upphandling av BiSOS
2. Digitalisering av Bokverket Bidrag till Sveriges officiella statistik (BiSOS) : Infodisk Media Report / Infodisk Media, Riga, Lettland.
Teknisk beskrivning som togs fram av leverantören inför avslutning av BiSOS digitalisering i maj 2009.
3. Norrmosse, Rolf-Allan (SCB): Projekt ”Digitalisering och tillgängliggörande av bokverket Bidrag till Sveriges officiella statistik (BiSOS)”, 1851/55-1910. I: Att ge tillgång till äldre tryckta statistikpublikationer i dagens digitala värld vid tre nordiska centralbyråer. - Statistikermöte i Köpenhamn aug 2010.
4. Norrmosse, Rolf-Allan (SCB): SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) . – Paper presenterat vid Konferensen Mötesplats inför framtiden, Bibliotekshögskolan i Borås, oktober 2009.
5. Digitaliserade publikationer i SCB:s regi med anslag 2006 från Riksbankens Jubileumsfond
6. Publikationer m.m. som inte rymts i anslag 2006 för digitalisering från Riksbankens Jubileumsfond.
7. Källa SCB 2009:2 om digitalisering av Statistisk årsbok för Sverige.
Digitisation of BiSOS and other printed statistical publications
Final report
1. The aim of the project and any changes in aim during the project period
1.1 Digitisation of BiSOS (ref. no: In2006-0242:1-IK)
The Project 2007-2010 was carried out and aimed at digitalising and making accessible the publication entitled Bidrag till Sveriges officiella statistik BiSOS (translation: Contributions to Sweden's Official Statistics) to everybody on the Internet. BiSOS is the most important and comprehensive publication containing Swedish official statistics from the middle of the 1800s to the beginning of the 1900s. The publication is divided up into 23 subject areas or series. In total, the publication consists of 145 000 pages of text and tables, distributed into 1495 booklets with fold-outs in colour, grey scale and black-and-white.
Riksbankens Jublieumsfond (RJ) (the Swedish Central Bank's Tercentenary Fund) financed the digitisation, i.e. image capture (scanning), optical character recognition (OCR) and production of PDF documents ready for publishing, as well as images in the TIFF format. Meanwhile Statistics Sweden financed the procurement, project management, preparation of the material, quality assurance and publication on Statistics Sweden's website, as well as cataloguing in the national library database LIBRIS.
Following completion of the procurement process, an agreement was signed in July 2007 with Logica (formerly WM-data) for the digitisation service. Logica sub-contracted the entire service to Infodisk Modo (formerly Infodisk Media) in Riga, Latvia. In May 2009 the digitisation of BiSOS was completed. The time scale was adhered to. In total the work cost SEK 1.2 millin of the funds granted of SEK 4 million.
1.2. Remaining BiSOS funds
The remaining BiSOS funds amounted to SEK 2.8 million. On 1 March 2009, RJ approved Statistics Sweden's revised plan for using the remaining funds during 2009-2010 (according to an e-mail dated 3 March 2009 from Maria Wikse of RJ). By means of a special option in the agreement with Logica, this could be done without a renewed procurement process.
Statistics Sweden's revised plan included preparation of material, image capture, optical character recognition (OCR), production of PDF documents ready for publishing, images in the TIFF format and quality assurance, as well as a preliminary study of the table analysis tool. Statistics Sweden was to fund project management, preparations for and publication on the page Historical statistics on Statistics Sweden's website and cataloguing in LIBRIS.
1.2.1. Continuing digitisation of printed statistical publications
The following publications were to be digitised:
· predecessors to BiSOS 1811-1857
· 4 series of Sweden's official statistics 1911-2001
· The 6 early series of Statistiska meddelanden (Statistical Reports) 1912-1953 and Statistics Sweden's stencilled publications 1952-63
· Index of Statistiska meddelanden (Statistical Reports) 1963-2001
· The periodical entitled Statistisk Tidskrift 1860-1913, which contains a compilation of Sweden's official statistics. The compilations are the predecessors of the Statistical Yearbook of Sweden.
· 4 series of statistics from the Swedish National Board of Trade 1899-1962
· Remaining books from the series Historisk statistik för Sverige (translation: Historical Statistics for Sweden)
Just as with BiSOS, these statistics belong to the infrastructure of research, and are also part of Sweden's cultural heritage. Through digitisation, the original publications can be protected from wear and tear and be preserved. Making the digital version freely available via the Internet is useful, not just for research, but also for individual citizens.
1.2.2. Tool for analysis and optical character recognition of tables (VATT): a preliminary study
Many customers and users need to reuse and process the tables. Optical character recognition of tables today requires great manual input, as tables are arranged in many different ways. In order to fulfil this demand, a table analysis tool is needed to transfer statistical data to databases or spreadsheets in a cost-effective way.
By means of a preliminary study, Statistics Sweden wanted to find out whether there is any table tool available on the market that could be adapted to the needs of a statistics producer. If no such tool was available, Statistics Sweden intended to calculate the cost of developing such a tool. In the preliminary study, a number of type cases were to be produced from the material digitised by Statistics Sweden in order to find how tables have been designed since 1811. This preliminary study has not been possible to carry out, as explained in Section 3.
2. Project results
2.1. Publication on Statistics Sweden's website
The most important result of the project "Digitisation of Bidrag till Sveriges officiella statistik (BiSOS)", including the continuing digitisation of printed statistical publications using the remaining BiSOS funds, is that the digitised publications have been published on the Statistics Sweden website and have thus become free-of-charge available for everybody via the Internet. Both the digitised and the printed versions are also catalogued in LIBRIS.
2.2. Image files in the TIFF format
Another result is that the quality of image capture is so high that it will never need redoing. It was not possible within the economic framework for the project to capture the tables using OCR and achieve satisfactory quality. Instead, we considered that it was better to save all image files in the TIFF format, which is important for several reasons. The format is approved for archiving by the Swedish National Archives. We have access to the originals and can, once technology permits, make a good OCR interpretation of tables. The images are archived/saved uncompressed in the TIFF format.
2.3. Transfer of table data to databases or spreadsheets
This will be useful for Statistics Sweden in the upcoming project "Tool for analysis and character recognition of tables (VATT) - a preliminary study".
2.4. Character recognition (OCR interpretation)
Tables of contents are important, as these often include many relevant words, and should therefore be as correct as possible. The requirements for OCR interpretation were set at the following percentages for accuracy at character and word level:
· Swedish tables of contents: 99.9 %
· French and English tables of contents: 99.5 %
· Other texts: 85 %
A special problem with texts from the 1800s is that spelling differed from that used today. Språkdata at the Department of Swedish at the University of Gothenburg has a digital version of Olof Dahlin's dictionary from 1855, and Statistics Sweden was allowed to let the supplier use this during the OCR interpretation. In order to achieve the quality we aim for in the OCR interpretation, all words were compared against this dictionary. If the word was not included in the dictionary, it was shown to the OCR operator, who then manually either approved or corrected the word. In this way, accuracy has become considerably greater than in our requirements. Dahlin's dictionary was supplemented with new words, and it is this "new" Dahlin's dictionary that we are sending back to Språkdata for future research. The OCR tool even managed to cope with Gothic script.
2.5. URN:NBN:SE - identifier for digital booklets and image files
In anticipation of digital deposit legislation, the unique identifier URN:NBN:SE:SCB has been used up until now. URN:NBN stands for Universal Resource Name and this name is never changed. SCB is the domain of Statistics Sweden. For URN:NBN, a link is made to the correct file via a special computer at the National Library of Sweden (KB), which keeps a register of the URL address in question. URN:NBN is forward compatible, i.e. capable of operating with anticipated future systems, and has been used as identifier for our digitised books and for image files in the TIFF format.
2.6. Working methods
The following describes some working methods for both procurement and the digitisation work.
· The working methods and processes of the supplier were scrutinised in order to minimise Statistics Sweden's work with quality assurance.
· Description sheets for communications with the supplier were created.
· A special introductory page was introduced to describe predecessors, successors and summary publications, and to provide information on digitisation and URN:NBN.
· Document characteristics were described with metadata to improve search results.
· Some settings were introduced for presenting the digital booklet in an optimal way for the user, such as always showing entire double spreads of book pages.
2.7. Added values and improvements
The project aimed to preserve the good aspects of the printed original, and at the same time achieve a user-friendly digital version. This resulted in added values or improvements compared to the printed original.
· A table of contents was created if it was missing.
· A table of contents is always at the beginning of a booklet and is clickable.
· If required, the table of contents also links to another list of contents or tables.
· Bookmarks have been linked at the lowest level.
· Landscape tables and text have been turned to portrait position.
· Series and/or volume information has been added to the title page if missing in the printed original.
· If a map, fold-out page or page was missing in a booklet, it has been borrowed from another library prior to digitisation There are examples of the digital version having become the only complete version.
2.8. The user in focus
The project worked with the user in focus. The approach was to make user-friendly PDF publications accessible in a user-friendly way. Each series begins with a brief presentation at <> (presently only in Swedish).
2.9. Some size information
In total, 450 000 pages or 2 800 books have been digitised.
The Publication list shows what has been digitised using BiSOS remaining funds and what remains to be done.
3. Unforeseen technical and methodology problems
3.1. BiSOS
Synergy effects from good and complementary skills and experiences in the project team meant that the procurement material was of such a high standard that Infodisk Modo in Riga was never able to say: "This was not included in the procurement material". In situations when Riga did not know what or how to do things or what we meant in the procurement material, we were always able to show how it was to be done, or alternatively provided suggestions for a way to proceed. These skills have also been transferred to Riga, so that their level of competence has been significantly raised. This was possible, because all the time we were producing the procurement material, we were imagining doing the work ourselves. BiSOS was completed according to the time plan. At the completion meeting in May 2009, the supplier presented a good account of how the digitisation had been carried out, and that the digitisation of BiSOS was complex. The need for close cooperation between the customer and the supplier was underlined. (See the Publication list).
3.2. Use of BiSOS remaining funds
There are several reasons why BiSOS remaining funds were not sufficient for what was planned. The planning was not as detailed and careful as for the digitisation of BiSOS. The cost of preparing the material ahead of digitisation, etc. amounted to SEK 85 889. In the plan, this was estimated to be SEK 41 800. Explanations for this include a change in personnel, the fact that the templates used in the production of the book BiSOS were more uniform than the templates used in the production of the 1900s series, the fact that the number of books had been estimated at 1 232 but the outcome was 1 634, and finally that the number of pages digitised was 4% greater than planned, due to thinner paper having been used compared to BiSOS.
The preliminary study to investigate whether there is any table analysis tool (VATT) available on the market has not been possible to complete. When the preliminary study started with the development of typical tables and planning study visits, we realised at the end of 2009 that there would not be sufficient funds for the entire study. However, it is important that a tool aimed at entering tables into databases or Excel becomes reality. For this reason, Statistics Sweden aims to complete this in a later project when resources are available.
The Publication list shows what has been digitised using the remaining funds for BiSOS.
4. Integration of the work at Statistics Sweden, and how to continue
The work of the digitisation itself has increased knowledge about historical statistics among library personnel, customer service and other units within Statistics Sweden.
Information about which information has been digitised has been posted on Statistics Sweden's website in conjunction with the subject area to which the statistics belong. Knowledge about digitisation its accessibility has therefore increased among Statistics Sweden's personnel.
5. New research issues generated by the project
The digitisation facilitates the use of BiSOS and other digitised publications when writing research reports or dissertations.
Some previously less used series have resulted in reports at universities due to the digitisation.
Web statistics for the digitised publications in the Statistics Sweden library show that the use of digital versions is greater than that of printed versions. Those most used are Statistical Yearbook of Sweden and Population Statistics (BiSOS A).
6. Various types of distribution of project results, such as publications, seminars, lectures, links to websites
Presentation of the digitisation of BiSOS at the "Mötesplats inför framtiden" (Meeting place for the future) conference at the Swedish School of Library and Information Science in Borås in October 2007
Statistics Sweden's external program committee for democracy statistics 26 February 2008
Nordic statistics library meeting in Stockholm 2008
Presentation in Statistics Sweden's exhibition stand at the Book and Library Fair in September 2008
Presentation of the digitisation at the network meeting for statistics for research librarians in October 2009
Nordic statistics library meeting in Copenhagen in June 2009
Nordic statistician meeting in Copenhagen in August 2010
Statistics Sweden's external communications committee 10 December 2010
A portal to Historical Statistics has been created on Statistics Sweden's website and includes the digitised publications.
Web statistics relating to use of the digitised publications under Historical statistics on Statistics Sweden's website.
7. Finance
The finances are reported under the tab Finance in the web form. Statistics Sweden has reported payments to the suppliers participating in the digitisation service under Other expenses.
8. Publication list
Background to the material to be digitised. - In: Agreement 2 July 2007 between Statistics Sweden and WM-data Infra Solutions AB. Appendix 1. Description of service. Audit 1 1 November 2008.
Produced ahead of procurement of BiSOS.
Digitalisering av Bokverket Bidrag till Sveriges officiella statistik (BiSOS): Infodisk Media Report / Infodisk Media, Riga, Latvia.
Technical description produced by the suppler ahead of the completion of BiSOS' digitisation in May 2009.
Norrmosse, Rolf-Allan (Statistics Sweden): Project ”Digitalisering och tillgängliggörande av bokverket Bidrag till Sveriges officiella statistik (BiSOS)”, (Digitisation and accessibility to the book Bidrag till Sveriges officiella statistik (BiSOS))" 1851/55-1910. In: Att ge tillgång till äldre tryckta statistikpublikationer i dagens digitala värld vid tre nordiska centralbyråer (Providing access to older printed statistics publications in today's digital world at three Nordic central statistics agencies). - Statistician meeting in Copenhagen in August 2010.
Norrmosse, Rolf-Allan (Statistics Sweden): SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) (Statistics Sweden's experiences of digitising Bidrag till Sveriges officiella statistik (BiSOS)). - Paper presented at the conference "Mötesplats inför framtiden" (Meeting place for the future) at the School of Library and Information Science in Borås, October 2009.
Digitised publications under the aegis of Statistics Sweden with funds from 2006 from Riksbankens Jubileumsfond
Publications, etc. which have not been covered by funds from 2006 for digitisation from Riksbankens Jublieumsfond
The periodical Källa SCB 2009:2 concerning digitisation of Statistical Yearbook of Sweden.
