Eva Nyström

Digitalisering och katalogisering av grekiska handskrifter vid svenska bibliotek

Syftet med projektet är att digitalisera och katalogisera samtliga grekiska handskrifter i Sverige. Dessa bevaras vid ett flertal bibliotek, men huvudparten finns vid Uppsala universitetsbibliotek. En sådan samkatalog kommer att tillgängliggöras dels digitalt i en webbdatabas, dels publiceras i tryckt form. Handskriftsmaterialet innehåller en rik och varierad samling av texter från antiken och den bysantinska tiden, bl.a. företräds Hesiodos, Aristofanes, Euripides, Demosthenes, Aristoteles och Nya Testamentet. Handskrifterna, i form av inbundna pergament- och pappersvolymer, härstammar både från det bysantinska kulturområdet och från resten av Europa, och sträcker sig från 900-talet fram till 1700-talet. Den nuvarande 1800-talskatalogen är starkt föråldrad, i många fall inkorrekt och täcker inte in alla handskrifter. Det finns således ett stort behov av en nykatalogisering enligt moderna principer med detaljerade kodikologiska beskrivningar. En sådan kommer i kombination med en fullständig digitalisering att främja ny forskning på materialet såväl på det nationella som det internationella planet. Katalogen blir fullt sökbar genom att den kodas i TEI som är en XML-baserad metadatastandard för handskriftskatalogisering. Detta system gör det även möjligt att länka kataloginformationen till de digitaliserade bilderna. Katalogen och det digitaliserade materialet kommer att göras fritt tillgängligt via Uppsala universitetsbiblioteks digitala plattform.
Slutredovisning

Projektets syfte har varit att befrämja forskning rörande de grekiska handskrifterna i svenska bibliotek och arkiv. Genom att skapa en för alla handskrifter gemensam webbdatabas i kombination med digitaliseringar kommer de att bli fritt tillgängliga för forskare, studerande, och andra intresserade. Materialet innehåller en rik och varierad samling av texter från antiken och den bysantinska tiden. De har i form av inbundna pergament- och pappersvolymer framställts och traderats under många århundraden – från 900-talet fram till 1700-talet – i såväl det bysantinska kulturområdet som i resten av Europa.


Den nuvarande 1800-talskatalogen är föråldrad, i många fall inkorrekt och täcker inte in alla handskrifter. Det finns således ett stort behov av en nykatalogisering enligt moderna principer med detaljerade kodikologiska beskrivningar. En sådan kommer att underlätta och inspirera till ny forskning på materialet såväl på det nationella som det internationella planet. Katalogen blir fullt sökbar genom att den kodas i TEI som är en XML-baserad metadatastandard för handskriftskatalogisering. Detta system gör det även möjligt att länka informationen till det digitaliserade bildmaterialet. Intresset för handskrifterna kan förväntas öka med den nya tillgängligheten, likaså potentialen för forskningssamverkan utifrån liknande satsningar vid utländska bibliotek. Projektets syfte har inte förändrats under projektperioden.


Projektets resultat

En ny infrastruktur har skapats för TEI-kodade beskrivningar av medeltida och tidigmoderna handskriftsvolymer, med ett sök- och visningsgränssnitt för beskrivningarna och de digitaliserade handskrifterna (https://www.manuscripta.se). Kungliga Biblioteket (KB) svarar för långtidsförvaltningen av denna infrastruktur vilket är en viktig komponent för projektresultatets fortlevnad. Det är också det faktum att TEI-schemat som vi skapat möjliggör en expansion av databasen i och med att infrastrukturen kan användas av fler institutioner, som kan infoga andra redan befintliga eller pågående handskriftskataloger. En inte otänkbar vision vore att Sveriges samtliga medeltidshandskrifter i framtiden kan nås via en och samma databas, i samma TEI-system. Ett belysande exempel på en sådan synergieffekt är att schemat redan är taget i bruk för katalogiseringen av KB:s bestånd av medeltida och tidigmoderna handskrifter, samt för de fornsvenska handskrifterna på KB och Uppsala universitetsbibliotek (UUB), inom det av Riksbankens Jubileumsfond och Kungl. Vitterhetsakademien finansierade projektet ”TTT: Text till tiden! Medeltida texter i kontext – då och nu”. Likaså är Lunds universitetsbiblioteks medeltida bestånd, Laurentius-samlingen (RJ-projekt), på väg att inkorporeras. Även databasen för Sveriges alla illuminerade medeltidshandskrifter, som Eva Lindqvist Sandgren m.fl. har utarbetat (RJ-projekt), kommer bli publikt tillgänglig genom att den konverteras och anpassas till TEI.


Den ursprungliga projektansökan omfattade 99 handskrifter men en noggrannare inventering visade att det finns drygt 130 handskrifter. Av dessa 130 volymer har mer än hälften katalogiserats och en fjärdedel kodats i TEI. Räknat på det ursprungliga antalet handskrifter så har tre fjärdedelar hunnit beskrivas och en tredjedel kodats i TEI. I katalogiseringsarbetet har Barbara Crostini, som kom in senare i projektet, gjort en värdefull insats. Alla personer och platser som nämns i beskrivningarna är länkade till auktoritetsposter som skapats av projektet. Dessutom finns det bibliografiska poster för alla verk som refereras till. Det är mycket glädjande att vi har fått överblick över hur många grekiska handskrifter som faktiskt finns bevarade i svenska bibliotek och arkiv. När nu dessa samlats och blivit nåbara via samma plattform blir det avsevärt enklare för forskare att bruka dem och jämföra deras innehåll och form. Inte bara blir texterna åtkomliga; provenienser, personposter och platsangivelser kan bidra till kartläggningen av olika länders intellektuella historia och det akademiska utbytet internationellt och nationellt. Målet är naturligtvis att de återstående handskrifterna också katalogiseras framöver.


Digitaliseringen är nästintill fullständig och omfattar mer än 40 000 bilder som är fritt tillgängliga för nedladdning. Majoriteten av handskrifterna har digitaliserats i hög upplösning med kamerautrustning. Endast i undantagsfall har bokskanner använts. Det är en betydande prestation, som UUB:s Enhet för Digital Bild har åstadkommit. Förfogandet över bildmaterialet och dess direkta länkning till handskriftsbeskrivningarna är en viktig service för forskarna, och bidrar även till att handskrifterna i sig skonas från alltför mycket manuell hantering.


Projektet har presenterats vid ett flertal konferenser:

* The electronic revolution? The impact of the digital on cataloguing, Köpenhamns universitet (European Science Foundation/Comparative Oriental Manuscript Studies), 2012

* TEI Conference and Members Meeting 2014, Northwestern University, Chicago

* eXist-db pre-conference session, XML, Prag 2015

* Institut de recherche et d'histoire des textes, Section grecque et de l'Orient chrétien, Paris 2015

* TEI Conference and Members Meeting 2015, Lyon.



Oförutsedda tekniska och metodiska problem

Digitaliseringen kantades inledningsvis av förseningar och problem eftersom UUB använde en bokskanner, något som inte visade sig fungera för detta material. Det krävdes en kameralösning, vilket vi redan i vår ansökan rekommenderat. Det saknades även riktlinjer för digitalisering av medeltida, ofta skört material i den här omfattningen. Projektet blev på så sätt något av en pilotstudie. Själva digitaliseringen tog betydligt längre tid än beräknat och blev klar först i slutet av 2016. En annan tidskrävande faktor var kvalitetskontrollen av bilderna och metadata för bildfilerna. Dessa uppgifter har tagit minst ett par tre månaders extra arbetstid i anspråk.


Metadataformatet TEI visade sig inte omedelbart ändamålsenligt för våra behov, utan det har varit nödvändigt att lägga ner mycken tid och möda på att kodifiera ett mer preciserat och skräddarsytt TEI-schema för kodningen av handskriftsbeskrivningarna. Schemat beskriver vilka XML element och attribut som används i handskriftbeskrivningarna, vilket underlättar kodningsarbetet och gör TEI-filerna enhetliga. Schemat inkluderar även dokumentation av våra katalogiseringsprinciper, och säkerställer att katalogposterna kan redigeras i framtiden. Att åstadkomma detta har initialt varit tidsödande, men vinsten har visat sig bli desto större eftersom andra digitaliserings- och katalogiseringsinsatser på bibliotek och institutioner kan återanvända samma schema.


Det var initialt planerat att UUB skulle stå för utvecklingen av sök- och visningsgränssnittet inom ramen för ArkA-D projektet, men detta har tyvärr inte varit möjligt. Dessutom visade det sig att den digitala plattformen Alvin inte stödde TEI utan använde ett internt format baserat på olika metadatastandarder som inte lämpade sig för djupkatalogisering av handskrifter. Det blev därför nödvändigt att utveckla en egen infrastruktur som till fullo stöder TEI. Drygt en tredjedel av den sammanlagda projekttiden har därför gått åt till utvecklingen av ett sök- och visningsgränssnitt för TEI-filerna och de digitaliserade handskrifterna. Detta gränssnitt är byggt med hjälp av olika programvaror med öppen källkod, bl.a. eXist-db, en XML-databas som erbjuder avancerade indexerings- och sökfunktioner av TEI-filerna, samt funktioner för konvertering av TEI till HTML och PDF. Källkod, scheman, riktlinjer och TEI-filer finns fritt tillgängliga på GitHub.


Arbetets integrering i organisationen samt hur det kommer att föras vidare

Infrastrukturen förvaltas sedan 2016 av KB som även har bidragit med medel för att vidareutveckla ett webbaserat redigeringsgränssnitt för handskriftsbeskrivningar och auktoritetsposter för personer, platser och termer, samt för bibliografiska poster. Detta gränssnitt kommer att avsevärt förenkla katalogiseringsarbetet och göra det möjligt för fler personer att katalogisera och komplettera befintliga beskrivningar. I dagsläget krävs manuell redigering i en XML-editor vilket är komplicerat, tidskrävande och kan ge upphov till inkonsekventa beskrivningar.


Nya forskningsfrågor som har genererats genom projektet

Medeltida handskrifter är mycket sällan monografier, med en text av en författare. Normalfallet är istället att läsaren möts av en bokvolym som genomgått många förändringar över tid: den innehåller ofta flera texter, den kan ha utökats, brutits upp, förlorat delar, och bundits om med nya tillägg. Nya texter kan också ha förts in på tidigare blankblad osv. Den tidigare, traditionella katalogposten har inte tagit hänsyn till denna stratigrafi, där texter med olika ursprung och historik kan samlas i lager på lager. Ny forskning och metodologi visar emellertid att det är nödvändigt att inkludera detta i beräkningen, inte minst för att kunna fastställa proveniens för olika delar, så att inte dateringen av ett visst avsnitt felaktigt råkar antas gälla för andra delar av samma volym. Den här problematiseringen av analysmetod och handskriftsbeskrivning finns nu inkorporerad i databasstrukturen och kodningsschemat, och resultatet kommer att bli en av de första digitala katalogerna att implementera denna spjutspetsforskning, som ibland kallas en veritabel ”kodikologisk revolution”. Det finns hitintills bara ett par exempel på denna typ av stratifierad katalogisering och då endast i tryckta kataloger. Vår databas är därmed en av de första att tillämpa en modell som är ”born digital” och sökbar för katalogposter strukturerade enligt principen om kodikologiska enheter och flerskiktade volymer.


Länkar till egna webbsidor

* https://www.manuscripta.se

* https://github.com/manuscripta

Bidragsförvaltare
Uppsala universitetsbibliotek
Diarienummer
In11-0631:1
Summa
SEK 4 200 000,000
Stödform
RJ Infrastruktur för forskning
Ämne
Ospecifierad ämne
År
2011