Niclas Burenhult

Digitalt multimediaarkiv för austroasiatiskt immateriellt kulturarv (Dig-AAA)

Detta infrastrukturella initiativ har som mål att göra Lunds universitet till ett globalt centrum för forskning kring de hotade språk och kulturer i Sydöstasien och Indien som förknippas med den austroasiatiska språkfamiljen. Centralt i denna ambition är etablerandet av en toppmodern digital och multimedial arkivmiljö i syfte att bevara existerande och framtida samlingar som dokumenterar austroasiatiskt immateriellt kulturarv, dvs språk, musik och andra muntligen överförda och förgängliga traditioner och kunskaper. Denna nydanande resurs kommer att till fullo dra nytta av den senaste utvecklingen inom informations- och kommunikationsteknologi, vilket kommer att möjliggöra full interoperabilitet mellan enskilda samlingar. Innovativa nätverk kommer att konstrueras över korpusgränserna, och optimal datahantering och tillgänglighet kommer att kunna möjliggöras tack vare specialanpassade katalogiserings-, sök- och inhämtningssystem för tre olika målgrupper: forskare, allmänhet och de aktuella språksamhällena. Projektet bygger på en rik tradition av austroasiatisk forskning vid Lunds universitet och förenar svensk och internationell expertis i ett nytt och synnerligen kvalificerat team. Syd- och Sydöstasien är kraftigt expanderande regioner med allt större global betydelse; de austroasiatiska befolkningarna spelar härvidlag en nyckelroll för vår kunskap om historien, mångfalden och dynamiken hos mänskliga samhällen i regionen och i stort.
Slutredovisning

Infrastrukturprojektet 'Digitalt multimediaarkiv för austroasiatiskt immateriellt kulturarv' (Dig-AAA) har nått sitt slut och det är med stor tillfredsställelse vi här rapporterar om dess lyckade resultat. Vårt uppdrag var att skapa ett modernt digitalt arkiv för långsiktigt förvaltande av forskningssamlingar som dokumenterar austroasiatiskt immateriellt kulturarv. Den austroasiatiska språkfamiljen består av mestadels hotade minoritetsspråk i Sydöstasien och Indien. Projektet har skapat 'Repository and Workspace for Austroasiatic Intangible Heritage' (RWAAI), en resurs som erbjuder forskare en ny och dynamisk forskningsmiljö i form av både en arkivinrättning och en arbetsyta. Konceptuellt och metodologiskt skiljer detta resursen från traditionella lagringsinriktade arkiv, där fokus främst ligger på bevarande av färdiga produkter. RWAAI gör det möjligt för forskare att skapa arbetsytor där data kan förmedlas, transkriberas och analyseras online tillsammans med kollegor eller språkinformanter varsomhelst i världen. Dessa arbetsytor kan sedan laddas upp direkt i samma miljö i form av förvaltade samlingar som lever upp till högsta moderna arkivstandard.

Inspirationen till RWAAI kommer från en 40-årig forskningstradition i Lund kring austroasiatiska språk, i synnerhet Kammu-projektet. Denna samarbetsinriktade och tvärvetenskapliga forskning startades av den framsynta etnografen Kristina Lindell. Men forskarnas unika analoga samlingar låg och tynade bort på flera olika platser, okatalogiserade och otillgängliga för framtida generationer av forskare och för språksamhällena själva. Vi kände också till flera andra austroasiatiska samlingar världen över som var i ett lika bekymmersamt skick.

RWAAI lanserades officiellt i mars 2013 och den åtföljande informationskampanjen, bland annat i form av konferenspresentationer, lockade stort intresse från austroasiatiska forskare. Detta har fått till resultat att forskningssamlingar säkrats, som innehåller de enda existerande inspelningarna i världen av starkt hotade och i vissa fall nu utdöende språk och kulturer i Sydöstasien och Indien. Dessa analoga samlingar, insamlade i den fördigitala eran, finns nu i säkert förvar tillsammans med moderna digitala motsvarigheter. Originalinspelningar i ljud och bild, transkriptioner, översättningar, illustrationer, fotografier, kartor och fältanteckningar är nu sökbara med hjälp av modern katalogisering, och är nedladdningsbara. Metadata för alla data tillgängliga i RWAAI är åtkomliga genom Virtual Language Observatory och OLAC, sökmotorer som är särskilt ägnade åt språkresurser, som indexerar samlingar i samtliga kompatibla resurser. RWAAI är också synlig genom den egna hemsidan på Lunds universitets webbsidor (www.lu.se/RWAAI), som har en direktlänk till arkivet. Samtliga samlingar är också länkade till relevanta artiklar om språken och samhällena på Wikipedia.

Vårt ursprungliga mål i projektet var att befolka arkivet med en uppsättning i förväg utvalda samlingar från fyra av språkfamiljens tretton huvudgrenar. Detta blygsamma mål överträffades snabbt, i synnerhet med säkrandet av betydande samlingar i samband med vår informationskampanj. Vid projektets slut finns vi representerade i nio av språkfamiljens huvudgrenar, och vi hyser data från 42 av de 164 kända austroasiatiska språken - ett ansenligt antal, eftersom flera av familjens språk och språkgrenar fortfarande är relativt odokumenterade. Omkring 1250 timmar ljudinspelningar och 250 timmar video har mödosamt digitaliserats i realtid av teamets tekniker.

Ur tematisk synvinkel dokumenterar RWAAI:s olika samlingar inte bara språk utan också sedvänjor, folklore och musik. Specialister inom antropologi och etnomusikologi har visat ett särskilt stort och av oss oförutsett intresse. Flertalet samlingar är insamlade in situ i Asien, men en av våra största samlingar av verbal konst spelades in i USA på 1980-talet bland nyanlända immigrantgrupper som hade flytt från en av de många väpnade konflikter som omöjliggjorde austroasiatisk forskning i Sydöstasien under stora delar av 1900-talet. Våra internationella depositörer innefattar specialister från Europa, USA, Australien, Sydöstasien och Japan, liksom representanter för språksamhällena själva.

Den synergi vi skapat mellan RWAAI och våra depositörer främjar ett spännande nytt och tvärvetenskapligt nätverk av specialister, som redan börjar dra nytta av den digitala resursen. Samlingarna fortsätter att växa med depositioner från nu aktiva forskare som arbetar med 'digitalt födda' material under uppbyggnad, liksom medverkan av personal och forskarstuderande lokalt vid Lunds universitet. Arkivet används också av studenter vid universitetet och har utgjort en primär resurs för kandidat- och magisteruppsatser.

Vår nydanande princip att använda moderna tekniker för språkdokumentation på äldre samlingar har inte tidigare brukats systematiskt av andra arkiv. Av denna anledning ägnade vi avsevärd energi åt att arbeta fram nya arbetsflöden och hantera de i högsta grad unika tekniska utmaningar vi ställdes inför. Vi utvecklade speciella redskap avsedda för äldre material för att automatisera processandet av metadata, autokorrigera ortografisk inkongruens och integrera multimediala resurser. Kammu-samlingarna från Lund blev vårt försöksområde. Ett av de program som utvecklades var Automated Tone Restoration för kammu-språket. Under loppet av den 40 år långa forskningstraditionen förändrades dess ortografiska konventioner, och det rådde därför stora skillnader mellan olika delar av samlingarna. Programmet utvecklades för att hantera detta i syfte att maximera samlingarnas återanvändbarhet som sökningsbar resurs.

Projektet förde samman ett nytt och dynamiskt team bestående av existerande och ny personal rekryterad såväl lokalt som internationellt. Detta har alstrat unik expertis i digital arkiveringsteknologi och det högst specialiserade återskapandet och digitaliseringen av analoga media, och det har berikat expertisen på och utanför institutionen. Vårt team och RWAAI-resursen befinner sig därför i framkanten av denna gren av digital humaniora och språkdokumentation i Nordeuropa. RWAAI:s roll har fått ett erkännande som fullvärdig medlem av The Digital Endangered Languages and Music Archive Network (DELAMAN http://www.delaman.org).

Under projektets gång har vi löpande gjort PR i form av informationsspridning och networking med inriktning på potentiella depositörer, framför allt i samband med konferenser och workshops inriktade på sydöstasiatisk språkforskning och etnografi, exempelvis Leipzig SEA workshop (november-december 2012) och SEALS XXIII i Bangkok (maj 2013), till antropologer på CHAGS i Liverpool (juni 2013) och i en specialsession om digitala resurser organiserad av oss vid CHAGS i Wien (sept 2015), samt till datalingvister på NODALIDA i Oslo (maj 2013). Projektet har nyligen också rönt uppmärksamhet i nyhetsmedia, i form av en artikel i Lunds Universitets Magasin (LUM) liksom i dagstidningen Sydsvenskan.

Projektet genererade en rad aktiviteter vid Lunds universitet. Prominenta gästdepositörer har hållit seminarier vid institutionen och deltagit i lokala workshops och roundtables. Vårt team har presenterat den digitala resursen i Humanistlaboratoriet och vid Avdelningen för Lingvistik, och har deltagit och presenterat i en mötesserie om digital humaniora. Projektmedlemmarna har också varit aktiva i nationella sammanhang, exempelvis i SWE-CLARIN, den nyetablerade nationella grenen av det pan-europeiska CLARIN-initiativet, liksom Svensk Nationell Datatjänst. Projektet har varit den främsta användaren och utvecklaren av korpusservern i Humanistlaboratoriet, och en av våra projektmedlemmar drar stor nytta av den nya expertis som projektet genererat i sin roll som Humanistlaboratoriets Corpus Server Manager. Vi har också ägnat oss åt kunskapsöverföring, däribland träning i arkivering och datahanteringsmetoder för medlemmar i ERC-projektet LACOLA (www.lu.se/lacola) och det Wallenberg-finansierade projektet LUNDIC (http://project2.sol.lu.se/lundic/index.html), som nu drar nytta av korpusservern.

Projektet har blåst nytt liv i Lunds universitets ställning som ledande centrum för austroasiatisk forskning och har med framgång gjort det till ett globalt betydande centrum för modern språkdokumentation utan motsvarighet i övriga Nordeuropa. Vi har utvecklat en föredömlig resurs som är tekniskt jämförbar med ledande internationella arkiv som The Language Archive (MPI Nijmegen) och Endangered Languages Archive (School of Oriental and African Studies, London). Projektet har också placerat oss i framkanten av modern dokumentation av äldre samlingar. Våra projektmedlemmar, däribland studentassistenter, har getts tillfälle att utveckla unik expertis inom digital arkivering och språkdokumentation, vilket inte minst är till förmån för den lokala återväxten av framtidens språkforskare.

Publikationer

Burenhult, N. (submitted). Domain-driven documentation: the case of landscape. Language Documentation and Conservation.
 Uneson, M. (2013). Tone restoration in transcribed Kammu: decision-list word sense disambiguation for an unwritten language. In Oepen, S., Hagen, K. & Bondi Johannessen, J. (eds.) Linköping Electronic Conference Proceedings, 399-410, 85.
 
 
Presentations:
 Burenhult, N. (2015). Mapping categories of the past and present for the future. Invited presentation in the session Imaging the Past: Using New Information Technologies To Nurture Historical Analysis, Annual Meeting of the American Association for the Advancement of Science (AAAS), San José, February 2015.
Burenhult, N., Kruspe, N., Larsson, J., Uneson, M. (2014). Digital Multimedia Corpora. Presentation at the Digital Tools in the Humanities seminar series, Lund University.
Burenhult, N. (2013). Domain-driven documentation: the case of landscape. Invited presentation at the International Conference on Language Documentation and Conservation (ICLDC) 3 special lecture series on interdisciplinary aspects of language documentation, funded by the National Science Foundation, University of Hawaii.
Burenhult, N. (2013). Mapping indigenous landscape categories: the case of Jahai (Austroasiatic, Malay Peninsula). Keynote at the workshop Landscape Through the Prism of Language, University of Zurich.
 Kruspe, N. (2013). Repository and Workspace for Austroasiatic Intangible Heritage. Southeast Asian Linguistics Society annual conference, Bangkok, Thailand.


Conference panel sessions:
Kruspe N., & Burenhult , N. (2015). Multimedia Resources for Hunter-Gatherer Research. 11th Conference on Hunting and Gathering Societies, September 2015, Vienna.
 
Workshops:
Kruspe, N. (2013). Invited ELAN Workshop, Uppsala University.
Kruspe, N. (2013). Invited ELAN workshop, Lund University.

Bidragsförvaltare
Lunds universitet
Diarienummer
In11-0066:1
Summa
SEK 4 800 000
Stödform
RJ Infrastruktur för forskning
Ämne
Ospecifierad ämne
År
2011