Lars-Erik Edlund

Svensk etymologisk databas.

Elof Hellquists klassiska verk Svensk etymologisk ordbok står sig förvånansvärt väl både i jämförelse med andra nordiska etymologiska verk och andra germanska arbeten. Den tredje upplagan är drygt femtio år gammal, men ges ständigt ut i nya omtryck. Det är dock uppenbart att mycket av den relevanta etymologiska diskussionen inte reflekteras hos Hellquist. Ett nödvändigt revideringsarbete är dock redan långt kommet. I detta arbete medverkar ett tiotal forskare i Sverige och Finland.
Målet med projektet är att göra den existerande texten i Hellquist ordbok samt de omfattande, nyskrivna revideringarna och tilläggen digitalt tillgängliga. Arbetet består av fem moment:

* inscanning av texten i Hellquists ordbok
* digitalisering av de nyskrivna texterna
* viss redigering, där exempelvis translittereringen görs enhetlig
* utarbetande av register, samt
* utarbetande av sökmotorer.
Resultatet av detta projekt blir en modern svensk etymologisk ordbok i digital form, som dels kan användas just i sin digitaliserade form av forskare och vid institutioner, dels kan tjäna som underlag vid en utgivning av en modern svensk etymologisk ordbok. Dessa slutprodukter har stor betydelse inomvetenskapligt - även internationellt sett - men kommer naturligtvis också att få betydelse för en bredare, språkligt intresserad allmänhet.

Slutredovisning

Lars-Erik Edlund, institutionen för litteraturvetenskap och nordiska språk, Umeå universitet

Etymologier intresserar som bekant både lekt och lärd. I frågespalter frågar allmänheter efter ordens ålder och ursprung, och när Nationalencyklopedin i mitten av 1980-talet planerades - jag hade själv förmånen att vara med i det initiala arbetet - var det en självklarhet att också etymologier skulle finnas i de enskilda ordartiklarna, samt att viktigare svenska orter skulle förses med etymologi alldeles som i Svensk uppslagsboks andra upplaga ("50-talsupplagan").

Stor omsorg ägnas i den största historiska ordboken över svenska språket, Svenska Akademiens Ordbok (SAOB, 1893- (1898-)), åt utredningen av de enskilda lexemens historia och ursprung samt åt frasernas historiska bakgrund och inlåningshistoria. Ofta tar ordboksredaktionen, som sitter i Lund, därvid hjälp av en annan svensk ordboksredaktion, den i Uppsala som arbetar med ordförrådet i Sveriges (svenska) dialekter (OSD), där det konkreta ordboksarbetet visserligen numera i praktiken lagts ner, men där de stora samlingarna naturligtvis behållits och fortfarande är tillgängliga för forskning.

På svensk botten är Elof Hellquists Svensk etymologisk ordbok ännu en fullt gångbar och oskattbar etymologisk källa. Detta klassiska verk utgavs första gången av trycket 1922. En "omarbetad och utvidgad upplaga" kom ut 1939, utgiven av Bertil Hellquist under överinseende av språkprofessorerna Emil Olson och Erik Noreen. En tredje upplaga utgavs så 1948, vilken upplaga sedan utkommit i flera omtryck från 1966 och framåt, detta på Gleerups förlag i Lund.

Hellquists etymologiska ordbok står sig väl både i jämförelse med andra nordiska etymologiska verk (Wessén, Nielsen) och andra germanska etymologiska ordböcker. Den tredje upplagan (1948) är närmare sextio år gammal, men ges trots detta ständigt ut i nya omtryck.

Hellquists ordbok omfattar strax under 1 500 trycksidor, och behandlar, inklusive referensord, cirka 20 000 uppslagsord, däribland många franska och klassiska lånord, samt en hel del dopnamn, släktnamn och ortnamn (detta trots att det alltså är en ordbok!). En omisskännlig personlig stilistisk utformning karakteriserar Hellquists etymologiska ordbok, något som säkert bidragit till att ge den sådan spridning utanför fackkretsarna.

Vetenskapshistoriskt är att notera att Hellquist har ett särskilt intresse då det gäller de ljudsymboliska tolkningarna - sådana hade i flera arbeten på 1890-talet och framåt intresserat Hellquist, och resulterade i flera viktiga vetenskapliga arbeten - samt att Hellquist ibland ger sig ut i längre utredningar som inbegriper också folkminnesrelaterade och historiska förhållanden, såsom i samband med utredningen av ordet "ekorre".

Det är dock givet att den senare etymologiska diskussionen inte kan återfinnas hos Hellquist. Förhållandet att den etymologiska diskussionen inte reflekteras hos Hellquist, blir alldeles uppenbart när man jämför med den senaste etymologiska ordboken över det isländska ordförrådet (Ásgeir Blöndal Magnússon, Íslensk or?sifjabók, 1989) eller det för några år sedan utgivna arbetet om det norska arvordsförrådet ursprung (som dock även innehåller uppgifter om en del inlånade ord), germanisten Harald Bjorvands & komparativisten Fredrik Otto Lindemans mycket omfattande Våre arveord (2000). I detta sistnämnda arbete har dessutom den för äldre ordhistoria så viktiga laryngalteorin fått starkt genomslag, vilket resulterat i att flera nya, högst trovärdiga härledningar framlagts; jfr härom närmare min recension av ordboken, artikeln "Indoeuropeiskt, germanskt, nordiskt - några reflexioner kring en ny etymologisk ordbok", i Arkiv för nordisk filologi 117, 2002, s. 221-236, och jfr vidare härtill de recensioner som framlagts av Lennart Elmevik (Maal og Minne) och Svante Strandberg (Namn och bygd).

Man inser att Hellquists etymologiska överväganden har flera decennier på nacken också då man jämför enskilda härledningar i den med motsvarande etymologier i ett så auktoritativt (och förebildligt) arbete som Friedrich Kluge, Etymologisches Wörterbuch der deutschen Sprache, som kommit med inte mindre än tre nya upplagor bara under åren 1989-2002 (22.-24. Auflage), detta genom Elmar Seebolds försorg.

Ett revideringsarbete av Hellquist är därför alldeles nödvändigt, och faktiskt sedan ungefär tre decennier påbörjat. Revideringsarbete har alltså tagit mycken tid i anspråk, mest beroende på att det utförts på ideell basis i sin helhet, till en början genom några enskilda forskare i Lund (Sven Ekbo, Gösta Holm). Vid det här laget har säkerligen tiotalet forskare varit/blivit engagerade från Sverige och Finland (se närmare nedan, avdelning 3.1).

Nästan undantagslöst har det varit emeriterade forskare med ordhistoriskt forskningsintresse som författat de uppdaterade partierna av ordboken, i några fall pensionerade chefer för ordboksredaktionen i Lund (Sven Ekbo, Hans Jonsson, Lars Svensson). Det har uppenbart varit svårt att få yngre forskare engagerade i arbetet, till dels för att ordboksarbete av detta slag knappast ansetts särskilt meriterande för forskare i karriären, till dels för att en yngre forskargeneration kommit att prioritera helt andra forskningsuppgifter inom nordistiken än etymologiska.

SYFTE


Målet med det härmed avslutade infrastrukturella projektet, har enligt den ursprungliga planen varit att dels digitalisera den existerande texten i Hellquists etymologiska ordbok, dels att göra de omfattande, nyskrivna revideringarna tillgängliga i digital form. Dessutom skall dessa etymologiska uppgifter vara sökbara i en gemensam databas.

För att genomföra arbetet har konkret följande uppgifter lösts:
* inscanning av texten i Hellquists tryckta ordbok, och rättning av densamma (de många diakritiska tecknen och det ibland svaga trycket i böckerna, har i somliga fall ställt till en hel del bekymmer vid både inscanningen och den därpå följande redigeringen)
* digitalisering av alla nyskrivna texter (som i de flesta fall förelegat maskinskriven eller, beträffande Sven Ekbos omfattande manuskript, i handskriven form)
* viss redigering av texterna, dock har inte translittereringsprinciperna harmonierats mellan Hellquist och de nya skribenternas texter. Eftersom det inte ansetts vara rimligt att ändra i Hellquists text efter de senare författarnas principer (Hellquist måste ju återges ordarätt), och - självfallet - inte heller känts adekvat att ändra de senare skribenternas texter efter Hellquists ibland något ålderdomliga principer, har harmonieringen av translittereringen helt fått anstå i denna fas av arbetet. De enskilda författarnas translittereringsprinciper har således behållits, då de valda principerna knappast ställer till några som helst problem för dem som tar del av texten. För translittereringsprinciperna lämnas en redovisning i särskild ordning.
* utarbetande av sökmotorer, varigenom sökbarhet uppnåtts.

Resultatet av detta infrastrukturella projekt har blivit en etymologisk ordbok över det svenska språket, som dels kan användas i sin digitaliserade form av forskare och vid institutioner, dels i ett senare skede, när ALLA reviderade texter föreligger (se närmare härom avd. 3.1) och har harmonierats, kan tjäna som underlag vid en utgivning av en modern svensk etymologisk ordbok.

Dessa slutprodukter har stor betydelse inomvetenskapligt (delar av manuskriptet används sålunda redan av ordboksreaktionen i Lund i dess arbete med Svenska Akademiens Ordbok), men kommer naturligtvis också att så småningom få betydelse för en bredare, språkligt intresserad allmänhet. Detta överensstämmer väl med de intentioner som projektet vid sin start satte upp.


HELLQUISTS ETYMOLOGISKA TEXT OCH DE NYSKRIVNA PARTIERNA


DE NYSKRIVNA PARTIERNA
Hellquists Svensk etymologisk ordbok (3 uppl., 1948, senare tryckning) föreligger naturligtvis i en svit från A-Ö. Det fanns i projekstarten en förhoppning om att merparten också av revideringen skulle föreligga för hela alfabetet, låt vara att arbetet med att skriva nya etymologitexter som sagt är och hela tiden har varit ideellt, och alltså skett helt utan arvoden och dessutom utan kostnadsersättningar.

Som jag redan i tidigare skrivelse till Stiftelsen Riksbankens Jubileumsfond (detta i samband med anhållan om förlängd dispositionsrätt av anslaget, senast i brev av den 23 januari 2005) klargjort, har p.g.a. sjukdom och dödsfall bland skribenterna den i början ambitiöst planerade revideringen inte kunnat slutföras med ett resultat som hade varit det optimala - nämligen med slutförande av i varje fall lejonparten av revisionsarbetet under projektperioden.

Läget är detta att de för etymologiförfattande rätt tidigt inbokade nordisterna Claes Åneman och Sven Söderström (den förstnämnde pensionerad universitetslektor i nordiska språk vid Uppsala universitet, den senare f.d. arkivchef vid Dialekt- och folkminnesarkivet i Uppsala (ULMA)) ganska snart efter pensioneringen engagerade sig som skribenter av några större bokstäver (bl.a. A och B) i första delen i alfabetet. Men båda drabbades av svåra sjukdomar, och avled utan att ha kunnat slutföra sina uppdrag.

Försök har av projektledaren gjorts att rekonstruera det av Åneman och Söderström utförda arbetet, men endast då det gäller Sven Söderströms texter har detta lyckats, och då endast delvis. Tyvärr rör det sig här mest om mer begränsade excerperingar och vissa förarbeten, låt vara att dessa naturligtvis är välgjorda. Claes Åneman och Sven Söderström har visserligen så småningom ersatts av andra skribenter, som nu arbetar med revideringsarbetet, men revideringsarbetet för första delen av alfabetet är långt ifrån klart.

Under projektperioden har dessutom Sven Ekbo avlidit. Sven Ekbo hade som emeriterad chef för Svenska Akademiens Ordbok skrivit omfattande artiklar för de stora bokstäverna S och T, men hann aldrig med att slutligt korrekturläsa de digitaliserade delarna av sitt manuskript.

Flera av de ursprungligen tingade författarna har också lämnat sina skrivuppdrag av tidsbrist, och det har i flera fall inte varit lätt att hitta goda ersättare. Någon enstaka gång har det visat sig att en ersättare inte heller hållit måttet, varför ytterligare byten då måst ske. Gösta Holm har intill nyligen biträtt projektledaren och tagit olika kontakter, men detta arbete har nu helt övertagits av projektledaren.

Läget då det gäller revideringen är konkret följande:
a. följande bokstäver har nyskriven etymologisk text, och denna text är inlagd i basen och har korrekturlästs av författaren, ibland t.o.m. två gånger, i några fall också av projektledaren: F (Börje Tjäder), K (Hans Jonsson), O, P, Q, R (Gösta Holm), S-T (Sven Ekbo), U, V, X, Y, Z, Å, Ä, Ö (Gösta Holm). Även om en hel del tid lagts på koorekturarbete, får konstateras att felaktigheter ännu kan kvarstå. (Vissa oklarheter i avfattningarna av härledningarna har heller inte kunnat klarläggas, eftersom en av huvudförfattarna, Sven Ekbo, gått bort.)
b. följande bokstäver föreligger i grov manuskriptform: H (Sven Söderströms efterlämnade manuskript, tyvärr i ofullständigt skick), M (manuskript efter framlidne Ture Johannisson, vilket också är ofullständigt)
c. följande bokstäver har författare som just nu arbetar med ordboksmanuskript: A (Jan Paul Strid, Linköping), B (Lars Svensson, Lund), C, D (Lars-Erik Edlund, Umeå), E (Börje Tjäder, Uppsala), G (skribent har ej kunnat fullgöra uppdraget), H (Hans Jonsson, Lund), I, J (Lars-Erik Edlund, Umeå), L (skribent har ej kunnat fullgöra uppdraget).

Som jag ser det föreligger - trots förhållandet att en hel del nyckriven etymologisk text ännu saknas av skäl över vilka man inte mänskligt styr - vid projekttidens utgång ändå en imponerande etymologisk databas med omfångsrika nyskrivna partier och en digital variant av den föreliggande, tryckta Hellquisttexten.


OMFÅNGET OCH KARAKTÄREN AV DE NYSKRIVNA PARTIERNA

Som vi ser av Figur 1, som redovisar förhållandena för de enskilda bokstäverna, innebär de nyskrivna partierna en avsevärd utökning av Hellquists texter. Den ursprungliga Hellquisttexten består omfångsmässigt av cirka 16 500 kilobyte. De nyskrivna partierna består av cirka 7 100 kilobyte.

Om man så ser till proportionen mellan den ursprungliga Hellquisttexten och de nyskrivna partierna, jämför man naturligtvis endast de partier som föreligger i BÅDA baserna. Man ser då att den ursprungliga Hellquisttexten består av 11 000 kilobyte, och de nyskrivna partierna alltså av 7 100 kilobyte. Detta innebär således att revideringen byggt på Hellquisttexten med cirka 70 %.

Grundprincipen vid revideringen har varit att alla ord i Svenska Akademiens Ordlista (SAOL) skall finnas med i den etymologiska ordboken, men under den långa tillkomsttiden har ju ordlistan kommit i flera upplagor (10 -13 uppl.; 1973, 1986, 1998, 2006) och ordlistorna skiljer sig vad gäller ord som tagits med en del ifrån varandra, bl.a. då det gäller nyorden. Den senaste upplagan av SAOL har sålunda utökats med så mycket som 10 500 nya ord, under det att 5 500 strukits från den närmast föregående upplagan.

Av de färdigställda partierna är bokstaven F den som allra mest har karaktären av ren revidering och direkt komplettering av Hellquist.

Övriga nyskrivna partier kompletterar omfångsmässigt ganska mycket, både genom att många nya ord finns med, men också genom att författarna företagit ambitiösa omarbetningar.

I Gösta Holms partier (O-R, U-Ö) har dessutom rätt många ortnamn medtagits, vilket ger avsevärda texttillskott.

Mer exceptionella är bokstäverna S och T, där Sven Ekbos revideringstexter är omfångsrikare, för bokstaven T:s del avsevärt mycket omfångsrikare, än den ursprungliga Hellquisttexten är. Ekbos texter är också i genomsnitt längre än de övriga författarnas, och Ekbo följer ofta lånorden längre ner i historien än vad andra författare (och utreder ljud- och sakförhållanden i de långivande och låneförmedlande språken), men är också utförligare vad gäller inlånade personnamn. Läsaren får dessutom i Ekbos texter en mycket mer intim kontakt med den forskningsdiskussion som ligger bakom ett etymologiskt ställningstagande, men genom författarens väl betygade försiktighet, kan texterna stundom för den i språkhistoria inte alltför väl bevandrade bjuda visst läsmotstånd.

Längre in i forskningsdiskussionen förs man också i Hans Jonssons nyskrivna härledningar (bokstaven K).

Proportioner, Hellquist respektive supplement (i kilobyte)
Bokstav HQT SUPPL.
A 422 -
B 794 -
C 71 -
D 486 -
E 272 -
F 869 169
G 562 -
H 793 -
I 216 -
J 223 -
K 1461 371
L 673 -
M 679 -
N 465 -
O 276 182
P 629 202
Q 20 -
R 859 567
S 2418 2709
T 1000 1575
U 246 134
V 1130 458
X 22 25
Y 90 48
Z 36 24
Å 184 122
Ä 266 88
Ö 245 159
FIGUR 1. Omfånget av texterna i Elof Hellquists Svensk etymologisk ordbok i den databas som byggts upp av projektet "Svensk etymologisk databas") och omfånget av de texter som nyskrivits.


VILKA ORD HAR KONKRET TILLKOMMIT VID REVIDERINGEN?


För att ge läsaren en konkret uppfattning om vilka ord som tillkommit redovisas här nedan två partier, dels från bokstaven T (Figur 2) , dels från bokstaven U (Figur 3), vilka ord som förekommer hos Hellquist och sedan vilka ord som förekommer i den reviderade texten. Hellquists ord står i vänstermarginal, de som finns i den reviderade texten har dragits ut mot höger. Är ett enskilt lexem både vänster- och högerställt, innebär det att ordet finns i både Hellquists ursprungstext och i det reviderade partiet.

Man kan se att en del nyord tillkommit, exempelvis en del facktermer som Hellquist inte har med, såsom "tektonik", "tenacitet", "tensid" och "terawatt", men också ord som "telemarkssväng" och "ufo".

Man kan också se, framför allt är det uppenbart i utdraget från bokstaven U, att många ortnamn ges en etymologisk utredning, och då inte bara de som är nordgermanska utan också en del samiska och finska namn; i utdraget från U finner vi sålunda namnet "Uddjaur" (namnet på en sjö i lappländska Arjeplog).

teknik
teknik
teko-
tektonik
tele-
tele-
telemarkssväng
teleologi
tellur
teln
teln
telning
telning
tema
tema
tempel
tempel
tempel
tempera, sbst.
tempera, vb.
temperdag
temperera
temperera
tempo
tempo
tempus
ten
ten
tena
tenacitet
tenakel
tenakel
tendens
tendens
tender
tender
tendera
tendera
tenlika
tenn
tenn
tenn
tennis
tenor
tenor
tensid
tentakel
tentakel
tentamen
tentamen
tentera
teo-
teo-
Teoderik, mansn.
teodolit
teodolit
teofyllin
teori
teori
tep
tep
tequila
[ter(e).]
teragelse.]
terapi
terapi
terawatt
terbin
terebint, se terpentin.
Terese
teriak
teriak
term
term
termer
termik
termin
termin
terminologi
termisk
termit
termit
termometer
termometer
termos
tern
tern
terpentin
terpentin
terrakotta
terrakotta
terrarium
terrass
terrass
terrester
terrier
terrier
terrin
terrin
territorium
territorium
terror
terror
terräng
terräng
ters
ters
terserol
terserol
tersett el. terzett
Tersmeden
Tersmeden
terzin
tes
tes
tesa.]
tesaurus
FIGUR 2. Ord som finns i Elof Hellquists Svensk etymologisk ordbok (vänsterställda) och de som finns i Sven Ekbos reviderade text (högerställda). Ett parti från bokstaven T. (Observera - i den databas dit slutrapporten inlevererats är vänster- och högerställningen korrekt återgiven, medan detta i den utskrivna versionen inte framgår.)

udd
udd
udda
udda
Uddarby
udde
udde
Uddevalla
Uddevalla
uddevallare
uddevallare
Uddjaur
uff
ufo
ufs
ufs
[ugg.]
ugge (ogge)
uggla
1. uggla
2. uggla, vb.
af Ugglas
Ugglum
ugn
ugn
ugrisk
uh
uj
ukas
Ukna
ukulele
[Ukraina.]
ul
1. ul
2. -ul, -ol, se 1. -el, [avd.] 2.
3. -ul, betonad avl.-änd.
ula
ulan
ulan
Ulander
ulcerös
Ule
Ule
Ulen
Ulf
ulk
2. ulk
ulka
ulka
Ulken
1. ull
1. ull
2. Ull, gudan.
2. Ull
Ulla
Ullared
Ullasjö
Ullbolstad
Ullene
Ullentuna
Ullerud
Ullervad
Ulleråker
Ullfors
Ullner
[Ullstorp.]
Ulltuna
Ullvättern
Ullånger
ulma
ulma
Ulricehamn
Ulrik
Ulrik
Ulrika
Ulriksdal
Ulriksfors
ulspegel
ullspegel
ulster
ultimatum
ultimatum
ultra
ultra
Ultuna
Ultuna
Ulunda
1. ulv
1. ulv
2. Ulv, Ulf, mansn.
2. Ulv, Ulf
[Ulvestorp.]
Ulvshyttan
Ulvsunda
Ulvåsa
Ulvåsa
FIGUR 3. Ord som finns i Elof Hellquists Svensk etymologisk ordbok (vänsterställda) och de som finns i Gösta Holms reviderade text (högerställda). Ett parti från bokstaven U. (Observera - i den databas dit slutrapporten inlevererats är vänster- och högerställningen korrekt återgiven, medan detta i den utskrivna versionen inte framgår.)


VAD HAR TILLKOMMIT I DE ENSKILDA ARTIKLARNA?


För att ge läsaren av denna slutrapport en konkret uppfattning om vad som tillförs med de nya etymologiska texterna, återges här dels Hellquists, dels Ekbos texter rörande räkneordet "sju" (även om de diakritiska tecknen här inte kunnat återges) och de uttryck som knyter an till räkneordet (Figur 4), dels Hellquists, dels Ekbos texter rörande kvinnonamnet "Therese" (Figur 5).

Man kan av dessa exempel se att Sven Ekbo i sin revideringstext följer olika uttrycks bakgrund ännu längre ner i källorna, och söker utreda den yttersta grunden till "sjumilastövlar" och "sjusovare". Då det gäller personnamnet "Therese", ser vi att Ekbo följer namnet ner i källorna och därigenom även ger läsaren en inblick i forskningsdiskussionen rörande detta namn.

Det är möjligt att just en del av dessa upplysningar, blir väl detaljrika för en etymologiskt intresserad allmänhet, men för forskare av facket är det självfallet av omistligt värde att utredningarna blir så här sorgfälliga. (Jag vill gärna återigen understryka att Sven Ekbos revideringsarbete är ordbokens mest omfångsrika och ambitiösa, varför man alltså inte skall tro att revideringarna rakt igenom blivit så här utförliga.)

Hellquist om SJU:
"1. sju, fsv. si_ = fgutn. siau (jfr biau_a = fsv. bi__a), isl. sjau (i formellt avs. dunkelt), sjó, no. sjau, sju, fda. si_, da. syv, av urnord. *se÷u(n) med bortfall av ÷ framför u (jfr Bjur-, bäver) = got. sibun, fsax. si÷un, fhty. sibun (ty. sieben), ags. seofon (eng. seven), av germ. *se÷un (bevarandet av n i slutljud kan bero på ett *se÷uni-, nybildning. efter t. ex. *fimfi, 5, se Brugmann Grundr. II. 2: 18 med litter. o. jfr tio; el. möjl. på inverkan från ordningstalet); jfr med bibehållet t salfrank. septun; av ie. *sept = sanskr. saptá-, grek. (h)eptá, lat. septem, fir. secht n-, med motsvarigheter el. ombildningar i övriga språkfamiljer. - Sju i vissa stående uttr. brukades i Norden o. annorstädes som ett typiskt stort tal. Ex.: Då det blir sju torsdagar i en vecka. Jfr även: sju sorger och åtta bedrövelser, förr även: sju sorger och en nöd, efter Bib. 1541, Job 5: 19: 'Vthaff sex bedröffuelse frelsar han tigh, och j then siwnde kommer intet ondt widh tigh'. Möjl. också i sjumilastövlar; jfr nedan. I vissa fall beror anv. därpå, att sjutalet hos somliga folk, t. ex. i Orienten, betraktades som heligt. Sju för tu, t. ex. Chronander 1649: 'säga sju för tu'; av samma slag som bot för sot, rätt och slätt, smått och gott, ur och skur osv.; jfr Asteropherus 1609: 'När han har itt glaas eller tw, vil iagh opskrifua kannor siu', ävensom ä. nsv. skrifva X för V, (ä.) da. sætte x for u og seks for sju. - Om den sydsv. svordomen min sju se 2. sju. - Sjunde, fsv., fda. siunde (nda. syvende är ombildat efter syv) = isl. sjaunde, sjunde, got. sibunda, fsax. si÷ondo, si÷otho, fhty. sibunto (ty. siebente), ags. seofo_a (eng. seventh har ombildats efter seven), av ie. *sept-to- = sanskr. saptátha-; utan avl. -t- däremot i lat. septimus, grek. (h)ébdomos, sanskr. saptamá- osv. - Sjuttio, fsv. si_t_o, ombildning av si_tighi = isl. sjautigir, eg.: sju tiotal; se f. ö. det analoga femtio o. tio; i got. dock ej sibun tigjus utan sibunt_hund (varom under tio). - Sjumilastövlar, t. ex. 1880, el. sjumils-, t. ex. Cygnæus 1843, Topelius, Wirsén, efter ty. siebenmeilenstiefel, från sagan om Tummeliten. Om valet av räkneordet sju se ovan. - Sjusovare, jfr folkboken 'Legenda eller een lijten historia om the siusoffuare' 1626 = da. syvsover, efter ty. siebenschläfer; eg.: en av de 'sju sovarna' (jfr fsv. the hælga VII soffwara), som enl. helgonlegenden sovo i en bergshåla vid Efesus från år 249 till år 447 o. efter vilka sjusovardagen, 27 juli (nu Marta-dagen) uppkallats. I överflyttad bem. redan 1649 från Växiö domkap.: 'Dn: (dvs. dominum, herr) Lundelium, dhen siusoffwaren och tidzspillaren'. - Sjustjärna (vanl. i pl best. f. -orna), stjärnbilden Plejaderna (av vars hundratals stjärnor blott ett ringa antal äro synliga för blotta ögat), y. fsv. siustierna Cod. Ups. C 20 = da. syvstjærnen, efter ty. siebengestirn."

Ekbo om SJU:
"1. sju. - Efter sju sorger och åtta bedrövelser, 1833 osv. Jfr de nu ovanliga fraserna efter (el. med) sju sorger och en nöd, 1805, 1928, med sju sorger, 1688. - I kraftuttryck används sju, betecknande ett (obestämt) stort antal, dels framför räkneord (särsk. hundra el. tusen), c. 1580 (: Hwadh siw twsende knefflar) osv., dels i adverbiell anv. framför ord av annat slag, t. ex. svordomar, 1645 (: siu fanersz skam) osv., el. i sådana uttryck som sju dundrande (också sammanskrivet), 1846 osv., el. sju särdeles (vanl. sammanskrivet), 1922 osv. - Sju för tu; jfr "När Fougden skrifver X för V, Så får du Tu för Sju" 1738. - Sjumilastövlar, 1861 (: 7-milastöflorna, best.) osv. Sagan om Tummeliten, som tar jättens sjumilastövlar publicerades av Ch. Perrault 1697 och översattes till sv. 1776 (inget exemplar av denna övers. tycks vara bevarat) och senare 1843 (jfr Tummeliten under tumme äv. suppl.). Den sv. sammansättningen (1843: sjumilsstöflor) är väl därför kanske kalkerad (inte på ty. utan) på fra. bottes de sept lieues. - Sjusovare; det av Hellquist anförda fsv. uttrycket aff the hälga vij sofwara återfinns i en handskrift från början av 1500-t.; i almanackor mellan 1693 och 1900 står för 27 juli (helgad åt deras minne) Sjusofware el. 7 Sofvare, till en början endast i en del av de för olika horisonter och av olika författare utgivna kalendrarna; jfr sjusovar(e)dag(en), 1809 osv. - Sjustjärna, c. 1478 osv., är väl närmast översättningslån från mlty. sevenstern(e), mest i pl. (liksom det sv. ordet)." S. E.

FIGUR 4. Räkneordet SJU i Hellquists resp Ekbos version. Ekbos text kompletterar som vi ser här Hellquists artikel, inte minst vad avser fraser.

Hellquists text:
"Therese, kvinnon., L. = ty., av fra. Thérèse, efter det spanska helgonet Theresa (+ 1582)."

Ekbos text:
"Therese (T[h]érèse), 1794 osv., i (den ursprungliga spa.) formen Teresa 1844 osv., latiniserat Teresia, 1764 (: Theresia) osv., det senare i almanackan 27/4 1865-1917 (skrivet The- 1865-1900, därefter Te-), sedan 1918 26/4. Spa. Teresa (känt åtminstone sedan 900-talet o. i ä. tid i lat. text också skrivet Taresa o. Taresia) anges (i A. Alcover Diccionari català-valencià-balear 10, 242, 1969) utgå från ett lat. kvinnonamn Tharasia, som sedan modifierats till Teresia o. Teresa; om detta Tharasia kan antas vara en y. form av det lat. namnet Taracia (vilket är osäkert men väl ej omöjligt, ev. genom suffixbyte), utgör det fem. form av Taracius, Tarracius, som av W. Schulze Zur Geschichte der lat. Eigennamen 97, 1904, tolkas som namn av etruskiskt ursprung men som kanske hellre kan uppfattas som bildat till lat. Tarraci (nuv. Tarragona i Spanien, grek. Tarrákon, av inhemskt [iberiskt] Tarakon, med okänd bet., känt från 200-t. f. Kr.); namnet Tarracius bars bl. a. av en stadsprefekt i Tarragona på 300-t., jfr G. Alföldy i Realencyclopädie der class. Alterstumswissenschaft Suppl. 15, 578 ff., 1978, med litt." S.E.

FIGUR 5. Kvinnonamnet THERESE i Hellquists respektive Ekbos version.

ADMINISTRATIONSGRÄNSSNITTET OCH SÖKGRÄNSSNITTET
Databasen har två gränssnitt, en lösenordsskyddad del, vilken används av redaktionen för att lägga in nytt material och för att rätta fel i inlagd text, dels en publik del där allmänheten kan göra sökningar och utskrifter av material. Databasen är uppbyggd så att man skall kunna sortera in material i olika samlingar. Det är möjligt att ha multipla förekomster av uppslagsord, eftersom samma ord kan förekomma i olika samlingar. Databasens struktur möjliggör sökningar på uppslagsord och även på relaterade ord.

DET LÖSENORDSSKYDDADE ADMINISTRATIONSVERKTYGET
Administrationsgränssnittet är uteslutande utvecklat för, och testat mot, moderna webbläsare. Mozilla Firefox rekommenderas därvid.

Skapa en samling
Man skapar en samling som man vill arbeta med för korrekturläsning och bearbetning.

Korrekturläsning
När man laddat ner en fil är det dags att korrekturläsa innehållet. Orden visas individuellt i var sin ruta. I överkanten på varje ruta finns knapparna "Redigera" och "Radera", samt en kryssruta som man skall kryssa i när man korrekturläst ordet. Nedanför kontrollerna hittar man en förteckning över vilka ord programmet indexerat, och där huvudordet/-orden markerats med fet stil. Det är de orden som kommer att ge sökträffar.

Om ett ord skulle visa sig vara felaktigt indexerat, klickar man på knappen "Redigera", så öppnas en liten textredigerare där man kan redigera och formatera texten. När man är klar, klickar man på "Spara"; för att avbryta utan att spara klickar man i stället på "Återgå". Om ordet inte skall vara med klickas på knappen "Radera".

Man måste dock vara observant på ord som har alternativa stavningar. Programmet kan hantera ord där parenteser används för att markera alternativa stavningsformer, så att ordet "snö(w)a" ger sökträffar för både sökorden "snöa" och "snöwa". Däremot hanteras inte hakparenteser, så ordet "snö[w]a" återfinns inte vid motsvarande sökning.

Administration av translitterering
Administrationsgränssnittet har en särskild kontrollpanel för att ställa in vilka tecken som skall translittereras. Translittereringspanelen kommer man åt via administrationsgränssnittets startsida genom att klicka på länken "Visa/redigera translitterering".

Utskrift
Det är möjligt att skriva ut enskilda ord ur sökresultatet. För varje ord som listas i vyn med sökträffar, finns en länk "Skriv ut". Klickar man på den öppnas ett nytt fönster där endast det aktuella ordet presenteras, och omgående kommer en utskriftsdialogruta upp. Utskriftsfunktionen kan emellertid inte användas om man avaktiverat javascript i sin webbläsare.

DET ÖPPNA SÖKGRÄNSSNITTET
Sökgränssnittet är enkelt till sin uppbyggnad. Överst hittar man ett textfält där man skriver in sitt sökord, och intill det fältet hittar man en rullgardinsmeny där man anger vilken typ av sökning som skall göras.

Följande alternativ finns:
Exakt träff: Hittar endast de uppslagsord som exakt matchar det man skrivit in i fältet. Märk att denna söktyp endast ger träffar på själva uppslagsorden, och inte söker i övrig text (se för fulltextsökning nedan).

Börjar med: Hittar alla förekomster där uppslagsordet börjar med den angivna sökfrasen. Exempelvis kan en sökning på "vacke" leda till att man både hittar ordet "vacke" och "vacker". Denna sökning ger, alldeles som den förra sökningen, träffar på själva uppslagsordet.

Slutar med: Som föregående, varigenom huvudleder i sammansättningar och avledningsändelser kan sökas.

Innehåller: Som föregående, varigenom en viss ordled (mellanled, viss teckenföljd) kan sökas.

Fulltextsökning: Söker igenom både uppslagsord och övrig text. Sökningen görs på samma sätt som det föregående alternativet, dvs. att den angivna sökfrasen skall förekomma på en position i texten.

I sökgränssnittet har man också valet att begränsa sin sökning till en viss samling, vilket görs med rullgardinsmenyn "Sök endast i följande samling". Varje samling inkluderar en större uppsättning ord som skrivits av en viss författare (en viss bokstav), och genom att begränsa sin sökning till en viss samling, kommer man således att endast söka bland det material som den aktuelle författaren sammanställt. Om man anger det förvalda alternativet "Alla samlingar" kommer allt material att inkluderas i sökningen, oavsett författare.

Translitterering av specialtecken
I textdatabasen finns en del specialtecken för att återge lexem som translittererats från andra alfabet än det latinska, men också för att återge tecken från olika fornspråk eller, i somliga fall, konstruerade former. I Hellquists text och de reviderade texterna finns ungefär 60 olika specialtecken, ofta är det fråga om ett slags kombinationstecken, t.ex. fornisländskt "o med hake och längdstreck", "i med längdstreck och accent" och olika specialtecken som återger ljud från sanskrit, albanska, hebreiska etc. Som redan inledningsvis (avdelning 2) framhållits har redaktionen ännu inte harmonierat de olika translittereringsprinciperna, och detta kommer knappast heller att bli fallet mer än beträffande annat än frekventa tecken. Däremot måste i en inledning redovisning lämnas över de principer som Hellquist för sin del använt och de som de olika revideringsförfattarna sedan använt.

De vanligaste typsnitten innehåller inte dessa specialtecken, och detta innebär för en användare att dessa tecken visas antingen som tomma fyrkanter eller som frågetecken. För att slippa detta måste användaren ladda hem i första hand något av de fria typsnitten Bitstream Vera eller Gentium, som båda inkluderar en mycket stor mängd specialtecken av de slag som används i texten. Typsnitten finns att hämta på följande adresser: http://www.gnome.org/fonts/; http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=Gentium

Det är dock möjligt att använda ordboken även om man inte har möjlighet att installera några andra typsnitt på sin dator. För att slippa få felaktiga tecken finns en funktion för att translitterera specialtecknen, så att de ersätts med vanliga bokstäver. Detta gör man genom att välja alternativet "Byt ut mot vanlig text" i sektionen "Specialtecken". Om man senare skulle installera något av de rekommenderade typsnitten, är det bara att välja alternativet "Lämna som de är", så avstängs translittereringsfunktionen.

Sökresultat
När man efter att ha angivit söktermer klickar på "Sök" kommer man till en sida med sökresultat. Där presenteras varje sökträff, och nedanför varje ord finns en förteckning med relaterade ord. Dessa ord har nämnts i den etymologiska texten för det aktuella ordet; exempelvis nämns ordet "vehikel" i texten för ordet "vagn", och listas därmed som en referens. Finns det fler än fyra referenser är de dolda från början för att spara utrymme; man klickar då på den gröna pilen så visas även övriga referensord.

Utskrift
Det är möjligt att skriva ut enskilda ord ur sökresultatet. För varje ord som listas i vyn med sökträffar, finns en länk "Skriv ut". Klickar man på den öppnas ett nytt fönster där endast det aktuella ordet presenteras, och omgående kommer en utskriftsdialogruta upp. Utskriftsfunktionen kan emellertid inte användas om man avaktiverat javascript i sin webbläsare.

ADRESS OCH SERVER
Adress
Preliminär adress till söksidan: http://130.239.57.41/.

Servern finns uppställd i HUMlab, Samhällsvetarhuset, Umeå universitet, vilket ger oss möjlighet till fortsatt service.


SAMMANFATTANDE SYNPUNKTER OCH FRAMTIDEN

Projektet har i databasen samlat en betydande mängd etymologisk information. Dels finns hela texten i Elof Hellquist, Svensk etymologisk ordbok (3. uppl., 1948, senare tryckning), dels betydande partier av nyskriven text, företrädesvis från senare delen av alfabetet. Informationen är enkelt sökbar. (Det skall emellertid här noteras, att under projekttiden "Projekt Runeberg" på nätet lagt ut första upplagan av Hellquists etymologiska ordbok, den som utgavs 1922, detta under adress: http://runeberg.org/svetym/.)

Den framtida ambitionen måste vara att i basen även få in de ännu inte färdigställda partierna av alfabetet, och att sedan en samordning av de etymologiska texterna kan ske före en eventuell publicering. I samband med detta arbete måste translittereringsprinciperna de olika nya författarna emellan ses över och stramas upp, kanske måste också - måhända med ledning av Bjorvands & Lindemans etymologiska ordbok Våre arveord (2000), jfr härtill min recensionsartikel i Arkiv för nordisk filologi, 117, 2002, s. 221 ff. - de nyskrivna etymologierna ytterligare revideras så att också laryngalteorin beaktas mer konsekvent i artiklarna; det är nämligen uppenbart att man på basis av denna teori kan presentera en del nya, spännande uppslag på den nordgermanska etymologins område.

Samtidigt måste urvalet av ord i den reviderade versionen ytterligare en gång ses över. Principen har i revideringsarbetet principiellt varit att ordförrådet i Svenska Akademiens Ordlista (SAOL) skall medtagas, men denna ordlista har ju kommit i flera upplagor sedan nittonhundrasjuttiotalet, då revideringsarbetet inleddes, och därför måste även här alltså en översyn till. Men då det gäller att i en gemensam databas göra etymologisk information om svenskan sökbar, är projektet härmed som jag ser det avslutat på den nivå som varit praktiskt möjlig.





 

Bidragsförvaltare
Umeå universitet
Diarienummer
In2000-7040:1-E
Summa
SEK 1 400 000
Stödform
RJ Infrastruktur för forskning
Ämne
Annan humaniora
År
2000