Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Svensk morfologisk databas (SMDB)

Svensk morfologisk databas (SMDB) tar sin utgångspunkt i 12:e upplagan av SAOL (1998). De cirka 120 000 ingående orden indelades i böjningsgrupper i syfte att generera en databas innehållande samtliga böjningsformer.

Vid genereringen försågs samtliga former med grammatisk märkning (så kallad taggning). Formerna presenteras i databasen såväl med som utan ordledsmarkeringar.

Den 13:e upplagan av ordlistan skapades på basis av den 12:e. Samkörningen av databasen med en stor textdatabas med bland annat tidnings- och romantexter gav ett viktigt underlag för bedömningen av vilka ord som kunde tas bort (resultatet blev cirka 5 000) men samtidigt vilka ord som kunde tillföras (cirka 10 000). Den nya upplagan (2006) kom sålunda att innehålla cirka 125 000 ord.

På liknande sätt skapades den nu aktuella 14:e upplagan på basis av den 13:e. Den 14:e upplagan innehåller cirka 13 000 ord som inte fanns i SAOL 13, medan cirka 9 000 ord från SAOL 13 har fått utgå.

SMDB härbärgerar alltså idag innehållet i SAOL 14, som nu i sin tur bildar underlag för en kommande 15:e upplaga. Man kan i databasen nå varje ord och dess böjningsformer och dessutom få aktuella frekvenser från bland annat press- och romanmaterial som idag omfattar flera hundra miljoner ord.

När man söker fram ett ord vid genereringen i SMDB får man också reda på den gruppbeteckning som ordet i fråga har. Man kan sedan söka på gruppbeteckningen, varvid samtliga ord listas som hör till gruppen i fråga. Eftersom alla ordformerna är taggade, kan man också söka fram frekvenser för speciella former, till exempel obestämd genitiv singularis.

Kontaktinformation

Anna Hannesdóttir, Lexikaliska institutet

Box 200, 405 30 Göteborg

Besöksadress:
Lennart Torstenssonsgatan 6

Telefon:
+46 (0)31 786 44 66

Sidansvarig: Webbredaktionen|Sidan uppdaterades: 2015-12-01
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?

Denna text är utskriven från följande webbsida:
http://svenska.gu.se/forskning/li/projekt/smdb/
Utskriftsdatum: 2017-09-24