Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Lars Borin

Professor

Lars Borin
Professor
Akademisk grad: Doktor,
lars.borin@svenska.gu.se
031-786 4544
0707-478386

Rumsnummer: L305
Postadress: Box 200, 40530 Göteborg
Besöksadress: Lennart Torstenssonsgatan 6-8 , 41255 Göteborg


Institutionen för svenska språket (Mer information)
Box 200
40530 Göteborg
www.svenska.gu.se
svenska.exp@svenska.gu.se

Besöksadress: Renströmsgatan 6 , 40530 Göteborg

Om Lars Borin

Jag är föreståndare för Språkbanken och professor i ämnet språkvetenskaplig databehandling, som faller under det vidare forskningsområdet språkteknologi. Språkteknologi omfattar många olika forskningsinriktningar. Det har en uppenbart praktisk aspekt, där man utforskar och utvecklar metoder för att få datorer att uppvisa ”mänskligt” språkligt beteende, t.ex. textförståelse för storskalig dokumenthantering och informationssökning, automatisk översättning och automatisk omvandling av tal till text och vice versa. Språkteknologi har även en mer teoretisk sida, där man med datorns hjälp belyser egenskaper hos människans språk som generellt fenomen, både i avsikt att bidra till den språkvetenskapliga forskningen – ett av mina centrala forskningsintressen – och för att de kunskaper man vinner ska föras tillbaka så att man kan bygga alltmer sofistikerade språkhanterande datorsystem.

En ökande användning för såna system är som forskningsstöd i forskningsämnen där sakinnehållet i text (och tal) utgör centrala forskningsdata, en rik källa till information om historia, samhälle, politik, etc. Idag produceras enorma mängder digital text och de historiska texter som utgör en betydande och viktig del av vårt kulturarv digitaliseras i rask takt. Språkteknologi kan hjälpa forskarna att utnyttja detta jättelika material – miljardtals ord bara på svenska – genom att utveckla effektiva verktyg för digital humanistisk och samhällsvetenskaplig forskning. Detta är också ett viktigt fokus i min forskning, och särskilt de metodologiska frågor som uppstår i spänningsfältet mellan traditionella ”närläsande”, kvalitativa metoder och storskaliga kvantitativa metoder.

Utvecklingen av högpresterande språkanalyssystem fordrar tillgång till vad man brukar kalla språkresurser, både stora mängder relevant text och databaser med högvärdig lingvistisk information, t.ex. rikt strukturerade lexikon. Därför handlar en annan central del av min forskning om att utveckla och på bästa sätt utnyttja språkresurser för alla moderna och historiska former av skriven svenska.

Forskningsintressen

språkteknologiinfrastruktur, digitala språkresurser, e-vetenskap, forskningsmetodologi, digital historisk lingvistik, lexikografi, ordsemantik, språktypologi, digital humaniora, datorstödd språkinlärning, flerordsuttryck

Anställningar och uppdrag

Organisationer och samarbeten

Annat

  • Arrangör: SLTC (Swedish Language Technology Conference) 2006 (med Martin Volk), Göteborg
  • Lokal arrangör: EACL 2014 (med Aarne Ranta), Göteborg
  • Erik Wellanders pris för framstående forskning inom språkvårdens område 2014

Forskning

Min forskning bedrivs i Språkbanken, en forsknings- och utvecklingsenhet där det huvudsakliga målet för verksamheten är att utveckla språkresurser och språkverktyg för alla moderna och historiska former av skriven svenska.

Språkbanken har en stor användarbas i språkvetare och språkteknologer med intresse för svenska. För språkteknologerna tillhandahåller vi möjligheten att ladda ner de flesta av våra språkresurser, som sen kan användas fritt, i allmänhet även för kommersiella ändamål. För språkvetarna har vi lagt ner ett stort arbete på att utveckla bekväma webbgränssnitt för språkvetenskapligt arbete med stora textmängder – Korp (mer information om Korp) – och stora lexikonmaterial – Karp (mer information om Karp). Arbetet med Korp belönades 2014 med Erik Wellanders pris för framstående forskning inom språkvårdens område 2014.

Under senare år har vi arbetat aktivt med att vidga användbarheten av våra språkresurser och språkverktyg, mer specifikt i riktning mot e-vetenskap för humanistisk och samhällsvetenskaplig forskning, ett område som överlappar signifikant med s.k. digital humaniora. Konkreta aktiviteter är här det VR-finansierade ramprogrammet i kunskapsbaserad kulturomik samt SWE-CLARIN, den svenska grenen av den europeiska forskningsinfrastrukturen CLARIN ERIC.

Viktiga språkresurser och språkverktyg (ett urval)

  • SALDO, en stor lexikonresurs med ordsemantisk och morfologisk information
  • SweFN, ett svenskt frasnät (framenet)
  • Swesaurus, ett svenskt ordnät (wordnet)
  • Dalins ordbok över 1800-talsspråket
  • Söderwalls och Schlyters fornsvenska lexikon
  • IDS/LWT-listor för svenska och sydasiatiska språk
  • korpusinfrastrukturen Korp
  • lexikoninfrastrukturen Karp
  • Lärka, ett korpusbaserat webbgränssnitt för datorstödda ord- och grammatikövningar

Externfinansierade forskningsprojekt, pågående (”*” = huvudsökande)

Externfinansierade forskningsprojekt, avslutade (”*” = huvudsökande)

  • META-NORD, 2011–2013 (EU)
  • A System Architecture for ICALL, 2011–2013 (Nordplus)
  • DiaSynCorp, 2011–2013 (NOS-HS-nätverk)
  • ITG, 2002–2004 (Distum)
  • KELLY, 2009–2011 (EU)
  • SaleTek, 2003–2005 (NorFA-nätverk)
  • *CONPLISIT, 2011 (CLARIN)
  • SemanticMining, 2004–2007 (EU NoE)
  • *Framtidssäkring av Språkbanken, 2008–2010 (VR/DISC)
  • *En infrastruktur för svensk språkteknologi, 2007–2008 (VR/KFI-planeringsbidrag)
  • *SWE-CLARIN, 2013 (VR/RFI-planeringsbidrag)
  • Digital documentation of Indian minority languages, 2003–2005 (VR/SRL)
  • Litteraturbanken, pilotprojekt 2004–2005 (RJ)
  • Multimedia och GIS för språkdokumentation i Himalaya med fokus på etnobiologisk terminologi, 2008–2010 (VR/SIDA)

 

Senaste publikationer

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Linköping, Linköping University Electronic Press, Paper i proceeding 2016
Paper i proceeding

Sparv: Språkbanken’s corpus annotation pipeline infrastructure
Lars Borin, Markus Forsberg, Martin Hammarstedt, Dan Rosén, Roland Schäfer et al.
SLTC 2016. The Sixth Swedish Language Technology Conference, Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping, Linköping University Electronic Press, Proceeding 2016
Proceeding

Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
SLTC 2016. The Sixth Swedish Language Technology Conference. Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Preface. Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping Electronic Conference Proceedings, Inledande text i tidskrift 2016
Inledande text i tidskrift

Karp: Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
Globalex 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Lexikografi för maskiner och lexikografi för människor
Lars Borin
Framtidens lexikografi: Rapport från ett symposium i Göteborg 5 oktober 2012, Göteborg, Meijerbergs institut vid Göteborgs universitet, Kapitel i bok 2016
Kapitel i bok

Towards interactive visualization of public discourse in time and space
Lars Borin, Tomasz Kosiński
Linköping Electronic Conference Proceedings, Paper i proceeding 2016
Paper i proceeding

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Paper i proceeding 2016
Paper i proceeding

How can big data help us study rhetorical history?
Jon Viklund, Lars Borin
Linköping Electronic Conference Proceedings, No. 123. Edited by Koenraad De Smedt. Selected Papers from the CLARIN Annual Conference 2015. October 14–16, 2015, Wroclaw, Poland, Paper i proceeding 2016
Paper i proceeding

Visar 1 - 10 av 114

2016

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Linköping, Linköping University Electronic Press, Paper i proceeding 2016
Paper i proceeding

Sparv: Språkbanken’s corpus annotation pipeline infrastructure
Lars Borin, Markus Forsberg, Martin Hammarstedt, Dan Rosén, Roland Schäfer et al.
SLTC 2016. The Sixth Swedish Language Technology Conference, Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping, Linköping University Electronic Press, Proceeding 2016
Proceeding

Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
SLTC 2016. The Sixth Swedish Language Technology Conference. Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Preface. Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping Electronic Conference Proceedings, Inledande text i tidskrift 2016
Inledande text i tidskrift

Karp: Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
Globalex 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Lexikografi för maskiner och lexikografi för människor
Lars Borin
Framtidens lexikografi: Rapport från ett symposium i Göteborg 5 oktober 2012, Göteborg, Meijerbergs institut vid Göteborgs universitet, Kapitel i bok 2016
Kapitel i bok

Towards interactive visualization of public discourse in time and space
Lars Borin, Tomasz Kosiński
Linköping Electronic Conference Proceedings, Paper i proceeding 2016
Paper i proceeding

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Paper i proceeding 2016
Paper i proceeding

How can big data help us study rhetorical history?
Jon Viklund, Lars Borin
Linköping Electronic Conference Proceedings, No. 123. Edited by Koenraad De Smedt. Selected Papers from the CLARIN Annual Conference 2015. October 14–16, 2015, Wroclaw, Poland, Paper i proceeding 2016
Paper i proceeding

Visar 1 - 10 av 114

Sidansvarig: Kristina Holmlid|Sidan uppdaterades: 2016-07-14
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?