Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Lars Borin

Professor

Lars Borin
Professor
Akademisk grad: Doktor,
lars.borin@svenska.gu.se
031-786 4544
0707-478386

Rumsnummer: L305
Postadress: Box 200, 40530 Göteborg
Besöksadress: Lennart Torstenssonsgatan 6-8 , 41255 Göteborg


Institutionen för svenska språket (Mer information)
Box 200
405 30 Göteborg
www.svenska.gu.se
svenska.exp@svenska.gu.se

Besöksadress: Renströmsgatan 6 , 405 30 Göteborg

Om Lars Borin

Jag är föreståndare för Språkbanken och professor i ämnet språkvetenskaplig databehandling, som faller under det vidare forskningsområdet språkteknologi. Språkteknologi omfattar många olika forskningsinriktningar. Det har en uppenbart praktisk aspekt, där man utforskar och utvecklar metoder för att få datorer att uppvisa ”mänskligt” språkligt beteende, t.ex. textförståelse för storskalig dokumenthantering och informationssökning, automatisk översättning och automatisk omvandling av tal till text och vice versa. Språkteknologi har även en mer teoretisk sida, där man med datorns hjälp belyser egenskaper hos människans språk som generellt fenomen, både i avsikt att bidra till den språkvetenskapliga forskningen – ett av mina centrala forskningsintressen – och för att de kunskaper man vinner ska föras tillbaka så att man kan bygga alltmer sofistikerade språkhanterande datorsystem.

En ökande användning för såna system är som forskningsstöd i forskningsämnen där sakinnehållet i text (och tal) utgör centrala forskningsdata, en rik källa till information om historia, samhälle, politik, etc. Idag produceras enorma mängder digital text och de historiska texter som utgör en betydande och viktig del av vårt kulturarv digitaliseras i rask takt. Språkteknologi kan hjälpa forskarna att utnyttja detta jättelika material – miljardtals ord bara på svenska – genom att utveckla effektiva verktyg för digital humanistisk och samhällsvetenskaplig forskning. Detta är också ett viktigt fokus i min forskning, och särskilt de metodologiska frågor som uppstår i spänningsfältet mellan traditionella ”närläsande”, kvalitativa metoder och storskaliga kvantitativa metoder.

Utvecklingen av högpresterande språkanalyssystem fordrar tillgång till vad man brukar kalla språkresurser, både stora mängder relevant text och databaser med högvärdig lingvistisk information, t.ex. rikt strukturerade lexikon. Därför handlar en annan central del av min forskning om att utveckla och på bästa sätt utnyttja språkresurser för alla moderna och historiska former av skriven svenska.

Forskningsintressen

språkteknologiinfrastruktur, digitala språkresurser, e-vetenskap, forskningsmetodologi, digital historisk lingvistik, lexikografi, ordsemantik, språktypologi, digital humaniora, datorstödd språkinlärning, flerordsuttryck

Anställningar och uppdrag

Organisationer och samarbeten

Annat

  • Arrangör: SLTC (Swedish Language Technology Conference) 2006 (med Martin Volk), Göteborg
  • Lokal arrangör: EACL 2014 (med Aarne Ranta), Göteborg
  • Erik Wellanders pris för framstående forskning inom språkvårdens område 2014

Forskning

Min forskning bedrivs i Språkbanken, en forsknings- och utvecklingsenhet där det huvudsakliga målet för verksamheten är att utveckla språkresurser och språkverktyg för alla moderna och historiska former av skriven svenska.

Språkbanken har en stor användarbas i språkvetare och språkteknologer med intresse för svenska. För språkteknologerna tillhandahåller vi möjligheten att ladda ner de flesta av våra språkresurser, som sen kan användas fritt, i allmänhet även för kommersiella ändamål. För språkvetarna har vi lagt ner ett stort arbete på att utveckla bekväma webbgränssnitt för språkvetenskapligt arbete med stora textmängder – Korp (mer information om Korp) – och stora lexikonmaterial – Karp (mer information om Karp). Arbetet med Korp belönades 2014 med Erik Wellanders pris för framstående forskning inom språkvårdens område 2014.

Under senare år har vi arbetat aktivt med att vidga användbarheten av våra språkresurser och språkverktyg, mer specifikt i riktning mot e-vetenskap för humanistisk och samhällsvetenskaplig forskning, ett område som överlappar signifikant med s.k. digital humaniora. Konkreta aktiviteter är här det VR-finansierade ramprogrammet i kunskapsbaserad kulturomik samt SWE-CLARIN, den svenska grenen av den europeiska forskningsinfrastrukturen CLARIN ERIC.

Viktiga språkresurser och språkverktyg (ett urval)

  • SALDO, en stor lexikonresurs med ordsemantisk och morfologisk information
  • SweFN, ett svenskt frasnät (framenet)
  • Swesaurus, ett svenskt ordnät (wordnet)
  • Dalins ordbok över 1800-talsspråket
  • Söderwalls och Schlyters fornsvenska lexikon
  • IDS/LWT-listor för svenska och sydasiatiska språk
  • korpusinfrastrukturen Korp
  • lexikoninfrastrukturen Karp
  • Lärka, ett korpusbaserat webbgränssnitt för datorstödda ord- och grammatikövningar

Externfinansierade forskningsprojekt, pågående (”*” = huvudsökande)

Externfinansierade forskningsprojekt, avslutade (”*” = huvudsökande)

  • META-NORD, 2011–2013 (EU)
  • A System Architecture for ICALL, 2011–2013 (Nordplus)
  • DiaSynCorp, 2011–2013 (NOS-HS-nätverk)
  • ITG, 2002–2004 (Distum)
  • KELLY, 2009–2011 (EU)
  • SaleTek, 2003–2005 (NorFA-nätverk)
  • *CONPLISIT, 2011 (CLARIN)
  • SemanticMining, 2004–2007 (EU NoE)
  • *Framtidssäkring av Språkbanken, 2008–2010 (VR/DISC)
  • *En infrastruktur för svensk språkteknologi, 2007–2008 (VR/KFI-planeringsbidrag)
  • *SWE-CLARIN, 2013 (VR/RFI-planeringsbidrag)
  • Digital documentation of Indian minority languages, 2003–2005 (VR/SRL)
  • Litteraturbanken, pilotprojekt 2004–2005 (RJ)
  • Multimedia och GIS för språkdokumentation i Himalaya med fokus på etnobiologisk terminologi, 2008–2010 (VR/SIDA)

 

Senaste publikationer

Sparv: Språkbanken’s corpus annotation pipeline infrastructure
Lars Borin, Markus Forsberg, Martin Hammarstedt, Dan Rosén, Roland Schäfer et al.
SLTC 2016. The Sixth Swedish Language Technology Conference, Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

SWORD: Towards Cutting-Edge Swedish Word Processing
Fabienne Cap, Yvonne Adesam, Lars Ahrenberg, Lars Borin, Gerlof Bouma et al.
Proceedings of the Sixth Swedish Language Technology Conference (SLTC) Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Towards a Big Data View on South Asian Linguistic Diversity
Lars Borin, Shafqat Virk, Anju Saxena
WILDRE-3 – 3rd Workshop on Indian Language Data: Resources and Evaluation, Paris, ELRA, Paper i proceeding 2016
Paper i proceeding

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Linköping, Linköping University Electronic Press, Paper i proceeding 2016
Paper i proceeding

Preface. Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping Electronic Conference Proceedings, Inledande text i tidskrift 2016
Inledande text i tidskrift

Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping, Linköping University Electronic Press, Proceeding 2016
Proceeding

Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
SLTC 2016. The Sixth Swedish Language Technology Conference. Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Karp: Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
Globalex 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Visar 1 - 10 av 117

2017

Korp 6 - Technical Report
Martin Hammarstedt, Johan Roxendal, Maria Öhrman, Lars Borin, Markus Forsberg et al.
Institutionen för svenska språket, Göteborgs universitet, Rapport 2017
Rapport

Korp 6 - Användarmanual
Martin Hammarstedt, Lars Borin, Markus Forsberg, Johan Roxendal, Anne Schumacher et al.
Institutionen för svenska språket, Göteborgs universitet, Rapport 2017
Rapport

2016

Sparv: Språkbanken’s corpus annotation pipeline infrastructure
Lars Borin, Markus Forsberg, Martin Hammarstedt, Dan Rosén, Roland Schäfer et al.
SLTC 2016. The Sixth Swedish Language Technology Conference, Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

SWORD: Towards Cutting-Edge Swedish Word Processing
Fabienne Cap, Yvonne Adesam, Lars Ahrenberg, Lars Borin, Gerlof Bouma et al.
Proceedings of the Sixth Swedish Language Technology Conference (SLTC) Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Towards a Big Data View on South Asian Linguistic Diversity
Lars Borin, Shafqat Virk, Anju Saxena
WILDRE-3 – 3rd Workshop on Indian Language Data: Resources and Evaluation, Paris, ELRA, Paper i proceeding 2016
Paper i proceeding

The Swedish Culturomics Gigaword Corpus: A One Billion Word Swedish Reference Dataset for NLP
Stian Rødven Eide, Nina Tahmasebi, Lars Borin
Linköping Electronic Conference Proceedings. Digital Humanities 2016. From Digitization to Knowledge 2016: Resources and Methods for Semantic Processing of Digital Works/Texts, July 11, 2016, Krakow, Poland, Linköping, Linköping University Electronic Press, Paper i proceeding 2016
Paper i proceeding

Preface. Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping Electronic Conference Proceedings, Inledande text i tidskrift 2016
Inledande text i tidskrift

Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC, Umeå, 16th November 2016
Elena Volodina, Gintarė Grigonytė, Ildikó Pilán, Kristina Nilsson Björkenstam, Lars Borin
Linköping, Linköping University Electronic Press, Proceeding 2016
Proceeding

Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
SLTC 2016. The Sixth Swedish Language Technology Conference. Umeå University, 17-18 November, 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Karp: Språkbanken’s Open Lexical Infrastructure
Malin Ahlberg, Lars Borin, Markus Forsberg, Olof Olsson, Anne Schumacher et al.
Globalex 2016, Konferensbidrag (offentliggjort, men ej förlagsutgivet) 2016
Konferensbidrag (offentliggjort, men ej förlagsutgivet)

Visar 1 - 10 av 117

Sidansvarig: Webbredaktionen|Sidan uppdaterades: 2017-08-31
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?