Gunn Inger Lyse Samdal
Stilling
Forsker, leksikograf, førstelektor
Tilhørighet
Forskergrupper
Kort info
Forskning
Nåværende stilling
Jeg jobber som forsker ved Universitetet i Bergen. Fra 2025 innbefatter stillingen min følgende oppgaver:
- Forskerstilling som leksikograf (ordbokredaktør) for de to offentlige ordbøkene Bokmålsordboka og Nynorskordboka. Disse har blitt systematisk gjennomgått fra a til å gjennom Revisjonsprosjektet (2018-2024). Ordbøkene er del av Språksamlingane ved Universitetet i Bergen. I denne prosjektstillingen forsker og publiserer jeg på temaer som moderne leksikografiske metoder, hvordan kollokasjoner fungerer i språket, faste uttrykk og formidling av kontroversielle ord i de offentlige ordbøkene. I tillegg bidrar jeg til formidling og opplæring, og var med på å motta Det humanistiske fakultets formidlingspris for 2023.
- Siden juni 2024 er jeg dessuten nasjonal koordinator i språkforskningsinfrastrukturen CLARINO. CLARINO er det norske bidraget til den europeiske infrastrukturen for språk CLARIN ERIC, i samarbeid med 25 land. Den norske noden CLARINO har seks partnere i konsortiet: Universitetet i Bergen (koordinator), Universitetet i Oslo, UiT Norges arktiske universitet, Nasjonalbiblioteket, NHH Norges Handelshøyskole og SIKT (tidligere NSD). Infrastrukturen oppgraderes gjennom NFR-prosjektet CLARINO+, som er i en driftsfase 2024-2029.
- Undervisning vår 2025: LING123: Språk og data og LING121: Fonologi
Forskergrupper
Forskningsinteresser
- Leksikografi
- Leksikalsk semantikk og semantiske ordnett
- Flerordsuttrykk og kollokasjoner
- Korpuslingvistikk
- Språkteknologiske metoder for språkanalyse og språkmodellering
- Datahåndtering
- Forskningsinfrastruktur (FAIR data, håndtering og deling av data, metadata)
Utdanning
Jeg forsvarte min ph.d.-avhandling ved Universitetet i Bergen i 2011 (tittel: Translation-based Word Sense Disambiguation). I denne avhandlingen utforsket jeg en metode for automatisk å bygge treningsssett, som deretter ble brukt i maskinlæringseksperimenter for å "lære" systemet å gjenkjenne riktig betydning av et ord med flere betydninger. Jeg har hovedfag i Datalingvistikk og Språkteknologi ved Universitetet i Bergen (2003), med støttefagene allmennlingvistikk, humanistisk informatikk, tysk og engelsk.
Arbeidserfaring
Jeg har deltatt i åtte nasjonale og to internasjonale forskningsprosjekter, i roller som prosjektleder, assisterende prosjektleder og arbeidspakkeleder. Gjennom min karriere har jeg jobbet ved flere institusjoner (UiB, Norce og Sikt) og har samarbeidet i prosjekter på tvers av institusjoner og sektorer.
Før min nåværende stilling har jeg jobbet med forskning og undervisning tilknyttet Datalingvistikk og Språkteknologi ved Universitetet i Bergen (2003 - 2007, 2012-2016 og 2018-). Jeg jobbet som forsker i språkteknologiske prosjekter ved Uni Research Computing i Bergen (2008-2009). Jeg har videre jobbet ved NSD - Norsk Senter for Forskningsdata AS (som i dag er lagt inn under Sikt) som spesialrådgiver for å videreutvikle NSDs opplæringsportefølje knyttet til datahåndtering, dataarkivering, FAIR data og personvern (2016-2018).
Se fanene om prosjekter og publikasjoner for ytterligere detaljer.
Publikasjoner
Vitenskapelig foredrag
- Losnegaard, Gyri Smørdal; Lyse, Gunn Inger; Haugereid, Petter et al. (2024). The syntax of usage examples in a Norwegian standard dictionary. (ekstern lenke)
- Lyse, Gunn Inger (2023). Faste uttrykk i Bokmålsordboka og Nynorskordboka: ikkje berre berre. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Svardal, Terje (2020). «den raude rase» og «negerfolk»: Om kontroversielle ord og nemningar i Bokmålsordboka og Nynorskordboka. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2019). Ut med adamsslekt og inn med arveprinsesse? Leksikografiske metodar i revisjonen av Bokmålsordboka og Nynorskordboka. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2019). Frå bandsalat til bandbreidde: Leksikografiske metodar i Revisjonsprosjektet for Bokmålsordboka og Nynorskordboka. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Gjesdal, Anje Müller (2016). Integrating heterogeneous digital text resources to analyze complex neologisms in Norwegian. (ekstern lenke)
- De Smedt, Koenraad; Samdal, Gunn Inger Lyse; Meurer, Paul et al. (2015). INESS meets CLARINO. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2015). Annotation in INESS. (ekstern lenke)
- Gjesdal, Anje Müller; Samdal, Gunn Inger Lyse (2013). CLARIN licensing schemes. (ekstern lenke)
- Andersen, Gisle; Samdal, Gunn Inger Lyse (2012). Flerordsuttrykk i Norsk aviskorpus. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Parra Escartín, Carla (2012). Applying current metadata initiatives: The META-NORD experience. (ekstern lenke)
- Lyse, Gunn Inger (2011). Translation-based Word Sense Disambiguation. (ekstern lenke)
- Lyse, Gunn Inger; Andersen, Gisle (2009). Om vispet krem og ubeskyttet sex: flerordsuttrykk i Norsk aviskorpus. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2006). Empiriske metoder innenfor datalingvistikk: var Chomskys kritikk av empiriske metoder berettiget?. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Nøklestad, Anders (2005). A distributional or a translational basis for data-driven sense discrimination?. (ekstern lenke)
- Lyse, Gunn Inger (2004). Translationally Based Lexical Semantics for WSD. (ekstern lenke)
- Lyse, Gunn Inger (2004). Translationally derived information about lexical semantics for WSD purposes. (ekstern lenke)
Faglig foredrag
- Svardal, Terje; Sjo, Klara; Lyse, Gunn Inger et al. (2023). Frukostseminar: På skattejakt i ordbøkene. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Losnegaard, Gyri Smørdal; Sjo, Klara (2023). På skattejakt i ordbøkene. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2018). Korpus og leksikografi . (ekstern lenke)
- Samdal, Gunn Inger Lyse; De Smedt, Koenraad; Dyvik, Helge J. Jakhelln (2015). Linguistically annotated text made available. (ekstern lenke)
Vitenskapelig artikkel
- Lyse, Gunn Inger; Rauset, Margunn; Dyvik, Helge J. Jakhelln (2022). Kollokasjonar - språkets R2-D2 og C-3PO. (ekstern lenke)
- Samdal, Gunn Inger Lyse (2020). Ut med adamsslekt og inn med arveprinsesse? Leksikografiske metodar i revisjonen av BOB og NOB. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Svardal, Terje (2020). «Den raude rase» og «negerfolk»: kontroversielle ord i Bokmålsordboka og Nynorskordboka. (ekstern lenke)
- Rosén, Victoria; Thunes, Martha; Haugereid, Petter et al. (2016). The enrichment of lexical resources through incremental parsebanking. (ekstern lenke)
- Gjesdal, Anje Müller; Samdal, Gunn Inger Lyse (2016). Exploring an environmental neologism in Norwegian across corpora. (ekstern lenke)
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
- De Smedt, Koenraad; Samdal, Gunn Inger Lyse; Kyrkjebø, Rune et al. (2016). The CLARINO Bergen Centre: Development and Deployment. (ekstern lenke)
- Dyvik, Helge J. Jakhelln; Meurer, Paul; Rosén, Victoria et al. (2016). NorGramBank: A ‘Deep’ Treebank for Norwegian. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Meurer, Paul; De Smedt, Koenraad (2015). COMEDI: A component metadata editor. (ekstern lenke)
- Losnegaard, Gyri Smørdal; Samdal, Gunn Inger Lyse; Gjesdal, Anje Müller et al. (2013). Linking Northern European Infrastructures for Improving the Accessibility and Documentation of Complex Resources. (ekstern lenke)
- Meurer, Paul; Dyvik, Helge J. Jakhelln; Rosén, Victoria et al. (2013). The INESS Treebanking Infrastructure. (ekstern lenke)
- Parra Escartín, Carla; Losnegaard, Gyri Smørdal; Samdal, Gunn Inger Lyse et al. (2013). Representing Multiword Expressions in Lexical and Terminological Resources: An Analysis for Natural Language Processing Purposes. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Parra Escartín, Carla; De Smedt, Koenraad (2012). Applying current metadata initiatives: The META-NORD experience. (ekstern lenke)
- Losnegaard, Gyri Smørdal; Samdal, Gunn Inger Lyse; Thunes, Martha et al. (2012). What we have learned from Sofie: Extending lexical and grammatical coverage in an LFG parsebank. (ekstern lenke)
- Samdal, Gunn Inger Lyse; Andersen, Gisle (2012). Collocations and statistical analysis of n-grams : multiword expressions in newspaper text. (ekstern lenke)
- Rosén, Victoria; Meurer, Paul; Losnegaard, Gyri Smørdal et al. (2012). An integrated web-based treebank annotation system. (ekstern lenke)
- Losnegaard, Gyri Smørdal; Samdal, Gunn Inger Lyse (2012). A data-driven approach to anglicism identification in Norwegian. (ekstern lenke)
- Vasiļjevs, Andrejs; Forsberg, Markus; Gornostay, Tatiana et al. (2012). Creation of an Open Shared Language Resource Repository in the Nordic and Baltic Countries. (ekstern lenke)
- Lyse, Gunn Inger (2007). "Making sense of translations": Translation-based lexical information for word sense disambiguation (WSD). (ekstern lenke)
Populærvitenskapelig foredrag
Vitenskapelig monografi
Kronikk
Doktorgradsavhandling
Intervju
- Lyse, Gunn Inger; Kvalheim, Berit (2011). Brage snakker med øynene. (ekstern lenke)
- Lyse, Gunn Inger; Graven, Andreas R. (2011). Øyestyring gir Brage et språk. (ekstern lenke)
- Lyse, Gunn Inger; Gjesdal, Anje Müller; Helleland Ådnanes, Jens (2011). Språkteknologi i bakevja. (ekstern lenke)
- Lyse, Gunn Inger; Graven, Andreas R. (2011). Sinke i språkhjelpemidler. (ekstern lenke)
Vitenskapelig antologi/Konferanseserie
Prosjekter
- Jeg jobber som leksikograf (ordbokredaktør) i Revisjonsprosjektet for Bokmålsordboka og Nynorskordboka (www.ordbok.uib.no). Prosjektet (2018-2023) er finansiert av Kulturdepartementet.
- Siden 2024 er jeg prosjektleder i det NFR-finansierte prosjektet CLARINO+. (NOK 12,6 mill). Prosjektet har oppgradert infrastrukturen CLARINO fra 2020 til og med 2023 slik at den kan tilby bedre data, verktøy og tjenester, og er i en driftsfase 2024-2029.
Tidligere prosjekter (kun på engelsk)
Previous projects:
- The NORDi project (2016-2021), supported by the Research Council of Norway, is owned by NSD - Norwegian Centre for Research Data. In 2016-2018, I worked at NSD as a special adviser on training and data management. In the NORDi project, I led the Work Package on training and Support. The main objective was to strengthen and expand guidance and training services at NSD, to increase awareness and practical skills within data management among researchers as well as research support staff in the Norwegian research sector. I worked both with digital training material and non-digital (face to face) training activities.
- The national infrastructure project CLARINO (2012-2016), supported by the Research Council of Norway, was owned by UiB - University of Bergen. CLARINO is the Norwegian contribution to the international CLARIN infrastructure. I worked as a project manager in CLARINO. My main field of expertise in this context is data management, metadata and IPR/licensing issues. (2012-2015)
- In the national infrastructure project INESS (2012-2016), supported by the Research Council of Norway, we developed a database of syntactically analysed sentences (a treebank). On the infrastructure side, I participated in developing the technical solutions of the INESS treebank (user interface, metadata, IPR issues). On the linguistic side, I added Norwegian sentence analyses to the treebank, mainly by manual annotation of sentences that have initially been parsed automatically by the NorGram grammar (LFG framework). In adding material to the Norwegian treebank, I also did text preprocessing and some grammar development.
- The infrastructure project DASISH, supported by the EU, aimed to create synergies between infrastructure intitiatives in the Social Sciences and Humanities (SSH), among other things we developed a Virtual Competence Center (VCC) for future researchers to find information about the moral, ethical and legal aspect of compiling research material. Project ending: December 2014.
- In the project META-NORD (2011-2013), supported by the EU, we worked to make language technology resources more easily available, offering standardized metadata and negotiating licences. We catalogued 67 Norwegian language resources relevant for language technology research and development. This work has been inherited by the projects CLARINO and (where relevant) INESS. My work in this project included: writing a national language white paper, creating metadata, encoding and reformatting research material, clearing resource ownership, rights and licenses.
- In the national project Norsk aviskorpus / Norwegian Newspaper Corpus (Uni Research, Dep. of Computing), I worked on automatic methods to identify Multiword Expressions, terms and anglicisms in Norwegian text. I explored a variety of so-called association measures in order to rank 2- and 3-word sequences (bigrams and trigrams) in terms of whether they are likely to constitute multiword expressions. This work is closely related to automatic term extraction and the automated detection of Anglicisms in Norwegian text. We also explored the use of machine learning systems to detect Anglicisms automatically.
- I was project leader for a development project at Uni Research Computing, where we provided language technology expertise to inprove a commercial writing aid system for dyslectics. In particular, I produced relations between orthography and pronunciation, and worked with n-grams for finding contexts to produce intelligent spelling suggestions.
- In the national Machine Translation (MT) project LOGON (2003-2006), I worked with statistical methods for Word Sense Disambiguation. My resulting Ph.D. thesis was defended in 2011.
- Connected to the national project Fra parallellkorpus til ordnett (From parallel corpora to word nets) at University of Bergen, I wrote my master's thesis and also worked as a scientific assistant in 2002 - 2003.