Sjefsforsker

Pierre Lison

Avdeling Statistisk modellering og maskinlæring
Telefonnummer +47 22 85 25 77
E-post plison@nr.stage.dekodes.no

Vis beskrivelsesinformasjon Skjul beskrivelsesinformasjon

Sjefsforsker ved Norsk Regnesentral
Førsteamanuensis II ved Universitetet i Oslo

Mine viktigste forskningsinteresser ligger innen naturlig språkprosessering (NLP) og maskinlæring, spesielt trening, tilpasning og evaluering av store språkmodeller (LLM-er), samt hvordan disse kan tas i bruk i ulike anvendelser.

I løpet av min forskerkarriere har jeg arbeidet med temaer som talebaserte dialogsystemer, storskala informasjonsuttrekk, personvern i data, nevrale maskinoversettelser og samhandling mellom mennesker og roboter.

Jeg er spesielt opptatt av forskningsspørsmål i skjæringspunktet mellom språkbehandling og andre fagområder – både natur- og samfunnsvitenskapelige. Jeg deltar også i flere forsknings- og utviklingsprosjekter med fokus på innovasjon, hvor vi undersøker hvordan store språkmodeller og maskinlæring kan brukes til å løse praktiske utfordringer i offentlig og privat sektor.

Bakgrunn

Jeg er opprinnelig fra Belgia og ble uteksaminert fra Universitetet i Louvain i 2006 med en grad i informatikk og ingeniørvitenskap. Med økende interesse for koblingen mellom informatikk og språkvitenskap flyttet jeg til Saarbrücken i Tyskland for å ta en mastergrad i språkvitenskap og teknologi. Jeg fullførte graden i 2008 og jobbet deretter som forsker ved det tyske forskningssenteret for kunstig intelligens (DFKI), hvor jeg deltok i flere EU-finansierte prosjekter om utvikling av dialogsystemer for samhandling mellom mennesker og roboter.

I 2011 flyttet jeg til Norge for å ta en doktorgrad i språkgruppa ved Universitetet i Oslo. I 2014 forsvarte jeg doktoravhandlingen min om sannsynlighetsbaserte metoder for dialogstyring, og jobbet deretter i to år som postdoktor i samme gruppe med dialogmodellering for statistisk maskinoversettelse.

I 2016 begynte jeg som forsker ved Norsk Regnesentral, hvor jeg jobber med ulike forsknings- og utviklingsprosjekter innen språkprosessering og maskinlæring. To av mine nyeste prosjekter er CLEANUP, som utviklet datadrevne metoder for å fjerne personopplysninger fra tekstdata, og GraphDial, som handlet om dialogstyring og bruk av kunnskapsgrafer for å representere dialogtilstanden i komplekse samtaledomener. Andre prosjekter jeg har vært involvert i inkluderer SAFERS (taleanalyse for nødetater), DialMT (dialogmodellering for maskinoversettelse), AICOM (språklig analyse av samspill mellom mennesker og store språkmodeller), Oslo Analytics, og nylig CyberRisk (cyber-trusselintelligens og risikostyring).

I tillegg til hovedstillingen som sjefsforsker ved NR har jeg også en bistilling som førsteamanuensis II ved språkgruppa ved Universitetet i Oslo, hvor jeg bidrar i flere kurs innen maskinlæring og naturlig språkprosessering. Jeg har også tidligere vært medlem av Akademiet for yngre forskere.

Prosjekter

Maskinlæring
Språkteknologi

Anonymisering av tekst (CLEANUP)

Maskinlæring
Språkteknologi
Digital sikkerhet og personvern

Delautomatisering av digital risikostyring

Maskinlæring

Hvordan forstår vi maskiner som snakker til oss?

Publikasjoner

102 publikasjoner funnet
Utgiver

A Systematic Approach to Predict the Impact of Cybersecurity Vulnerabilities Using LLMs pp. 1598 1607 , doi: https://doi.org/10.1109/Trustcom66490.2025.00186 , 2026. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Incremental Dialogue Management: Survey, Discussion, and Implications for HRI arXiv, , 2025. Vitenskapelig artikkel

Retrieving Relevant Knowledge Subgraphs for Task-Oriented Dialogue pp. 513 526 , doi: https://doi.org/https://aclanthology.org/2025.sigdial-1.42.pdf , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Re-identification of De-identified Documents with Autoregressive Infilling pp. 1192 1209 , doi: https://doi.org/10.18653/v1/2025.acl-long.60 , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Pragmatic Reasoning for Irony Detection With Large Language Models in English and Norwegian - SEMDIAL SemDial Proceedings, pp. 204 209 , (ISSN 2308-2275 ), doi: https://doi.org/https://www.semdial.org/anthology/Z25-Berg_semdial_4421.pdf , 2025. Vitenskapelig artikkel

Following Route Instructions using Large Vision-Language Models: A Comparison between Low-level and Panoramic Action Spaces pp. 449 463 , doi: https://doi.org/https://aclanthology.org/2025.icnlsp-1.43/ , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Truthful text sanitization guided by inference attacks Applied Soft Computing, vol. 185, (ISSN 1568-4946 1872-9681 ), doi: https://doi.org/10.1016/j.asoc.2025.114013 , 2025. Vitenskapelig artikkel

Digitising health history: The creation, function and implementation of the Norwegian Health Archives Registry Health Information Management Journal, vol. 55, pp. 166 172 , (ISSN 1833-3583 1833-3575 ), doi: https://doi.org/10.1177/18333583251389095 , 2025. Vitenskapelig artikkel

Open Justice Data in Europe: A Patchwork Dialogue and Discourse, (ISSN 2152-9620 ), doi: https://doi.org/10.2139/ssrn.5207840 , 2025. Vitenskapelig artikkel

Prior Lessons of Incremental Dialogue and Robot Action Management for the Age of Language Models Dialogue and Discourse, vol. 16, pp. 96 130 , (ISSN 2152-9620 ), doi: https://doi.org/10.5210/dad.2025.305 , 2025. Vitenskapelig artikkel

Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human–Robot Interaction Dialogue and Discourse, vol. 16, pp. 60 95 , (ISSN 2152-9620 ), doi: https://doi.org/10.5210/dad.2025.304 , 2025. Vitenskapelig artikkel

Nå kan KI-generert tekst vannmerkes 2024. Kronikk

Conversational Feedback in Scripted versus Spontaneous Dialogues: A Comparative Analysis pp. 440 457 , doi: https://doi.org/10.18653/v1/2024.sigdial-1.38 , 2024. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Automated de-identication of scanned patient records: Evaluation report 2024. Rapport

Utgiver Norsk Regnesentral

Evaluating the disclosure risk of anonymized documents via a machine learning-based re-identification attack Data mining and knowledge discovery, vol. 38, pp. 4040 4075 , (ISSN 1384-5810 1573-756X ), doi: https://doi.org/10.1007/s10618-024-01066-3 , 2024. Vitenskapelig artikkel

Enhancing Naturalness in LLM-Generated Utterances through Disfluency Insertion arXiv, doi: https://doi.org/10.48550/arXiv.2412.12710 , 2024. Vitenskapelig artikkel

Fire tiltak for en bedre språkpolitikk i akademia 2023. Kronikk

Er prateroboten ChatGPT en klok samtalepartner eller papegøye? 2023. Kronikk

GraphWOZ: Dialogue Management with Conversational Knowledge Graphs 2023. Vitenskapelig foredrag

Identifying Token-Level Dialectal Features in Social Media , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Constructing a Knowledge Graph from Textual Descriptions of Software Vulnerabilities in the National Vulnerability Database pp. 386 391 , , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Who's in Charge? Roles and Responsibilities of Decision-Making Components in Conversational Robots 2023. Vitenskapelig foredrag

Generation of Replacement Options in Text Sanitization pp. 292 300 , , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Alt du kan lære om statistisk modellering og maskinlæring på en dag 2023. Faglig foredrag

Pierre Lison; Samia Touileb; Chat GPT egner seg dårlig til eksamenssensuren Morgenbladet, (ISSN 0805-3847 0806-2617 ), 2023. Kronikk

Retrieval-Augmented Neural Response Generation Using Logical Reasoning and Relevance Scoring SemDial Proceedings, (ISSN 2308-2275 ), , 2023. Vitenskapelig artikkel

Pierre Lison; Venn med kunstig intelligens 2023. Intervju

Pierre Lison; Kunstig Intelligens, en fare for menneskeheten? 2023. Intervju

Helse-effektivisering - et mulig satsningsområde for NR 2023. Rapport

Utgiver Norsk Regnesentral

A Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human-Robot Interaction arXiv, , 2023. Vitenskapelig artikkel

The GDPR and Unstructured Data: Is Anonymisation Possible? International Data Privacy Law (IDPL), vol. 12, pp. 184 206 , (ISSN 2044-3994 2044-4001 ), doi: https://doi.org/10.1093/idpl/ipac008 , 2022. Vitenskapelig artikkel

Kjernekraft -er det farlig, eller er det fremtiden? 2022. Kronikk

Dis, c'est quoi l'intelligence artificielle? (ISSN 9782507057299 ), 2022. Populærvitenskapelig bok

Utgiver Renaissance Du Livre

Anonymization of sensitive information 2022. Faglig foredrag

Problemer på kontoret: Alltid jeg som må trakte kaffe 2022. Kronikk

Bootstrapping Text Anonymization Models with Distant Supervision pp. 4477 4487 , , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Dialogue Management as Graph Transformations pp. 219 227 , doi: https://doi.org/10.1007/978-981-19-5538-9_15 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Automatic Evaluation of Disclosure Risks of Text Anonymization Methods pp. 157 171 , doi: https://doi.org/10.1007/978-3-031-13945-1_12 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

The text anonymization benchmark (TAB): A dedicated corpus and evaluation framework for text anonymization Computational Linguistics, vol. 48, pp. 1053 1101 , (ISSN 0891-2017 1530-9312 ), doi: https://doi.org/10.1162/coli_a_00458 , 2022. Vitenskapelig artikkel

Hvilket fremmedspråk bør man lære seg i Google-oversettelsenes tidsalder? 2022. Kronikk

Neural Text Sanitization with Explicit Measures of Privacy Risk pp. 217 229 , , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Hva er universell utforming? 2022. Programdeltagelse

Towards an AI-driven talking avatar in virtual reality for investigative interviews of children pp. 9 15 , doi: https://doi.org/10.1145/3534085.3534340 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Språkteknologi: siste trender og vanlige fallgruver 2021. Faglig foredrag

Predicting insurance fraud with the help of a sentiment analysis model 2021. Rapport

Utgiver Norsk Regnesentral

Anonymisation Models for Text Data: State of the art, Challenges and Future Directions pp. 4188 4203 , doi: https://doi.org/10.18653/v1/2021.acl-long.323 , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

skweak: Weak Supervision Made Easy for NLP pp. 337 346 , doi: https://doi.org/10.18653/v1/2021.acl-demo.40 , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Anonymisation Models for Text Data: State of the art, Challenges and Future Directions 2021. Vitenskapelig foredrag

skweak: weak supervision made easy for NLP 2021. Poster

Assessing the Quality of Human-Generated Summaries with Weakly Supervised Learning pp. 112 123 , , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Dinesh Lala; Pierre Lison; Proceedings of the 1st RobotDial Workshop on Dialogue Models for Human-Robot Interaction , 2021. Rapport

Utgiver RobotDial workshop

Skweak: Weak Supervision Made Easy for NLP 2021. Vitenskapelig foredrag

Fremdrift i forskningsprosjekter 2021. Faglig foredrag

Forvirrende pandemistatistikk: Hva skal vi med logaritmer i grafer? , 2021. Kronikk

Nicholas Thomas Walker; Torbjørn Dahl; Pierre Lison; Dialogue Management as Graph Transformations 2021. Vitenskapelig foredrag

Welcome to Norway! , 2021. Kronikk

Vi må snakke om Bitcoin , 2021. Kronikk

Developing NLP models without labelled data using weak supervision 2020. Faglig foredrag

Pierre Lison; Jeremy Barnes; Aliaksandr Hubin; Samia Touileb; Named Entity Recognition without Labelled Data: A Weak Supervision Approach (ISSN 978-1-950737-48-2 ), 2020. Vitenskapelig antologi/Konferanseserie

Utgiver Association for Computational Linguistics

Named Entity Recognition without Labelled Data: A Weak Supervision Approach pp. 1518 1533 , , 2020. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Episode 5: Hva er språkteknologi (eller NLP)? Med Pierre Lison 2020. Programdeltagelse

Episode 6: Kan språkteknologi virkelig forstå språk? Med Ingrid Lossius Falkum og Pierre Lison 2020. Programdeltagelse

Kan kunstig intelligens "forstå" språk? Aftenposten (morgenutg. : trykt utg.), (ISSN 0804-3116 0807-2027 ), , 2020. Populærvitenskapelig artikkel

Named Entity Recognition without Labelled Data: A Weak Supervision Approach 2020. Vitenskapelig foredrag

For enkelt om kunstig intelligens: – Diskriminerende og fordomsfull AI er ikke alltid lett å løse Forskning.no, (ISSN 1891-635X 1891-6341 ), , 2020. Leserinnlegg

Ethical and social impacts of AI 2020. Faglig foredrag

Hva skjedde med «Don’t be evil»? , 2020. Kronikk

Modellering av omdømme i cybersikkerhet med nevralske nettverk 2019. Faglig foredrag

PyOpenDial: A Python-based Domain-Independent Toolkit for Developing Spoken Dialogue Systems with Probabilistic Rules pp. 187 192 , doi: https://doi.org/10.18653/v1/D19-3032 , 2019. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Modélisation du dialogue: contrôle du dialogue et corpus multilingues 2019. Vitenskapelig foredrag

Dialogue Modelling: Small data, Big data 2019. Vitenskapelig foredrag

Data-driven models of reputation for cybersecurity 2019. Vitenskapelig foredrag

Open challenges in anonymisation 2019. Faglig foredrag

Tekstmining: En kort innføring , 2018. Faglig foredrag

OpenSubtitles 2018: Statistical rescoring of sentence alignments in large, noisy parallel corpora pp. 1742 1748 , , 2018. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Detecting Machine-translated Documents in Large Parallel Corpora pp. 25 32 , , 2018. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Modélisation du dialogue : systèmes de dialogue parlé et corpus multilingues , 2018. Vitenskapelig foredrag

Detecting Machine-translated Subtitles in Large Parallel Corpora 2018. Vitenskapelig foredrag

Neural models for predicting the reputation of end-point hosts 2018. Vitenskapelig foredrag

Data-driven models of reputation in cyber-security , 2018. Vitenskapelig foredrag

OpenSubtitles 2018: Statistical Rescoring of Sentence Alignments in Large, Noisy Parallel Corpora , 2018. Vitenskapelig foredrag

SAFERS: Talegjenkjenning og maskinlæring for nødmeldetjenester , 2018. Faglig foredrag

Anonymisering av rettsavgjørelser 2018. Rapport

Utgiver Norsk Regnesentral

SAFERS - Speech Analytics for Emergency Response Services. Kan taleteknologi og maskinlæring brukes for å effektivisere nødmeldetjenester? 2017. Faglig foredrag

Incremental Processing for Neural Conversational Models , 2017. Poster

Incremental Processing for Neural Conversational Models SemDial Proceedings, pp. 162 163 , (ISSN 2308-2275 ), , 2017. Vitenskapelig artikkel

Automatic Detection of Malware-Generated Domains with Recurrent Neural Models Norsk Informasjonssikkerhetskonferanse (NISK), (ISSN 1893-6563 1894-7735 ), , 2017. Vitenskapelig artikkel

Opptreden i God Morgen Norge (TV2) for å vise Lenny roboten som ble brukt ved Forskningstorget. 2017. Programdeltagelse

Redefining Context Windows for Word Embedding Models: An Experimental Study pp. 284 288 , , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Not All Dialogues are Created Equal: Instance Weighting for Neural Conversational Models pp. 384 394 , doi: https://doi.org/10.18653/v1/w17-5546 , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Neural Reputation Models learned from Passive DNS data pp. 3662 3671 , doi: https://doi.org/10.1109/BigData.2017.8258361 , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Not all dialogues are created equal: instance weighting for neural conversational models , 2017. Vitenskapelig foredrag

Automatic Detection of Malware-Generated Domains with Recurrent Neural Models , 2017. Vitenskapelig foredrag

Neural Reputation Models learned from Passive DNS Data 2017. Vitenskapelig foredrag

Automatic Turn Segmentation for Movie and TV Subtitles , 2016. Poster

OpenDial: A Toolkit for Developing Spoken Dialogue Systems with Probabilistic Rules 2016. Poster

Automatic Turn Segmentation of Movie and TV Subtitles pp. 245 252 , doi: https://doi.org/10.1109/SLT.2016.7846272 , 2016. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Automatic Turn Segmentation for Movie and TV Subtitles , 2016. Vitenskapelig foredrag

Dialogue modelling: small data and large data , 2016. Vitenskapelig foredrag