Passer au contenu

/ Research

Je donne

Rechercher

Natural Sciences and Engineering

Philippe Langlais

Traitement automatique des langues naturelles

Professeur titulaire

Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle

André-Aisenstadt, room 2233

514 343-6111 #47494

philippe.langlais@umontreal.ca

Secondary number: 514 343-2496 (Télécopieur)
Secondary email: felipe@iro.umontreal.ca (Travail)

Profile

Research expertise

Natural language processing (NLP) is a field of computer science, artificial intelligence, and linguistics concerned with the interactions between computers and human (natural) languages. Challenges in NLP are numerous and enrol various components from morphological analyzers to semantic parsers.

The core of my scientific activity consists in studying data-driven methods, notably but not only machine learning, in order to model linguistic knowledge as well as to develop NLP applications. The latest applications I have been working on are automatic and machine-aided translation, and unsupervised morphology acquisition.

Biography

Philippe is full professor within the computer science department (DIRO) at University of Montreal (UdeM) in the area of computational linguistics. He obtained his PhD from University of Avignon in 1995, working on speech recognition at LIA, after having worked for three years in the speech technology group at IDIAP, (institut Dalle Mole d'Intelligence Artificielle et Perceptive) in Switzerland. Between 1995 and 1997, Philippe served as a lecturer and researcher at University of Avignon. The following year, he was invited researcher in CTT, a unit within the Department of Speech, Music, and Hearing (TMH) of the the Royal Institute of Technology (KTH), in Stockholm. Philippe Joined the RALI in 1998, where he works on statistical machine translation. During 2007, he took a sabbatical year for visiting ENSTLIMSI, and IRIT

Teaching and supervision

Student supervision

Theses and dissertation supervision (Papyrus Institutional Repository)

2024

Evaluating approaches to solving proportional sentence analogies

Graduate : Blain-Montesano, Yves
Cycle : Master's
Grade : M. Sc.
2024

Sur la génération d'exemples pour réduire le coût d'annotation

Graduate : Piedboeuf, Frédéric
Cycle : Doctoral
Grade : Ph. D.
2023

Méthodes d'évaluation en extraction d'information ouverte

Graduate : Lamarche, Fabrice
Cycle : Master's
Grade : M. Sc.
2023

Vers la mitigation des biais en traitement neuronal des langues

Graduate : Le Berre, Guillaume
Cycle : Doctoral
Grade : Ph. D.
2023

Automatic taxonomy evaluation

Graduate : Gao, Tianjian
Cycle : Master's
Grade : M. Sc.
2022

Job dissatisfaction detection through progress note

Graduate : Wu, Jiechen
Cycle : Master's
Grade : M. Sc.
2022

Utilisation du plongement du domaine pour l’adaptation non supervisée en traduction automatique

Graduate : Frenette, Xavier
Cycle : Master's
Grade : M. Sc.
2021

Étude de modèles neuronaux de questions-réponses

Graduate : Archambault, Jean
Cycle : Master's
Grade : M. Sc.
2021

Méthodologies pour la détection de diachronies sémantiques et leurs impacts

Graduate : Kletz, David
Cycle : Master's
Grade : M. Sc.
2021

Alzheimer prediction from connected speech extracts : assessment of generalisation to new data

Graduate : Chafouleas, Geneviève
Cycle : Master's
Grade : M. Sc.
2020

Leveraging distant supervision for improved named entity recognition

Graduate : Ghaddar, Abbas
Cycle : Doctoral
Grade : Ph. D.
2020

Un système de question-réponse simple appliqué à SQuAD

Graduate : Elbaz, Ilan
Cycle : Master's
Grade : M. Sc.
2020

Personal information prediction from written texts

Graduate : Bibi, Khalil
Cycle : Master's
Grade : M. Sc.
2020

Open source quality control tool for translation memory using artificial intelligence

Graduate : Bhardwaj, Shivendra
Cycle : Master's
Grade : M. Sc.
2019

Protocoles d'évaluation pour l'extraction d'information libre

Graduate : Léchelle, William
Cycle : Doctoral
Grade : Ph. D.
2019

Personality extraction through LinkedIn

Graduate : Piedboeuf, Frédéric
Cycle : Master's
Grade : M. Sc.
2019

Empirical study and multi-task learning exploration for neural sequence labeling models

Graduate : Lu, Peng
Cycle : Master's
Grade : M. Sc.
2019

Apprendre à résoudre des analogies de forme

Graduate : Rhouma, Rafik
Cycle : Doctoral
Grade : Ph. D.
2018

Predictive models for career progression

Graduate : Soliman, Zakaria
Cycle : Master's
Grade : M. Sc.
2018

Induction de lexiques bilingues à partir de corpus comparables et parallèles

Graduate : Jakubina, Laurent
Cycle : Doctoral
Grade : Ph. D.
2017

Visualisation de données dans le domaine de l’E-recrutement

Graduate : Outerqiss, Abdessamad
Cycle : Master's
Grade : M. Sc.
2017

Coreference resolution with and for Wikipedia

Graduate : Ghaddar, Abbas
Cycle : Master's
Grade : M. Sc.
2016

Amélioration a posteriori de la traduction automatique par métaheuristique

Graduate : Lavoie-Courchesne, Sébastien
Cycle : Master's
Grade : M. Sc.
2014

Projection multilingue d'annotations pour dialogues avancés

Graduate : Julien, Simon
Cycle : Master's
Grade : M. Sc.
2014

Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet

Graduate : Léchelle, William
Cycle : Master's
Grade : M. Sc.
2014

Détection de tableaux dans des documents : une étude de TableBank

Graduate : Yockell, Eugénie
Cycle : Master's
Grade : M. Sc.
2014

Alignement de phrases parallèles dans des corpus bruités

Graduate : Lamraoui, Fethi
Cycle : Master's
Grade : M. Sc.
2012

L’extraction de phrases en relation de traduction dans Wikipédia

Graduate : Rebout, Lise
Cycle : Master's
Grade : M. Sc. A.
2012

L'atténuation statistique des surdétections d'un correcteur grammatical symbolique

Graduate : Gotti, Fabrizio
Cycle : Master's
Grade : M. Sc.
2011

Formulation interactive des requêtes pour l’analyse et la compréhension du code source

Graduate : Jridi, Jamel Eddine
Cycle : Master's
Grade : M. Sc.
2010

Moranapho : apprentissage non supervisé de la morphologie d'une langue par généralisation de relations analogiques

Graduate : Lavallée, Jean-François
Cycle : Master's
Grade : M. Sc. A.
2010

Traduction statistique par recherche locale

Graduate : Monty, Pierre Paul
Cycle : Master's
Grade : M. Sc.
2010

Intégration du contexte en traduction statistique à l’aide d’un perceptron à plusieurs couches

Graduate : Patry, Alexandre
Cycle : Doctoral
Grade : Ph. D.
2006

Mood : un cadre d'applications pour le développement de décodeurs en traduction statistique

Graduate : Patry, Alexandre
Cycle : Master's
Grade : M. Sc.
2005

Projection d'un analyseur grammatical via alignement bilingue de mots

Graduate : Khairallah, Ziad
Cycle : Master's
Grade : M. Sc.
2005

Étude de la traduction automatique des bulletins météorologiques

Graduate : Leplus, Thomas
Cycle : Master's
Grade : M. Sc.
2004

Modèles de langue en recherche d'information

Graduate : Alvarez, Carmen
Cycle : Master's
Grade : M. Sc.
2004

Adaptation de modèles de traduction dans le cadre du projet TransType

Graduate : Nepveu, Laurent
Cycle : Master's
Grade : M. Sc.
2003

Comparaison de deux techniques de décodage pour la traduction probabiliste

Graduate : Awdé, Ali
Cycle : Master's
Grade : M. Sc.
2003

Désambiguïsation de corpus monolingues par des approches de type Lesk

Graduate : Vasilescu, Florentina
Cycle : Master's
Grade : M. Sc.
2003

Quelques modèles de langage statistiques et graphiques lissés avec WordNet

Graduate : Jauvin, Christian
Cycle : Master's
Grade : M. Sc.
2003

Étude de transformations grammaticales pour l'entraînement de grammaires probabilistes hors-contexte

Graduate : Nguyen, Ngoc Tran
Cycle : Master's
Grade : M. Sc.

Projects

Research projects

2024 - 2032

Revue3.0 : Écrire, Transmettre, Découvrir

Funding sources: CRSH/Conseil de recherches en sciences humaines du Canada
Grant programs: PV128152-Subvention de partenariat
2023 - 2029

BUMP: Better Understanding of Model’s Performance for more efficient Natural Language Processing

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVX20965-(RGP) Programme de subvention à la découverte individuelle ou de groupe
2022 - 2029

Union Neurosciences et Intelligence Artificielle Québec (UNIQUE)

Lead researcher : Karim Jerbi
Funding sources: FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT)
Grant programs: PVXXXXXX-(RS) Programme de regroupements stratégiques
2024 - 2028

Centre de recherche interuniversitaire sur les humanités numériques (CRIHN)

Lead researcher : Michael Eberle Sinatra
Funding sources: FRQSC/Fonds de recherche du Québec - Société et culture (FQRSC)
Grant programs: PV129894-(RG) Programme Regroupements stratégiques
2024 - 2027

Mesurer l'aptitude lexicale des grands modèles de langues génératifs

Lead researcher : Antoine Venant
Co-researchers : Philippe Langlais , François Lareau
Funding sources: CRSH/Conseil de recherches en sciences humaines du Canada
Grant programs: PV153480-Subventions de développement Savoir
2022 - 2026

Computing servers for NLP applications

Lead researcher : Jian-Yun Nie
Co-researchers : Philippe Langlais , Bang Liu
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVXXXXXX-(OIR) Outils et d'instruments de recherche (de 7 001 $ à 150 000 $)
2018 - 2026

Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)

Lead researcher : Karim Benyekhlef
Funding sources: CRSH/Conseil de recherches en sciences humaines du Canada , Société québécoise d'information juridique (SOQUIJ)
Grant programs: PV128152-Subvention de partenariat , PV128152-Subvention de partenariat
2019 - 2025

Les lexiques nucléaires

Lead researcher : Patrick Drouin , François Lareau
Funding sources: FRQSC/Fonds de recherche du Québec - Société et culture (FQRSC)
Grant programs: PVXXXXXX-(SE) Programme Soutien aux équipes de recherche - Stade de développement : Renouvellement
2019 - 2025

NÉONUM : infrastructure de veille pour la néologie en français québécois

Lead researcher : Patrick Drouin
Co-researchers : Philippe Langlais , François Lareau
Funding sources: CRSH/Conseil de recherches en sciences humaines du Canada
Grant programs: PV153480-Subventions de développement Savoir
2018 - 2025

Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)

Lead researcher : Karim Benyekhlef
2019 - 2024

Union Neurosciences et Intelligence Artificielle Québec (UNIQUE) / Regroupements stratégiques

Lead researcher : Karim Jerbi
Funding sources: FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT)
Grant programs: PVXXXXXX-(RS) Programme de regroupements stratégiques
2017 - 2024

DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVX20965-(RGP) Programme de subvention à la découverte individuelle ou de groupe
2023

Entraînement d’un agent conversationnel en assurance (ancienne demande Bastin)

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2021 - 2023

Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2021 - 2022

Acquisition of an aviation safety taxonomy from incident reports and its evaluation

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2021 - 2022

Assistance tools to build taxonomy of skills and to search for experts

Lead researcher : Jian-Yun Nie
Co-researchers : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2021 - 2022

ESG Events Clustering using Natural Language Processing

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2021 - 2022

Scene Graph Image Interpretation Tools

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2020 - 2021

Supplément COVID-19 CRSNG_DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVXXXXXX-Supplément à l’appui des étudiants, des stagiaires postdoctoraux et du personnel de soutien à la recherche COVID-19
2020 - 2021

Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues – Phase 1

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2020 - 2021

Financement postdoctoral entrepreneur IVADO a Selçuk Güven

Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Bourse
2020 - 2021

Natural Language Processing for Automated Classification and Analysis of Aviation Safety Reports

Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2019 - 2020

Outils de diagnostic et de prévention de l’insatisfaction des employés

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2018 - 2020

Knowledge-based inference for question answering and information retrieval

Lead researcher : Jian-Yun Nie
Co-researchers : Philippe Langlais , Alain Tapp
Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Projet de recherche
2019

Extraction automatique d'informations structurées depuis les pièces jointes de courriels échangés sur la plateforme TIGER_Engagement partenarial Plus

Lead researcher : Philippe Langlais
Funding sources: Intact Corporation financière , CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: , PVXXXXXX-(EGP2) Programme de subvention d'engagement partenarial Plus
2019

Sélection d’un ensemble d’amorçage pour l’apprentissage actif appliqué à la prédiction structurée

Lead researcher : Philippe Langlais
Funding sources: MITACS Inc.
Grant programs: PVXXXXXX-Stage Accélération Québec - MITACS
2018 - 2019

Normalisation des rapports de maintenance traités par Orora

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PV128974-(EGP) Programme de subvention d'engagement partenarial
2014 - 2019

TRAINING IN BIG TEXT DATA (TRIBE)

Lead researcher : Stan Matwin
Co-researchers : Guy Lapalme , Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PV118026-FONCER : Prog. formation orientée nouveauté, la collaboration et l'expérience en recherche
2018

Extraction automatique d'informations structurées depuis les courriels échangés sur la plateforme TIGER

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PV128974-(EGP) Programme de subvention d'engagement partenarial
2018

Apogée Canada fonds d'excellence en recherche // Programme de démarrage de projets de recherche collaborative IROSOFT INC.

Lead researcher : Philippe Langlais
Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Projet recherche collaborative
2014 - 2018

BUTTERFLY PREDICTIVE PROJECT: MEGADONNEES ET RESEAUX SOCIAUX POUR L'E-RECRUTEMENT

Lead researcher : Guy Lapalme
Co-researchers : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) , Little Big Job Inc.
Grant programs: PVX20973-(RDC-CRD) Partenariat de recherche / Subvention de recherche et développement coopérative ,
2014 - 2018

RESEARCH ON DOMAIN SPECIFIC KNOWLEDGE EXTRACTION FROM UNSTRUCTURED TEXT WITH OR WITHOUT SEMANTIC DATABASES

Lead researcher : Philippe Langlais
Funding sources: Nuance Foundation
Grant programs:
2012 - 2018

ANALOGICAL LEARNING FOR NATURAL LANGUAGE PROCESSING

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVX20965-(RGP) Programme de subvention à la découverte individuelle ou de groupe
2012 - 2016

PORTION APPAREILLAGE-FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA

Lead researcher : Philippe Langlais
Funding sources: FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT)
Grant programs: PV113724-(PR) Projets de recherche en équipe (et possibilité d'équipement la première année)
2012 - 2016

FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA

Lead researcher : Philippe Langlais
Co-researchers : Guy Lapalme , Patrick Drouin , Michel Gagnon
Funding sources: FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT)
Grant programs: PV113724-(PR) Projets de recherche en équipe (et possibilité d'équipement la première année)
2012 - 2013

ADAPTATION D'UN SYSTEME DE TRADUCTION STATISTIQUE EN PRODUCTION A LA TRADUCTION DE TWEETS

Lead researcher : Philippe Langlais
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PV128974-(EGP) Programme de subvention d'engagement partenarial
2011

RECHERCHE INTERACTIVE DE DOCUMENTS JURIDIQUES

Lead researcher : Philippe Langlais
2009

A SERVER FOR NLP APPLICATIONS AT RALI

Lead researcher : Philippe Langlais

Outreach

Publications and presentations

Publications

Disciplines

  • Computer Science

Areas of expertise

  • Sequence alignment
  • Statistical learning
  • Analogy-based learning
  • Computer-assisted translation
  • Natural-language processing (NLP)