Philippe Langlais
Traitement automatique des langues naturelles
- Professeur titulaire
-
Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
André-Aisenstadt, room 2233
Profile
Research expertise
Natural language processing (NLP) is a field of computer science, artificial intelligence, and linguistics concerned with the interactions between computers and human (natural) languages. Challenges in NLP are numerous and enrol various components from morphological analyzers to semantic parsers.
The core of my scientific activity consists in studying data-driven methods, notably but not only machine learning, in order to model linguistic knowledge as well as to develop NLP applications. The latest applications I have been working on are automatic and machine-aided translation, and unsupervised morphology acquisition.Biography
Philippe is full professor within the computer science department (DIRO) at University of Montreal (UdeM) in the area of computational linguistics. He obtained his PhD from University of Avignon in 1995, working on speech recognition at LIA, after having worked for three years in the speech technology group at IDIAP, (institut Dalle Mole d'Intelligence Artificielle et Perceptive) in Switzerland. Between 1995 and 1997, Philippe served as a lecturer and researcher at University of Avignon. The following year, he was invited researcher in CTT, a unit within the Department of Speech, Music, and Hearing (TMH) of the the Royal Institute of Technology (KTH), in Stockholm. Philippe Joined the RALI in 1998, where he works on statistical machine translation. During 2007, he took a sabbatical year for visiting ENST, LIMSI, and IRIT
For more information…
Affiliations and responsabilities
Research affiliations
Teaching and supervision
Teaching
Courses taught (current session only)
- IFT-2550 – Stage d'informatique 1
- IFT-3225 – Technologie de l'Internet
- IFT-6285 – Traitement automatique des langues naturelles
Programs
- 117510 – Baccalauréat en informatique
- 117520 – Majeure en informatique
- 119110 – Baccalauréat en mathématiques et informatique
- 119110 – Baccalauréat en mathématiques et informatique
- 120510 – Baccalauréat en physique et informatique
- 120510 – Baccalauréat en physique et informatique
- 146811 – Baccalauréat en bio-informatique
- 146811 – Baccalauréat en bio-informatique
- 217510 – Maîtrise en informatique
- 217512 – DESS en apprentissage automatique
- 218010 – Maîtrise en linguistique
- 246810 – Maîtrise en bio-informatique
- 248510 – Maîtrise en sciences cliniques
Student supervision
Theses and dissertation supervision (Papyrus Institutional Repository)
Evaluating approaches to solving proportional sentence analogies
Cycle : Master's
Grade : M. Sc.
Traitement automatique du langage naturel pour les textes juridiques : prédiction de verdict et exploitation de connaissances du domaine
Cycle : Doctoral
Grade : Ph. D.
Sur la génération d'exemples pour réduire le coût d'annotation
Cycle : Doctoral
Grade : Ph. D.
Génération de données synthétiques pour l'adaptation hors-domaine non-supervisée en réponse aux questions : méthodes basées sur des règles contre réseaux de neurones
Cycle : Master's
Grade : M. Sc.
Méthodes d'évaluation en extraction d'information ouverte
Cycle : Master's
Grade : M. Sc.
Vers la mitigation des biais en traitement neuronal des langues
Cycle : Doctoral
Grade : Ph. D.
Regroupement de textes avec des approches simples et efficaces exploitant la représentation vectorielle contextuelle SBERT
Cycle : Master's
Grade : M. Sc.
Créer un corpus annoté en entités nommées avec Wikipédia et WikiData : de mauvais résultats et du potentiel
Cycle : Master's
Grade : M. Sc.
Job dissatisfaction detection through progress note
Cycle : Master's
Grade : M. Sc.
Utilisation du plongement du domaine pour l’adaptation non supervisée en traduction automatique
Cycle : Master's
Grade : M. Sc.
Étude de modèles neuronaux de questions-réponses
Cycle : Master's
Grade : M. Sc.
Méthodologies pour la détection de diachronies sémantiques et leurs impacts
Cycle : Master's
Grade : M. Sc.
Alzheimer prediction from connected speech extracts : assessment of generalisation to new data
Cycle : Master's
Grade : M. Sc.
Leveraging distant supervision for improved named entity recognition
Cycle : Doctoral
Grade : Ph. D.
Prediction of Alzheimer's disease and semantic dementia from scene description: toward better language and topic generalization
Cycle : Master's
Grade : M. Sc.
Un système de question-réponse simple appliqué à SQuAD
Cycle : Master's
Grade : M. Sc.
Personal information prediction from written texts
Cycle : Master's
Grade : M. Sc.
Open source quality control tool for translation memory using artificial intelligence
Cycle : Master's
Grade : M. Sc.
Comparaison de systèmes de traduction automatique pour la post édition des alertes météorologique d'Environnement Canada
Cycle : Master's
Grade : M. Sc.
Protocoles d'évaluation pour l'extraction d'information libre
Cycle : Doctoral
Grade : Ph. D.
Personality extraction through LinkedIn
Cycle : Master's
Grade : M. Sc.
Empirical study and multi-task learning exploration for neural sequence labeling models
Cycle : Master's
Grade : M. Sc.
Apprendre à résoudre des analogies de forme
Cycle : Doctoral
Grade : Ph. D.
Predictive models for career progression
Cycle : Master's
Grade : M. Sc.
Induction de lexiques bilingues à partir de corpus comparables et parallèles
Cycle : Doctoral
Grade : Ph. D.
Extraction de phrases parallèles à partir d’un corpus comparable avec des réseaux de neurones récurrents bidirectionnels
Cycle : Master's
Grade : M. Sc.
WikiGames : une plateforme de jeux dédiée à la validation d’une base de connaissances produite à partir de techniques d’extraction d’information ouverte
Cycle : Master's
Grade : M. Sc.
Visualisation de données dans le domaine de l’E-recrutement
Cycle : Master's
Grade : M. Sc.
Coreference resolution with and for Wikipedia
Cycle : Master's
Grade : M. Sc.
Amélioration a posteriori de la traduction automatique par métaheuristique
Cycle : Master's
Grade : M. Sc.
Projection multilingue d'annotations pour dialogues avancés
Cycle : Master's
Grade : M. Sc.
Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet
Cycle : Master's
Grade : M. Sc.
Détection de tableaux dans des documents : une étude de TableBank
Cycle : Master's
Grade : M. Sc.
Alignement de phrases parallèles dans des corpus bruités
Cycle : Master's
Grade : M. Sc.
Traduction statistique vers une langue à morphologie riche : combinaison d’algorithmes de segmentation morphologique et de modèles statistiques de traduction automatique
Cycle : Master's
Grade : M. Sc.
L’extraction de phrases en relation de traduction dans Wikipédia
Cycle : Master's
Grade : M. Sc. A.
L'atténuation statistique des surdétections d'un correcteur grammatical symbolique
Cycle : Master's
Grade : M. Sc.
Étude empirique des commentaires et application des techniques de résumé par extraction pour la redocumentation
Cycle : Master's
Grade : M. Sc.
Formulation interactive des requêtes pour l’analyse et la compréhension du code source
Cycle : Master's
Grade : M. Sc.
Déploiement automatique d’une application de routage téléphonique d’une langue source vers une langue cible
Cycle : Master's
Grade : M. Sc.
Moranapho : apprentissage non supervisé de la morphologie d'une langue par généralisation de relations analogiques
Cycle : Master's
Grade : M. Sc. A.
Traduction statistique par recherche locale
Cycle : Master's
Grade : M. Sc.
Intégration du contexte en traduction statistique à l’aide d’un perceptron à plusieurs couches
Cycle : Doctoral
Grade : Ph. D.
Mood : un cadre d'applications pour le développement de décodeurs en traduction statistique
Cycle : Master's
Grade : M. Sc.
Projection d'un analyseur grammatical via alignement bilingue de mots
Cycle : Master's
Grade : M. Sc.
Étude de la traduction automatique des bulletins météorologiques
Cycle : Master's
Grade : M. Sc.
Modèles de langue en recherche d'information
Cycle : Master's
Grade : M. Sc.
Adaptation de modèles de traduction dans le cadre du projet TransType
Cycle : Master's
Grade : M. Sc.
Comparaison de deux techniques de décodage pour la traduction probabiliste
Cycle : Master's
Grade : M. Sc.
Désambiguïsation de corpus monolingues par des approches de type Lesk
Cycle : Master's
Grade : M. Sc.
Quelques modèles de langage statistiques et graphiques lissés avec WordNet
Cycle : Master's
Grade : M. Sc.
Étude de transformations grammaticales pour l'entraînement de grammaires probabilistes hors-contexte
Cycle : Master's
Grade : M. Sc.
Projects
Research projects
Revue3.0 : Écrire, Transmettre, Découvrir
BUMP: Better Understanding of Model’s Performance for more efficient Natural Language Processing
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE)
Centre de recherche interuniversitaire sur les humanités numériques (CRIHN)
Mesurer l'aptitude lexicale des grands modèles de langues génératifs
Computing servers for NLP applications
Les lexiques nucléaires
NÉONUM : infrastructure de veille pour la néologie en français québécois
Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)
Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE) / Regroupements stratégiques
DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base
Entraînement d’un agent conversationnel en assurance (ancienne demande Bastin)
Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues
Acquisition of an aviation safety taxonomy from incident reports and its evaluation
Assistance tools to build taxonomy of skills and to search for experts
ESG Events Clustering using Natural Language Processing
Scene Graph Image Interpretation Tools
Supplément COVID-19 CRSNG_DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base
Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues – Phase 1
Financement postdoctoral entrepreneur IVADO a Selçuk Güven
Natural Language Processing for Automated Classification and Analysis of Aviation Safety Reports
Outils de diagnostic et de prévention de l’insatisfaction des employés
Knowledge-based inference for question answering and information retrieval
Extraction automatique d'informations structurées depuis les pièces jointes de courriels échangés sur la plateforme TIGER_Engagement partenarial Plus
Sélection d’un ensemble d’amorçage pour l’apprentissage actif appliqué à la prédiction structurée
Normalisation des rapports de maintenance traités par Orora
TRAINING IN BIG TEXT DATA (TRIBE)
Extraction automatique d'informations structurées depuis les courriels échangés sur la plateforme TIGER
Apogée Canada fonds d'excellence en recherche // Programme de démarrage de projets de recherche collaborative IROSOFT INC.
BUTTERFLY PREDICTIVE PROJECT: MEGADONNEES ET RESEAUX SOCIAUX POUR L'E-RECRUTEMENT
RESEARCH ON DOMAIN SPECIFIC KNOWLEDGE EXTRACTION FROM UNSTRUCTURED TEXT WITH OR WITHOUT SEMANTIC DATABASES
ANALOGICAL LEARNING FOR NATURAL LANGUAGE PROCESSING
PORTION APPAREILLAGE-FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA
FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA
ADAPTATION D'UN SYSTEME DE TRADUCTION STATISTIQUE EN PRODUCTION A LA TRADUCTION DE TWEETS
RECHERCHE INTERACTIVE DE DOCUMENTS JURIDIQUES
A SERVER FOR NLP APPLICATIONS AT RALI
Outreach
Publications and presentations
Publications
- Les publications de Philippe Langlais sont disponibles ici : http://www.iro.umontreal.ca/~felipe/new-home/frontal.php?page=../bib2webV0.81/cv_year.html
Disciplines
- Computer Science
Areas of expertise
- Sequence alignment
- Statistical learning
- Analogy-based learning
- Computer-assisted translation
- Natural-language processing (NLP)