Philippe Langlais
Traitement automatique des langues naturelles
- Professeur titulaire
-
Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
André-Aisenstadt, local 2233
Portrait
Expertise de recherche
Le traitement automatique des langues naturelles (TALN) est le domaine scientifique dédié au développement de méthodes automatiques permettant de manipuler des énoncés en langage humain ("naturels") dans le double but de construire des applications concrètes et de mieux modéliser ces énoncés.
Mes travaux en TALN couvrent une large gamme de niveaux de traitements, depuis l'analyse morphologique, jusqu'aux niveaux syntaxiques et sémantiques, et portent sur des applications variées comme les outils d'aide à la traduction (incluant la traduction automatique), ou l'extraction d'information. Le dénominateur commun de mes activités est le recours à des techniques, notamment statistiques, qui permettent d'extraire de connaissances linguistiques à partir de corpus et/ou de lexiques. Leur visée principale est le développement de méthodes permettant de combiner efficacement des connaissances linguistiques et des informations extraites de corpus annotés ou de lexiques.
Champs d'expertise
- Traitement automatique des langues naturelles
- Traduction automatique
- Apprentissage statistique et analogique
- Alignement de séquences
- Outils d'aide à la traduction
Biographie
Philippe est professeur titulaire au département d'informatique (DIRO) de l'université de Montréal (UdeM) où il s'intéresse au traitement des langues. Il a obtenu son doctorat à l'université d'Avignon en 1995, au LIA, dans le domaine de la reconnaissance de la parole. Il a auparavent travaillé trois années dans l'équipe parole de l'IDIAP, (l'Institut Dalle Mole d'Intelligence Artificielle et Perceptive) en Suisse. Entre 1995 et 1997, Philippe a été ATER à l'université d'Avignon. L'année suivante, il réalisait un stage postdoctoral au CTT, une unité du groupe Parole, Musique et Perception (TMH) de la haute école royale en technologie (KTH) de Stockholm. Philippe a rejoint le RALI en 1998, où il travaille en autre sur la traduction automatique. En 2007, il a profité d'une année sabbatique pour visiter l'ENST, le LIMSI, et l'IRIT
Pour en savoir plus…
Affiliations et responsabilités
Affiliations de recherche
Enseignement et encadrement
Enseignement
Cours siglés (session en cours uniquement)
- IFT-2550 – Stage d'informatique 1
- IFT-3225 – Technologie de l'Internet
- IFT-6285 – Traitement automatique des langues naturelles
Programmes
- 117510 – Baccalauréat en informatique
- 117520 – Majeure en informatique
- 119110 – Baccalauréat en mathématiques et informatique
- 119110 – Baccalauréat en mathématiques et informatique
- 120510 – Baccalauréat en physique et informatique
- 120510 – Baccalauréat en physique et informatique
- 146811 – Baccalauréat en bio-informatique
- 146811 – Baccalauréat en bio-informatique
- 217510 – Maîtrise en informatique
- 217512 – DESS en apprentissage automatique
- 218010 – Maîtrise en linguistique
- 246810 – Maîtrise en bio-informatique
- 248510 – Maîtrise en sciences cliniques
Encadrement
Thèses et mémoires dirigés (dépôt institutionnel Papyrus)
Evaluating approaches to solving proportional sentence analogies
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Traitement automatique du langage naturel pour les textes juridiques : prédiction de verdict et exploitation de connaissances du domaine
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Sur la génération d'exemples pour réduire le coût d'annotation
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Génération de données synthétiques pour l'adaptation hors-domaine non-supervisée en réponse aux questions : méthodes basées sur des règles contre réseaux de neurones
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Méthodes d'évaluation en extraction d'information ouverte
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Vers la mitigation des biais en traitement neuronal des langues
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Regroupement de textes avec des approches simples et efficaces exploitant la représentation vectorielle contextuelle SBERT
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Automatic taxonomy evaluation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Créer un corpus annoté en entités nommées avec Wikipédia et WikiData : de mauvais résultats et du potentiel
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Job dissatisfaction detection through progress note
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Utilisation du plongement du domaine pour l’adaptation non supervisée en traduction automatique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Étude de modèles neuronaux de questions-réponses
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Méthodologies pour la détection de diachronies sémantiques et leurs impacts
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Alzheimer prediction from connected speech extracts : assessment of generalisation to new data
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Leveraging distant supervision for improved named entity recognition
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Prediction of Alzheimer's disease and semantic dementia from scene description: toward better language and topic generalization
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Un système de question-réponse simple appliqué à SQuAD
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Personal information prediction from written texts
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Open source quality control tool for translation memory using artificial intelligence
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Comparaison de systèmes de traduction automatique pour la post édition des alertes météorologique d'Environnement Canada
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Protocoles d'évaluation pour l'extraction d'information libre
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Personality extraction through LinkedIn
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Empirical study and multi-task learning exploration for neural sequence labeling models
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Apprendre à résoudre des analogies de forme
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Predictive models for career progression
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Induction de lexiques bilingues à partir de corpus comparables et parallèles
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Extraction de phrases parallèles à partir d’un corpus comparable avec des réseaux de neurones récurrents bidirectionnels
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
WikiGames : une plateforme de jeux dédiée à la validation d’une base de connaissances produite à partir de techniques d’extraction d’information ouverte
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Visualisation de données dans le domaine de l’E-recrutement
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Coreference resolution with and for Wikipedia
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Amélioration a posteriori de la traduction automatique par métaheuristique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Projection multilingue d'annotations pour dialogues avancés
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Détection de tableaux dans des documents : une étude de TableBank
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Alignement de phrases parallèles dans des corpus bruités
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Traduction statistique vers une langue à morphologie riche : combinaison d’algorithmes de segmentation morphologique et de modèles statistiques de traduction automatique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
L’extraction de phrases en relation de traduction dans Wikipédia
Cycle : Maîtrise
Diplôme obtenu : M. Sc. A.
L'atténuation statistique des surdétections d'un correcteur grammatical symbolique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Étude empirique des commentaires et application des techniques de résumé par extraction pour la redocumentation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Formulation interactive des requêtes pour l’analyse et la compréhension du code source
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Déploiement automatique d’une application de routage téléphonique d’une langue source vers une langue cible
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Moranapho : apprentissage non supervisé de la morphologie d'une langue par généralisation de relations analogiques
Cycle : Maîtrise
Diplôme obtenu : M. Sc. A.
Traduction statistique par recherche locale
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Intégration du contexte en traduction statistique à l’aide d’un perceptron à plusieurs couches
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Mood : un cadre d'applications pour le développement de décodeurs en traduction statistique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Projection d'un analyseur grammatical via alignement bilingue de mots
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Étude de la traduction automatique des bulletins météorologiques
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Modèles de langue en recherche d'information
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Adaptation de modèles de traduction dans le cadre du projet TransType
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Comparaison de deux techniques de décodage pour la traduction probabiliste
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Désambiguïsation de corpus monolingues par des approches de type Lesk
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Quelques modèles de langage statistiques et graphiques lissés avec WordNet
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Étude de transformations grammaticales pour l'entraînement de grammaires probabilistes hors-contexte
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Projets
Projets de recherche
Revue3.0 : Écrire, Transmettre, Découvrir
BUMP: Better Understanding of Model’s Performance for more efficient Natural Language Processing
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE)
Centre de recherche interuniversitaire sur les humanités numériques (CRIHN)
Mesurer l'aptitude lexicale des grands modèles de langues génératifs
Computing servers for NLP applications
Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)
Les lexiques nucléaires
NÉONUM : infrastructure de veille pour la néologie en français québécois
Autonomisation des acteurs Judiciaires par la Cyberjustice (AJC)
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE) / Regroupements stratégiques
DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base
Entraînement d’un agent conversationnel en assurance (ancienne demande Bastin)
Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues
Acquisition of an aviation safety taxonomy from incident reports and its evaluation
Assistance tools to build taxonomy of skills and to search for experts
ESG Events Clustering using Natural Language Processing
Scene Graph Image Interpretation Tools
Supplément COVID-19 CRSNG_DeFacto: Acquiring, Curating, and Using a Bilingual Domain Aware Commonsense Knowledge Base
Minimiser les efforts d’annotation lors du développement d’un modèle prédictif en traitement des langues – Phase 1
Financement postdoctoral entrepreneur IVADO a Selçuk Güven
Natural Language Processing for Automated Classification and Analysis of Aviation Safety Reports
Outils de diagnostic et de prévention de l’insatisfaction des employés
Knowledge-based inference for question answering and information retrieval
Extraction automatique d'informations structurées depuis les pièces jointes de courriels échangés sur la plateforme TIGER_Engagement partenarial Plus
Sélection d’un ensemble d’amorçage pour l’apprentissage actif appliqué à la prédiction structurée
Normalisation des rapports de maintenance traités par Orora
TRAINING IN BIG TEXT DATA (TRIBE)
Extraction automatique d'informations structurées depuis les courriels échangés sur la plateforme TIGER
Apogée Canada fonds d'excellence en recherche // Programme de démarrage de projets de recherche collaborative IROSOFT INC.
BUTTERFLY PREDICTIVE PROJECT: MEGADONNEES ET RESEAUX SOCIAUX POUR L'E-RECRUTEMENT
RESEARCH ON DOMAIN SPECIFIC KNOWLEDGE EXTRACTION FROM UNSTRUCTURED TEXT WITH OR WITHOUT SEMANTIC DATABASES
ANALOGICAL LEARNING FOR NATURAL LANGUAGE PROCESSING
PORTION APPAREILLAGE-FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA
FRANSEM : UN ANNOTATEUR POUR LE WEB SEMANTIQUE EN Français BASE SUR UNE VERSION ENRICHIE DE DBPEDIA
ADAPTATION D'UN SYSTEME DE TRADUCTION STATISTIQUE EN PRODUCTION A LA TRADUCTION DE TWEETS
RECHERCHE INTERACTIVE DE DOCUMENTS JURIDIQUES
A SERVER FOR NLP APPLICATIONS AT RALI
Rayonnement
Publications et communications
Publications
- Les publications de Philippe Langlais sont disponibles ici : http://www.iro.umontreal.ca/~felipe/new-home/frontal.php?page=../bib2webV0.81/cv_year.html
Disciplines
- Informatique
Champ d’expertise
- Alignement de séquences
- Apprentissage statistique
- Apprentissage analogique
- Traduction assistée par ordinateur
- Traitement automatique du langage naturel (TALN)
Aide en ligne pour votre profil | Nous joindre
Le Répertoire des professeurs est propulsé par les données du SADVR et est un projet du CENR.