Pierre-Luc Bacon
- Professeur adjoint
-
Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
Portrait
Expertise de recherche
Spécialisé dans l’apprentissage par renforcement, Pierre-Luc Bacon s’intéresse plus particulièrement au problème d’apprentissage de représentations pour la prise de décisions séquentielles ayant des conséquences à long terme ainsi qu'à ses ramifications en optimisation hiérarchique.
Biographie
Pierre-Luc Bacon a obtenu son doctorat en science informatique en 2018 sous la supervision de Doina Precup à l'Université McGill. Il est actuellement professeur adjoint au département d'informatique et de recherche opérationnelle de l'Université de Montréal. Ses efforts de recherche en apprentissage par renforcement se concentrent autour du problème d'apprentissage sur de longues portées dans le temps basé sur le cadre théorique des actions temporellement abstraites de Sutton et al. (1999).
Prix et distinctions
- Prix de la meilleure communication étudiante, Association for the Advancement of AI (2017)
- Prix de la meilleure communication, atelier sur l’apprentissage par renforcement hiérarchique, NeurIPS (2017)
Affiliations et responsabilités
Affiliations de recherche
Contribution au fonctionnement de l’institution
Activités au sein d’organismes ou d’entités de l’institution
- Titulaire de la Chaire en IA-Facebook CIFAR
Enseignement et encadrement
Enseignement
Cours siglés (session en cours uniquement)
- IFT-3395 – Fondements de l'apprentissage machine
- IFT-4055 – Projet informatique honor
- IFT-6162 – Apprentissage par renforcement, commande optimale
- IFT-6390 – Fondements de l'apprentissage machine
Programmes
- 117510 – Baccalauréat en informatique
- 117520 – Majeure en informatique
- 119010 – Baccalauréat en mathématiques
- 119110 – Baccalauréat en mathématiques et informatique
- 119110 – Baccalauréat en mathématiques et informatique
- 120510 – Baccalauréat en physique et informatique
- 120510 – Baccalauréat en physique et informatique
- 146811 – Baccalauréat en bio-informatique
- 146811 – Baccalauréat en bio-informatique
- 217510 – Maîtrise en informatique
- 217512 – DESS en apprentissage automatique
- 218010 – Maîtrise en linguistique
- 223910 – DESS en finance mathématique et computationnelle
- 223910 – DESS en finance mathématique et computationnelle
- 223911 – Maîtrise en finance mathématique et computationnelle
- 246810 – Maîtrise en bio-informatique
- 248116 – Maîtrise en sciences pharmaceutiques, option médicament et santé des populations
- 248510 – Maîtrise en sciences cliniques
Encadrement
Thèses et mémoires dirigés (dépôt institutionnel Papyrus)
Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Accelerated algorithms for temporal difference learning methods
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Model-based hyperparameter optimization
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Stabilizing Q-Learning for continuous control
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Sample efficient reinforcement learning for biological sequence design
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
On choice models in the context of MDPs
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Steepest descent as Linear Quadratic Regulation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Learning neural ordinary differential equations for optimal control
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Parsimonious reasoning in reinforcement learning for better credit assignment
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Projets
Projets de recherche
Decision awareness in learning for control
Decision awareness in learning for control
Sample-Efficient Reinforcement Learning via Metacognition
Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds d'opération - Pierre-Luc Bacon
Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds de démarrage - Pierre-Luc Bacon
Rayonnement
Publications et communications
Disciplines
- Informatique
- Génie informatique et génie logiciel
Champ d’expertise
- Processus d'apprentissage
- Alignement de séquences
- Base de données temporelle
Aide en ligne pour votre profil | Nous joindre
Le Répertoire des professeurs est propulsé par les données du SADVR et est un projet du CENR.