Pierre-Luc Bacon
- Professeur adjoint
-
Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
Profile
Research expertise
Spécialisé dans l’apprentissage par renforcement, Pierre-Luc Bacon s’intéresse plus particulièrement au problème d’apprentissage de représentations pour la prise de décisions séquentielles ayant des conséquences à long terme ainsi qu'à ses ramifications en optimisation hiérarchique.
Biography
Pierre-Luc Bacon a obtenu son doctorat en science informatique en 2018 sous la supervision de Doina Precup à l'Université McGill. Il est actuellement professeur adjoint au département d'informatique et de recherche opérationnelle de l'Université de Montréal. Ses efforts de recherche en apprentissage par renforcement se concentrent autour du problème d'apprentissage sur de longues portées dans le temps basé sur le cadre théorique des actions temporellement abstraites de Sutton et al. (1999).
Awards and recognitions
- Prix de la meilleure communication étudiante, Association for the Advancement of AI (2017)
- Prix de la meilleure communication, atelier sur l’apprentissage par renforcement hiérarchique, NeurIPS (2017)
Affiliations and responsabilities
Research affiliations
University service and activities
Activities within organizations or entities of the institution
- Titulaire de la Chaire en IA-Facebook CIFAR
Teaching and supervision
Teaching
Student supervision
Theses and dissertation supervision (Papyrus Institutional Repository)
Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language
Cycle : Master's
Grade : M. Sc.
Accelerated algorithms for temporal difference learning methods
Cycle : Master's
Grade : M. Sc.
Model-based hyperparameter optimization
Cycle : Master's
Grade : M. Sc.
Stabilizing Q-Learning for continuous control
Cycle : Master's
Grade : M. Sc.
Sample efficient reinforcement learning for biological sequence design
Cycle : Master's
Grade : M. Sc.
On choice models in the context of MDPs
Cycle : Master's
Grade : M. Sc.
Steepest descent as Linear Quadratic Regulation
Cycle : Master's
Grade : M. Sc.
Learning neural ordinary differential equations for optimal control
Cycle : Master's
Grade : M. Sc.
Parsimonious reasoning in reinforcement learning for better credit assignment
Cycle : Master's
Grade : M. Sc.
Projects
Research projects
Decision awareness in learning for control
Decision awareness in learning for control
Sample-Efficient Reinforcement Learning via Metacognition
Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds d'opération - Pierre-Luc Bacon
Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds de démarrage - Pierre-Luc Bacon
Outreach
Publications and presentations
Disciplines
- Computer Science
- Computer Engineering and Software Engineering
Areas of expertise
- Learning process
- Sequence alignment
- Temporal database
Aide en ligne pour votre profil | Nous joindre
Le Répertoire des professeurs est propulsé par les données du SADVR et est un projet du CENR.