Passer au contenu

/ Research

Je donne

Rechercher

Natural Sciences and Engineering; Applied Sciences; Fundamental Sciences

Pierre-Luc Bacon

Professeur adjoint

Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle

pierre-luc.bacon@umontreal.ca

Profile

Research expertise

Spécialisé dans l’apprentissage par renforcement, Pierre-Luc Bacon s’intéresse plus particulièrement au problème d’apprentissage de représentations pour la prise de décisions séquentielles ayant des conséquences à long terme ainsi qu'à ses ramifications en optimisation hiérarchique.

Biography

Pierre-Luc Bacon a obtenu son doctorat en science informatique en 2018 sous la supervision de Doina Precup à l'Université McGill. Il est actuellement professeur adjoint au département d'informatique et de recherche opérationnelle​ de l'Université de Montréal. Ses efforts de recherche en apprentissage par renforcement se concentrent autour du problème d'apprentissage sur de longues portées dans le temps basé sur le cadre théorique des actions temporellement abstraites de Sutton et al. (1999).

Awards and recognitions

  • Prix de la meilleure communication étudiante, Association for the Advancement of AI (2017)
  • Prix de la meilleure communication, atelier sur l’apprentissage par renforcement hiérarchique, NeurIPS (2017)

Affiliations and responsabilities

Research affiliations

University service and activities

Activities within organizations or entities of the institution

Teaching and supervision

Student supervision

Theses and dissertation supervision (Papyrus Institutional Repository)

2024

Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language

Graduate : Fathi, Mahan
Cycle : Master's
Grade : M. Sc.
2023

Accelerated algorithms for temporal difference learning methods

Graduate : Rankawat, Anushree
Cycle : Master's
Grade : M. Sc.
2023

Model-based hyperparameter optimization

Graduate : Crouther, Paul
Cycle : Master's
Grade : M. Sc.
2023

Stabilizing Q-Learning for continuous control

Graduate : Hui, David Yu-Tung
Cycle : Master's
Grade : M. Sc.
2023

Sample efficient reinforcement learning for biological sequence design

Graduate : Nouri, Padideh
Cycle : Master's
Grade : M. Sc.
2023

On choice models in the context of MDPs

Graduate : Mohammadpour, Sobhan
Cycle : Master's
Grade : M. Sc.
2022

Steepest descent as Linear Quadratic Regulation

Graduate : Dufort-Labbé, Simon
Cycle : Master's
Grade : M. Sc.
2022

Learning neural ordinary differential equations for optimal control

Graduate : Howe, Nikolaus Harry Reginald
Cycle : Master's
Grade : M. Sc.
2022

Parsimonious reasoning in reinforcement learning for better credit assignment

Graduate : Ma, Michel
Cycle : Master's
Grade : M. Sc.

Projects

Research projects

2023 - 2029

Decision awareness in learning for control

Lead researcher : Pierre-Luc Bacon
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVX20965-(RGP) Programme de subvention à la découverte individuelle ou de groupe
2023 - 2029

Decision awareness in learning for control

Lead researcher : Pierre-Luc Bacon
Funding sources: CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG)
Grant programs: PVXXXXXX-(DGECR) Tremplin vers la découverte
2021 - 2024

Sample-Efficient Reinforcement Learning via Metacognition

Lead researcher : Pierre-Luc Bacon
Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Bourse
2020 - 2021

Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds d'opération - Pierre-Luc Bacon

Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Fonds démarrage et opération
2020

Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds de démarrage - Pierre-Luc Bacon

Lead researcher : Pierre-Luc Bacon
Funding sources: SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements
Grant programs: PVXXXXXX-Fonds d'excellence en recherche Apogée Canada/Fonds démarrage et opération

Outreach

Publications and presentations

Disciplines

  • Computer Science
  • Computer Engineering and Software Engineering

Areas of expertise

  • Learning process
  • Sequence alignment
  • Temporal database