Yoshua Bengio
Algorithmes d'apprentissages et intelligence artificielle
- Professeur titulaire
-
Faculté des arts et des sciences - Département d'informatique et de recherche opérationnelle
André-Aisenstadt, local 3243
Médias
Portrait
Expertise de recherche
Mon but à long terme est de comprendre l'intelligence; comprendre ses principes sous-jacents nous donnerait accès à l'intelligence artificielle (IA), et je crois que les algorithmes d'apprentissage sont essentiels dans cette quête. Les algorithmes d'apprentissage pourraient donner aux ordinateurs la capacité de capter des connaissances opérationnelles (pas nécessairement sous forme symbolique/verbale) à partir d'exemples. Une machine ayant appris de telles connaissances pourrait ainsi faire des prédictions ou des classifications correctes sur de nouveaux cas, généraliser à de nouvelles situations. La recherche dans ce domaine a été couronnée de nombreux succès au cours des trois dernières décades, et elle est maintenant appliquée dans de nombreux domaines de la science et de la technologie.
Parmi les applications les plus connues on inclut les engins de recherche, le traitement du langage naturel, la traduction automatique, la reconnaissance de la parole, la vision par ordinateur, et la fouille de données. Mes recherches à long terme portent sur l'apprentissage de représentations, afin de dépasser des limites théoriques et pratiques des algorithmes (linéaires ou à noyau) qui ont dominé l'apprentissage machine jusqu'à récemment. Pour contourner ces limitations, une nouvelle approche appelée apprentissage profond a été développée ici et dans quelques laboratoires depuis 2006 et a connu des succès fracassants au cours des dernières années.
Biographie
Reconnu comme l’une des sommités mondiales en intelligence artificielle, Yoshua Bengio s’est surtout distingué par son rôle de pionnier en apprentissage profond, ce qui lui a valu le Prix A.M. Turing 2018, le « prix Nobel de l’informatique », avec Geoffrey Hinton et Yann LeCun.
Il est professeur titulaire à l’Université de Montréal, fondateur et directeur scientifique de Mila – Institut québécois d’IA, et codirige le programme Apprentissage automatique, apprentissage biologique de CIFAR en tant que Senior Fellow. Il occupe également la fonction de directeur scientifique d’IVADO.
En 2018, il est l’informaticien ayant recueilli le plus grand nombre de nouvelles citations au monde. En 2019, il se voit décerner le prestigieux prix Killam. Il est Fellow de la Royal Society de Londres et du Société Royale du Canada, et Officier de l’Ordre du Canada.
Préoccupé par l’impact social de l’IA et l’objectif que l’IA bénéficie à tous, il a activement contribué à la Déclaration de Montréal pour le développement responsable de l’intelligence artificielle.
Prix et distinctions
- Colauréat du prix A. M. Turing - 2018
- Lauréat du prix Killam en Sciences naturelles 2019
- Prix d’excellence du Fonds de recherche du Québec ‒ Nature et technologies (FRQNT) - 2019
- Fellow de la Société royale de Londres - 2020
- Fellow de la Société royale du Canada - 2017
- Prix Marie-Victorin (Sciences naturelles et génie) - 2017
- Officier de l’Ordre du Canada - 2017
- IEEE CIS Neural Networks Pioneer Award - 2019
- Prix Urgel-Archambault, Association francophone pour le savoir (Acfas) - 2009
Formation
- 1988 — Maîtrise — Informatique — Université McGill
- 1991 — Doctorat — Informatique — Université McGill
Pour en savoir plus…
- 12-09-2016 L’intelligence artificielle aujourd’hui… et demain!
- 15-09-2016 L’UdeM chef de file en infrastructure numérique
- 20-09-2016 Le professeur Bengio se joint au Cognitive Horizons Network d’IBM
- 23-09-2016 Révolution de l'intelligence artificielle : une conférence courue et appréciée!
- Portrait par LaPresse+ - INTELLIGENCE ARTIFICIELLE QUI EST YOSHUA BENGIO ?
- 21-11-2016 Google étend son soutien à la recherche en intelligence artificielle à l’UdeM
- 18-01-2017 Microsoft donne 6 millions de dollars au MILA
- 23-01-2017 Des données à l’action en santé
- 20-04-2017 IBM ouvrira un laboratoire à Montréal pour collaborer avec le MILA
- 11-05-2017 L’UdeM compte des personnalités extraordinaires, selon la revue «Urbania»
- 15-05-2017 100 M$ pour la création de la grappe québécoise en intelligence artificielle
- 05-07-2017 Nomination de membres de l'Université de Montréal au sein de l'Ordre du Canada
- 31-08-2017 Une importante subvention permettra d’étudier les effets positifs à long terme de l’IA
- 15-09-2017 Facebook investit plus de 7 M$US dans le MILA et dans la recherche en IA à Montréal
- 25-09-2017 Un nouveau partenariat avec Samsung en intelligence artificielle
- 03-10-2017 Yoshua Bengio parmi les personnalités «Infopresse» 2017
- 10-10-2017 Thales crée un pôle de recherche en IA à Montréal pour collaborer avec le MILA et IVADO
- 25-10-2017 Intelligence artificielle: pour un développement assujetti aux impératifs démocratiques
- 30-10-2017 Abondante récolte de Prix du Québec pour l’Université de Montréal
- 03-11-2017 Déclaration de Montréal pour un développement responsable de l’intelligence artificielle
- 27-03-2019 «Le prix Nobel de l’informatique»
- 28-01-2019 L’intelligence artificielle s’installe à Montréal
- 03-12-2018 L’Université de Montréal, un leader mondial en sciences informatiques
- 16-08-2018 Yoshua Bengio reçoit de nouveaux honneurs
- 25-06-2019 Yoshua Bengio, personnalité de la semaine
- 06-04-2020 Les chercheurs d’ici mobilisés
-
L'Université de Montréal et de l'intelligence artificielle capable de guider les non-voyants
Les GPS intelligents de nouvelle de génération pourront indiquer, en ville, l’emplacement des trottoirs, des feux de circulation, des bâtiments et des obstacles nombreux qu’une personne non voyante croise sur son chemin.
Affiliations et responsabilités
Affiliations de recherche
Enseignement et encadrement
Recrutement en recherche
Mila - l'Institut québécois d'intelligence artificielle - est toujours à la recherche de bons candidats de tous les niveaux : stagiaires (temps partiel ou temps plein), étudiants à la maîtrise, étudiants au doctorat (incluant les visiteurs) et post-doctorants. Voir aussi Pourquoi étudier à Mila.
Il est attendu des doctorants et post-doctorants qu’ils possèdent une bonne connaissance de l’apprentissage machine et, si possible, de l’apprentissage profond. Au niveau post-doctoral, la plupart des candidats ont déjà un bon dossier de publication en apprentissage profond. Finalement, les candidats à tous les niveaux devraient avoir un fort bagage mathématique (probabilités, algèbre linéaire, optimisations numériques, statistiques) et informatique (analyse numérique, développement de logiciels à code source ouvert).
Pour en savoir plus sur les postes offerts, consultez la page sur le site du Mila >>>
Encadrement
Thèses et mémoires dirigés (dépôt institutionnel Papyrus)
Towards an extension of causal discovery with generative flow networks to latent variables models
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Advances in uncertainty modelling : from epistemic uncertainty estimation to generalized generative flow networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Learning and planning with noise in optimization and reinforcement learning
Cycle : Doctorat
Diplôme obtenu : Ph. D.
From specialists to generalists : inductive biases of deep learning for higher level cognition
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Inductive biases for efficient information transfer in artificial networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Contributions to generative models and their applications
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Dynamics of learning and generalization in neural networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Optimization tools for non-asymptotic statistics in exponential families
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Latent data augmentation and modular structure for improved generalization
Cycle : Doctorat
Diplôme obtenu : Ph. D.
On representation learning for generative models of text
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Towards computationally efficient neural networks with adaptive and dynamic computations
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Locality and compositionality in representation learning for complex visual tasks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
A deep learning theory for neural networks grounded in physics
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Entity-centric representations in deep learning
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
On challenges in training recurrent neural networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Natural image processing and synthesis using deep learning
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Deep neural networks for natural language processing and its acceleration
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Representation learning for dialogue systems
Cycle : Doctorat
Diplôme obtenu : Ph. D.
On sample efficiency and systematic generalization of grounded language understanding with deep learning
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Towards better understanding and improving optimization in recurrent neural networks
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Méta-enseignement : génération active d’exemples par apprentissage par renforcement
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Characterizing and comparing acoustic representations in convolutional neural networks and the human auditory system
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Neural approaches to dialog modeling
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Advances in deep learning methods for speech recognition and understanding
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Prédiction et génération de données structurées à l'aide de réseaux de neurones et de décisions discrètes
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
On Deep Multiscale Recurrent Neural Networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Learning and time : on using memory and curricula for language understanding
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Sequence-to-sequence learning for machine translation and automatic differentiation for machine learning software tools
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Improved training of generative models
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Applications of complex numbers to deep neural networks
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Analyzing the benefits of communication channels between deep learning models
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Improved training of energy-based models
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Learning competitive ensemble of information-constrained primitives
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Auto-Encoders, Distributed Training and Information Representation in Deep Neural Networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Recurrent neural models and related problems in natural language processing
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Exploring Attention Based Model for Captioning Images
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Difference target propagation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Representation Learning for Visual Data
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Reparametrization in deep learning
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Feedforward deep architectures for classification and synthesis
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Learning visual representations with neural networks for video captioning and image generation
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Sequential modeling, generative recurrent neural networks, and their applications to audio
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Structured prediction and generative modeling using neural networks
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Speech synthesis using recurrent neural networks
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Towards deep semi supervised learning
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Bidirectional Helmholtz Machines
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Advances in scaling deep learning algorithms
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Designing Regularizers and Architectures for Recurrent Neural Networks
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
On Recurrent and Deep Neural Networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Leveraging noisy side information for disentangling of factors of variation in a supervised setting
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Distributed conditional computation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Apprentissage des réseaux de neurones profonds et applications en traitement automatique de la langue naturelle
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Apprentissage d'espaces sémantiques
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Deep learning of representations and its application to computer vision
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Improving sampling, optimization and feature extraction in Boltzmann machines
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Algorithmes d’apprentissage profonds supervisés et non-supervisés: applications et résultats théoriques
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Modeling High-Dimensional Audio Sequences with Recurrent Neural Networks
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Algorithmes d'apprentissage pour la recommandation
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Réseaux de neurones à relaxation entraînés par critère d'autoencodeur débruitant
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Apprentissage machine efficace : théorie et pratique
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Apprentissage de représentations musicales à l'aide d'architectures profondes et multiéchelles
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Prédiction de l'attrition en date de renouvellement en assurance automobile avec processus gaussiens
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Understanding deep architectures and the effect of unsupervised pre-training
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Incorporating complex cells into neural networks for pattern classification
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Modèle informatique du coapprentissage des ganglions de la base et du cortex : l'apprentissage par renforcement et le développement de représentations
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Sequential Machine learning Approaches for Portfolio Management
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Training deep convolutional architectures for vision
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Échantillonnage dynamique de champs markoviens
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Étude de techniques d'apprentissage non-supervisé pour l'amélioration de l'entraînement supervisé de modèles connexionnistes
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Avancées théoriques sur la représentation et l'optimisation des réseaux de neurones
Cycle : Doctorat
Diplôme obtenu : Ph. D.
TONGA : un algorithme de gradient naturel pour les problèmes de grande taille
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Modèles Pareto hybrides pour distributions asymétriques et à queues lourdes
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Boosting hierarchique et construction de filtres
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Collaborative filtering techniques for drug discovery
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Algorithms for classifying recorded music by genre
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Extraction d'information à partir de transcription de conversations téléphoniques spécialisées
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Réduction de dimension pour modèles graphiques probabilistes appliqués à la désambiguïsation sémantique
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Réducation de dimensionnalité non linéaire et vorace
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Segmentation hiérarchique du domaine sémantique pour l'accélération d'un modèle de langage
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Modèles à noyaux à structure locale
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Méthodes à noyaux appliquées à la gestion de portefeuille
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Généralisation d'algorithmes de réduction de dimension
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Accélérer l'entraînement d'un modèle non-paramétrique de densité non normalisée par échantillonnage aléatoire
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Les algorithmes d'apprentissage appliqués aux risques financiers
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Quelques modèles de langage statistiques et graphiques lissés avec WordNet
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Contributions à la compression de données
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Statistical analysis of machine learning estimators of insurance premiums
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Architecture et programme d'entraînement pour agents qui apprennent par renforcement
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Critères d'optimisation d'algorithmes d'apprentissage en gestion de portefeuille
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Prise de décision à partir de données séquentielles
Cycle : Doctorat
Diplôme obtenu : Ph. D.
Utilisation d'hyper-paramètres pour la sélection de variables
Cycle : Maîtrise
Diplôme obtenu : M. Sc.
Projets
Projets de recherche
FD - R3AI: Shifting Paradigms for a Robust, Reasoning, and Responsible Artificial Intelligence and its Adoption
Médaille d’or Gerhard-Herzberg en sciences et en génie du Canada
Centre de recherches mathématiques (CRM)
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE)
Autonomous Deep Learning for AI
PandemicStop-AI: for an accelerated response to pandemics
PandemicStop-AI: for an accelerated response to pandemics
Modélisation des défis émergents
Novel generative active learning algorithms for exploring the space of antimicrobial peptides to respond to antibiotics resistance
NSERC CREATE in Science Leadership for Global Sustainability
Real-time visualization of CO2 electrolysis
A Benchmark for Assessing Fine-grained Decision-Making Capabilities of LLM Agents
Correction automatique de textes français avec Electra
L’IA pour la découverte de matériaux et molécules
Program Co-Director, CCAI Chair, CIFAR program in Learning in Machines & Brains
Mila - Quebec Artificial Intelligence Institute for working on the project proposed by Helmholtz Zentrum München Financial support for the proposal of an Helmholtz International Lab
NSERC CREATE Program on Machine Learning in Quantitative Finance and Business Analytics
FI - Data Serving Canadians : Strategy for a Data-Driven Innovation Ecosystem
Extracting Document Structure from Text-Intensive Images, A Multi-Modal Approach
Thème 4 : L'IA pour la découverte de matériaux et molécules
Generalization in Neural Networks
Système d’aide à la décision pour la prédiction de la ressource renouvelable et du productible énergétique afin de contribuer à la réduction des émissions de gaz à effet de serre: Cas du Maroc
Software infrastructure for Deep Learning
Learning in Machines & Brains
Union Neurosciences et Intelligence Artificielle Québec (UNIQUE) / Regroupements stratégiques
Learning in Machines & Brains (Co-Director)
Learning in Machines & Brains
NSERC COHESA: Computing Hardware for Emerging Intelligent Sensory Applications
CENTRE DE RECHERCHES MATHEMATIQUES (CRM)
GFlowNets for estimating free energy functions in reinforcement learning
Realtime detection and tracking of colorectal polyp
Realtime detection and tracking of colorectal polyp
Apogée Canada fonds d'excellence en recherche / Bourse d'excellence IVADO au postdoctoraux Alexandra Luccioni
Decentralized Deep Radiomics: Scaling up the discovery of prognostic and predictive cancer imaging biomarkers from routine clinical data across a network of hospitals
Decentralized Deep Radiomics: Scaling up the discovery of prognostic and predictive cancer imaging biomarkers from routine clinical data across a network of hospitals
Unsupervised Anomaly Detection in multivariate Time Series Data
Low Mixed Precision Techniques for CNN Models
Low Mixed Precision Techniques for CNN Models
Providing value to SMB by optimizing ETL
Programme de fonds de démarrage et d'opération pour professeur IVADO - Compte fonds d'opération - Jonathan Binas
Apogée Canada fonds d'excellence en recherche / Bourse d'excellence IVADO à la maitrise Bhargav Kanuparthi
Subvention accordée au projet Apogée Données au service des Canadiens : apprentissage profond et optimisation aux fins de la révolution du savoir. / Bourse postdoc, Candidat Simon Verret.
Matching MHC 1-associated peptide spectra to sequencing reads using deep neural networks
Apogée Canada fonds d'excellence en recherche / Stages Postdoctoraux IVADO Jonathan Binas
Deep learning for precision medicine by joint analysis of gene expression profiles measured through RNA-Seq and microarrays
Software infrastructure for Deep Learning
DEEP LEARNING OF REPRESENTATIONS
Ground Truth
Real-time visual detection for robotic inspection
Machine/Deep Learning applied in P&C insurance representations
Deep learning-based drug discovery and molecule generation
Link predicting in court
Cross Domain Recommendation System for the food industry
Low data drug modeling
Power Network Transfer Capability
Simplification of long sentences
OPTIMIZATION FOR BUSINESS SYSTEMS AND CONVERSATIONAL ANALYTICS (Retail Personal Store Manager)
Satellite Solar Radiation Nowcasting
Evaluation of monitoring data for predictive maintenance of energy production assets
Low Data Drug Discovery
Time-series forecasting
Electrical Load Forecasting
Super resolution for MRI scans
Readmission AI: a predictive tool to assess patient risk of hospital readmission
Real-time object recognition on wearable devices
Speaker Diarization
Optimizing Transfer Learning using Bidirectional Encoder Representations from Transformers
Canadian Open Neuroscience Platform_CONP
SUBVENTION D'INFRASTRUCTURE DU FRSQ POUR LE GRSNC(GROUPE DE RECHERCHE SUR LE SYSTÈME NERVEUX CENTRAL)
AI to predict emergency visits
Reinforcement Learning for Aviation Training
Longitudinal Weak Labeling for Lung Cancer Prognosis and Treatment Response Prediction
Data-driven Transplantation Science
Longitudinal Weak Labeling for lung cancer prognosis and treatment response prediction
Multimodal Multilingual Continuous Representation for Human Language Understanding (M2CR)
Apprentissage non-supervisé d'architectures profondes pour le changement d'expressions faciales
CHAIRE DE RECHERCHE DU CANADA EN ALGORITHMES D'APPRENTISSAGE STATISTIQUE
Apogée Canada fonds d'excellence en recherche / Fonds de soutien à la recherche de l'étudiant Devon Hjelm.
Apogée Canada fonds d'excellence en recherche / Compte pour le paiement des salaires et portion recherche des quatre post-doc liée au MILA. Candidats: Devansh Arpit, Devon Hjelm, Joseph Paul Cohen et Jason Jo.
Apogée Canada fonds d'excellence en recherche / Fonds de soutien à la recherche de l'étudiant Devansh Arpit
Deep Learning for Cognitive Computing
Highperformance computing environment to leverage deep learning technology for large biomedical and neuroimaging data
Leveraging Unlabelled, Off-Task Data to improve ASR for Low-Resource Languages Based on the Transferability of Acoustic Features Learned by Deep Neural Networks
Leveraging Unlabelled, Off-Task Data to improve ASR for Low-Resource Languages Based on the Transferability of Acoustic Features Learned by Deep Neural Networks
RESEARCH ON DEEP STRUCTURED OUTPUT MODELS
LARGE-SCALE DEEP LEARNING FOR CONTENT-BASED RECOMMENDATION SYSTEMS
ADIABATIC QUANTUM COMPUTING FOR DEEP LEARNING WITH BOLTZMANN MACHINES
LEARNING REPRESENTATIONS OF PLAYERS EMOTIONS AND STATE FOR NEXT GENERATION GAMING
REGROUPEMENT STRATEGIQUES - CALCUL QUEBEC
CENTRE DE RECHERCHES MATHEMATIQUES (CRM)
PORTION RECHERCHE - NSERC-UBISOFT INDUSTRIAL RESEARCH CHAIR ON LEARNING REPRESENTATIONS FOR IMMERSIVE VIDEO GAMES
LEARNING DEEP ARCHITECTURES FOR AI
DEEP LEARNING FOR IMAGE UNDERSTANDING
APPRENTISSAGE DISTRIBUTE D'ARCHITECTURES PROFONDES SUR D'IMMENSES ENSEMBLES DE DONNEES
SUPPORT OF RESEARCH FOR THE ACADEMIC YEAR 2004-2005 TO 2012-2013
DEEP LEARNING FOR SPAM FILTERING
IMPLEMENTING BOLTZMANN MACHINES ON QUANTUM COMPUTING HARDWARE
DEEP LEARNING FOR ADAPTIVE REAL-TIME BIDDING
MACHINE LEARNING ALGORITHMS FOR AUTOMATED ANALYSIS OF PLAYER BEHAVIOR IN NEXT-GENERATION VIDEO GAMES
Rayonnement
En vedette
Mise en valeur d’une recherche
Apprendre aux machines à penser
Avec ses douze étudiants et stagiaires postdoctoraux, Yoshua Bengio étudie deux grandes questions : l'élaboration d'algorithmes et de techniques d'apprentissage afin de traiter de nombreuses variables, ainsi que la création d'algorithmes de plus en plus performants pour traiter des dizaines ou des centaines de millions d'éléments d'information.
Apprendre de manière statistique
« Les animaux et les humains apprennent de manière statistique ¹, rappelle M. Bengio. Les événements ne se produisent pas tous de la même manière et chaque situation est nouvelle ou aléatoire. Pour la reconnaître, le cerveau doit, avant de conclure, généraliser ce qu'il a acquis. Et il doit le faire correctement, pour pouvoir prendre les bonnes décisions.
Mais comment un ordinateur peut-il généraliser correctement quand des centaines, des milliers ou des dizaines de milliers de variables sont en jeu? Yoshua Bengio travaille, par exemple, avec des industriels du domaine pharmaceutique pour identifier les molécules les plus prometteuses pour le développement de nouveaux médicaments. Autre exemple, en télécommunications : ses travaux permettent d'effectuer des analyses de clientèle chez Bell dans le but de diminuer les coûts de marketing. Et les algorithmes d'apprentissage qu'il conçoit contribuent aussi à réduire certains risques dans le domaine de la finance. Un groupe de ses étudiants a même fondé une entreprise qui aide les assureurs à évaluer le coût d'une police de manière beaucoup plus précise qu'avec les procédures classiques. Les nouvelles méthodes de calcul en jeu visent trois grands objectifs : résoudre des problèmes, économiser de l'argent et prendre de bonnes décisions.
Modéliser le langage
Dans Internet, les moteurs de recherche comme Google fonctionnent aussi à partir d'algorithmes d'apprentissage statistiques. Par exemple, pour reconnaître le sens du mot Java, le moteur doit analyser suffisamment d'informations pour décider s'il s'agit de l'île, du café ou du langage de programmation. Yoshua Bengio s'intéresse justement à la modélisation du langage. Il tente notamment de modéliser des séquences de mots : « Les machines analysent des centaines de millions de mots et tentent de prévoir le prochain mot à partir de ceux qui précèdent. Nous laissons rouler les ordinateurs pendant des mois. Mais nous sommes encore loin de l'intelligence artificielle telle que présentée dans les films », précise-t-il.
Des algorithmes gourmands
Ces algorithmes d'apprentissage sont extrêmement gourmands en termes de temps de calcul et d'espace de mémoire. Les processeurs de Altix 3700 sont beaucoup plus rapides que ceux auxquels M. Bengio avait accès jusqu'à maintenant et offrent un autre avantage : « Nous pouvons déjà décomposer nos algorithmes de manière à ce que plusieurs processeurs de calcul travaillent parallèlement sur des processeurs différents et qu'ils puissent communiquer entre eux. Il faudrait des mois pour exécuter une telle opération avec un ordinateur normal alors qu'avec Altix 3700, elle s'effectue jusqu'à 100 fois plus vite », explique Yoshua Bengio.
Publications et communications
Publications
Publications pertinentes
- Goodfellow, I.J., Y. Bengio et A. Courville. Deep Learning. Cambridge, MA: MIT Press, 2016.
- LeCun, Y., Y. Bengio et G. Hinton. « Deep learning. » Nature 521, no 7553 (2015): 436–44.
- Bahdanau, D., K. Cho et Y. Bengio. « Neural machine translation by jointly learning to align and translate. » ICLR, 2015. arXiv:1409.0473.
D'autres publications du professeur Yoshua Bengio, sont disponibles ici : http://www.iro.umontreal.ca/~lisa/publications2/index.php/authors/show/1
Disciplines
- Informatique
- Statistiques
- Mathématiques fondamentales
- Mathématiques appliquées
- Génie informatique et génie logiciel
Champ d’expertise
- Apprentissage automatique
- Apprentissage de représentations
- Apprentissage profond
- Base de données temporelle
- Intelligence artificielle
- Modèles probabilistes
- Modèles statistiques
- Réseaux de neurones
- Vision par ordinateur
- Science des données
- Traitement automatique du langage naturel (TALN)
- Modélisation
- COVID19
Aide en ligne pour votre profil | Nous joindre
Le Répertoire des professeurs est propulsé par les données du SADVR et est un projet du CENR.