Aller au contenu principal
Formation à distanceÉtudesCours à distanceApprentissage par renforcement

IFT-7201 Apprentissage par renforcement

3 crédits / 2e-3e cycles

Description

Outils théoriques expliquant les raisons, les conditions et les garanties de fonctionnement d'un algorithme; formulation d'un problème réel (instance d'apprentissage par renforcement interactif); caractérisation empirique des algorithmes; environnements simples (Multi-Armed Bandit) communément utilisés pour aborder des problèmes d'apprentissage par renforcement interactif; algorithmes fondamentaux (Upper Confidence Bound, Thompson Sampling) permettant d'aborder le compromis exploration-exploitation en apprentissage par renforcement; utilisation efficace de l'information structurelle par la régression paramétrique ou non et par les réseaux de neurones; variantes dans les dynamiques des environnements et applications associées, y compris l'optimisation bayésienne; prise de décision séquentielle dans les processus de décision markoviens (MDP). L'étudiant qui a réussi le cours IFT-4201 ne peut s'inscrire à ce cours.

Consulter la description officielle du cours sur ulaval.ca

Restriction à l'inscription

Cycle d'études
  • Doit être inscrit :
    • Deuxième cycle
    • Troisième cycle

Responsables

Faculté : Sciences et génie

Courriel : fsg@fsg.ulaval.ca

Département : Département d'informatique et de génie logiciel

Courriel : info@ift.ulaval.ca