FIDLE / Tactiques et stratégies du Deep Reinforcement Learning

Sdílet
Vložit
  • čas přidán 25. 07. 2024
  • Après le supervisé et le non supervisé, la révolution du Deep Learning s’est également étendue à “l’apprentissage par renforcement”, occasionnant une accélération du développement de la robotique.
    Ce développement s'est notamment illustré avec des victoires face aux meilleurs joueurs humains (AlphaGo), la capacité à élaborer des stratégies ou des tactiques, ou encore dernièrement, en contribuant au succès de ChatGPT (grâce au RLHF).
    Le sujet est très vaste et cette séquence mériterait de très nombreuses heures, compte tenue de la complexité et de la richesse du domaine :-)
    Durant cette séquence, nous essayerons de retracer, rapidement et ensemble, le chemin parcouru au XXe et XXIe siècle, et de comprendre les enjeux et les différentes techniques derrière ces IA qui ont (elles aussi) changées la donne !
    Au menu de cette séquence :
    - Introduction au Reinforcement Learning
    - Q-learning vs Sarsa
    - Du RL au DQN,
    - Policy Gradient, pour être directement dans l’action
    - Cas d’usage, résultats et perspectives
    Durée : 2h30
    Pour rappel, FIDLE est une Formation d'Introduction au Deep Learning, libre et gratuite.
    Pour en savoir plus : fidle.cnrs.fr
    Cette vidéo est sous licence Créative Common CC BY-NC-ND 4.0
  • Věda a technologie

Komentáře •