Apprentissage par renforcement #6 : Q-Learning (Animation)

Sdílet
Vložit
  • čas přidán 21. 08. 2024
  • Patreon : / membership
    Série de vidéos consacrée à l'apprentissage par renforcement. Dans cette vidéo, nous approfondissons notre compréhension du Q-Learning en montrant l'évolution des valeurs de la Q-table.
    Le code : github.com/thi...
    Discord de la communauté :
    / discord
    [Chronique d'une IA]
    Spotify : open.spotify.c...
    Amazon music : music.amazon.f...
    Apple Podcasts: podcasts.apple...
    [About me]
    Visual Behavior : visualbehavior.ai
    Perso : www.thibaultne...
    Github : github.com/thi...
    Linkedin : / thibaultneveu
    Twitter : / thiboneveu

Komentáře • 9

  • @khalidmaarifa4768
    @khalidmaarifa4768 Před 4 lety

    TOP

  • @NathanNau
    @NathanNau Před 5 lety +1

    Arg.... Je veux voir la suite !! Super tes vidéo.

  • @Inspector93
    @Inspector93 Před 5 lety +2

    Top la vidéo. Je ne comprends cependant pas à 4:09 quand l'agent se trouve sur la case 3.
    Il vient de la case 2 et comme à la case 3 il a son reward, l'algo va appliquer une value sur l'action "Se déplacer à droite à partir de la case2" et, en conséquence, afficher 0.1 à droite de la case 2.
    Maintenant, pour quelle raison, lorsque l'agent se trouve sur la case 3, une value est définie à droite de celle-ci ? Ceci aurait été le cas si une case à droite existait (x=3,y=0) et avait un reward, non ?
    Je bute là-dessus... :)

    • @ThibaultNeveu
      @ThibaultNeveu  Před 5 lety +1

      Bonne remarque, enfait dans cette exemple lorsque l'agent décide d'aller à droite de la case 3 il ne bouge pas de la case, en d'autre terme il reviens sur la case où il se trouvait. Donc ici il reçoit une récompense de 1 en allant à droite car cela le fait revenir sur la même case qui lui rapport une nouvelle récompense.

    • @Inspector93
      @Inspector93 Před 5 lety

      @@ThibaultNeveu excellent, je n'avais pas pensé à ça. Merci Thibault !

  • @raouashili907
    @raouashili907 Před 5 lety

    Salut , je suis entrain d'appliquer le Q learning dans mon sujet de mastère et je vais implémenter la solution. J'ai plusieurs questions à poser . Est ce que tu peux m'aider ?

    • @ThibaultNeveu
      @ThibaultNeveu  Před 5 lety +1

      Salut, tu peux venir poser ta question sur le discord (lien en description de la vidéo)

  • @karthikd490
    @karthikd490 Před 5 lety

    Hi, could you make videos in english explaining how to handle continuous action spaces, using javascript language ? Thank you so much again!

    • @ThibaultNeveu
      @ThibaultNeveu  Před 5 lety +2

      Hi, sorry but I don't plan to do english videos for now, but you can watch david silver videos on CZcams in the meanwhile