FIDLE / Des neurones pour la physique, les physics-informed neural networks (PINNS)

FIDLE / Passer à la vitesse supérieure : l’accélération matérielle

MIT 6.S191 (2023): Reinforcement Learning

DAD LEFT HIS OLD SOCKS ON THE COUCH…😱😂

When You're a Chef and a Katana Owner...

What Country's Flag Is It? #asmr #satisfying #oddlysatisfying #satisfyingvideo #asmrsounds #aluminum

FIDLE / Tactiques et stratégies du Deep Reinforcement Learning

CNRS - Formation FIDLE

zhlédnutí 2 969

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 25. 07. 2024
Après le supervisé et le non supervisé, la révolution du Deep Learning s’est également étendue à “l’apprentissage par renforcement”, occasionnant une accélération du développement de la robotique.
Ce développement s'est notamment illustré avec des victoires face aux meilleurs joueurs humains (AlphaGo), la capacité à élaborer des stratégies ou des tactiques, ou encore dernièrement, en contribuant au succès de ChatGPT (grâce au RLHF).
Le sujet est très vaste et cette séquence mériterait de très nombreuses heures, compte tenue de la complexité et de la richesse du domaine :-)
Durant cette séquence, nous essayerons de retracer, rapidement et ensemble, le chemin parcouru au XXe et XXIe siècle, et de comprendre les enjeux et les différentes techniques derrière ces IA qui ont (elles aussi) changées la donne !
Au menu de cette séquence :
- Introduction au Reinforcement Learning
- Q-learning vs Sarsa
- Du RL au DQN,
- Policy Gradient, pour être directement dans l’action
- Cas d’usage, résultats et perspectives
Durée : 2h30
Pour rappel, FIDLE est une Formation d'Introduction au Deep Learning, libre et gratuite.
Pour en savoir plus : fidle.cnrs.fr
Cette vidéo est sous licence Créative Common CC BY-NC-ND 4.0
Věda a technologie

Komentáře •

Další v pořadí

Automatické přehrávání

FIDLE / Des neurones pour la physique, les physics-informed neural networks (PINNS)

FIDLE / Des neurones pour la physique, les physics-informed neural networks (PINNS)

FIDLE / Passer à la vitesse supérieure : l’accélération matérielle

FIDLE / Passer à la vitesse supérieure : l’accélération matérielle

MIT 6.S191 (2023): Reinforcement Learning

MIT 6.S191 (2023): Reinforcement Learning

DAD LEFT HIS OLD SOCKS ON THE COUCH…😱😂

DAD LEFT HIS OLD SOCKS ON THE COUCH…😱😂

When You're a Chef and a Katana Owner...

When You're a Chef and a Katana Owner...

What Country's Flag Is It? #asmr #satisfying #oddlysatisfying #satisfyingvideo #asmrsounds #aluminum

What Country's Flag Is It? #asmr #satisfying #oddlysatisfying #satisfyingvideo #asmrsounds #aluminum

Double Stacked Pizza @Lionfield @ChefRush

Double Stacked Pizza @Lionfield @ChefRush

JDLS 2024 / Multimodal Pre Training for Scientific Data

JDLS 2024 / Multimodal Pre Training for Scientific Data

"PAS TOUCHE À MES JEUX OLYMPIQUES" : ÇA Y EST, MACRON SE PREND POUR MITTERRAND

"PAS TOUCHE À MES JEUX OLYMPIQUES" : ÇA Y EST, MACRON SE PREND POUR MITTERRAND

AMD Almost Went Bankrupt…but were saved by Sony and Microsoft?

AMD Almost Went Bankrupt…but were saved by Sony and Microsoft?

💡 [Alain Aspect] Des concepts aux applications : les deux révolutions quantiques

💡 [Alain Aspect] Des concepts aux applications : les deux révolutions quantiques

Sabotage des lignes SNCF : le point sur la situation

Sabotage des lignes SNCF : le point sur la situation

Kiev-Moscou : les deux camps prêts à négocier avec la Chine comme intermédiaire

Kiev-Moscou : les deux camps prêts à négocier avec la Chine comme intermédiaire

FIDLE / Diffusion model, text to image

FIDLE / Diffusion model, text to image

L’Intelligence Artificielle au service de la Maintenance Prédictive

L’Intelligence Artificielle au service de la Maintenance Prédictive

FIDLE / Autoencodeur (AE), un exemple d'apprentissage auto-supervisé !

FIDLE / Autoencodeur (AE), un exemple d'apprentissage auto-supervisé !

Cheapest gaming phone? 🤭 #miniphone #smartphone #iphone #fy

Cheapest gaming phone? 🤭 #miniphone #smartphone #iphone #fy

Why No One Is Using Windows 11

Why No One Is Using Windows 11

Apple, Microsoft outage, Bob Newhart, Lou Dobbs, Where is Melania Trump, Trump speech TODAY

Apple, Microsoft outage, Bob Newhart, Lou Dobbs, Where is Melania Trump, Trump speech TODAY

My 2 year old Fold is SO MUCH worse... - Samsung Galaxy Z Fold 6

My 2 year old Fold is SO MUCH worse... - Samsung Galaxy Z Fold 6

CrowdStrike IT Outage Explained by a Windows Developer

CrowdStrike IT Outage Explained by a Windows Developer

Telefonu Parçaladım!😱

Telefonu Parçaladım!😱

POCO X6 PRO😈 Vs iPHONE 15 PRO💀Vs POCO F6 PRO😱 VsiQOO 12Vs 8GBvs4GBVs-PUBG TEST #pocox6pro #iPhone

POCO X6 PRO😈 Vs iPHONE 15 PRO💀Vs POCO F6 PRO😱 VsiQOO 12Vs 8GBvs4GBVs-PUBG TEST #pocox6pro #iPhone

Passive infrared motion sensors: a two-bit camera powered by crystals

Passive infrared motion sensors: a two-bit camera powered by crystals