Vision Transformer (ViT) Paper Explained

Swin Transformer V2 - Paper explained

Informer: Time series Transformer - EXPLAINED!

KOCOVINA VE 20 vs VE 30 LETECH 😅😂

Gli occhiali da sole non mi hanno coperto! 😎

Swin Transformer - Paper Explained

Soroush Mehraban

zhlédnutí 10 621

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 29. 08. 2024

Komentáře • 25

@VedantJoshi-mr2us Před 2 měsíci ⁺²
By far one of the best + complete, SWIN transformer explanations on the entire Internet.
@soroushmehraban Před 2 měsíci
Thanks!
@FinalProject-rw1yf Před 2 měsíci
@@soroushmehraban Hi sir, could you also explain the FasterViT and GCViT paper...
@yehanwasura Před rokem ⁺²
Really informative, helped me lot to understand many concepts here. Keep up the good work
@soroushmehraban Před rokem ⁺¹
Thanks! I’ll try my best.
@SizzleSan Před rokem ⁺¹
Thorough! Very comprehensible, thank you.
@omarabubakr6408 Před rokem
That's The Most Illustrative Video Of Swin-Transformers on The Internet!
@soroushmehraban Před rokem
Glad you enjoyed it 😃
@omarabubakr6408 Před rokem
@@soroushmehraban yes abs thx so much, although I Have a Quick Question More Related to PyTorch actually which is in min 12:49 in line 239 in the code 1st what does -1 here means and what does it do exactly with the tensor 2nd from where we get [4,16] the 4 here from where we got it cuz its not mentioned in the reshaping. Thanks in advance.
@rohollahhosseyni8564 Před rokem
Very well explained, thank you Soroush.
@soroushmehraban Před 11 měsíci
Glad you liked it
@kundankumarmandal6804 Před 8 měsíci
You deserve more likes and subscribers
@soroushmehraban Před 8 měsíci
Thanks man🙂 appreciated
@antonioperezvelasco3297 Před 10 měsíci
Thanks for the good explanation!
@user-sw4hm4hh6h Před rokem
perfect description.
@soroushmehraban Před rokem
Glad it was helpful 🙂
@proteus333 Před 10 měsíci
Amazing video !
@soroushmehraban Před 10 měsíci
Thanks!
@siarez Před rokem
Great video! Thanks
@soroushmehraban Před rokem
Thanks for the feedback 🙂
@dslkgjsdlkfjd Před měsícem
2:43 C would be equal to the number of filters not the number of kernels. In the torch.nn.conv2d operation being performed we have 3 kernels for each input channel and then C number of filters. Each filter having 3 kernels not C number of kernels.
@akbarmehraban5007 Před rokem
I enjoy very much
@EngineerXYZ. Před 7 měsíci
Why channel increasees c to 4c after merging
@soroushmehraban Před 7 měsíci ⁺¹
Because we downsample the width by 2 and height by 2. That means we have 4x downsampling in spatial resolution that we give it to the channel dimension. It's just a simple tensor reshaping.
For example 10x10x2 = 200.
After merging it's 5x5x8 = 200.
@Karthik-kt24 Před měsícem
very nicely explained thank you! likes are at 314 so didnt hit like it😁subbed instead

Další v pořadí

Automatické přehrávání

Vision Transformer (ViT) Paper Explained

Vision Transformer (ViT) Paper Explained

Swin Transformer V2 - Paper explained

Swin Transformer V2 - Paper explained

Informer: Time series Transformer - EXPLAINED!

Informer: Time series Transformer - EXPLAINED!

KOCOVINA VE 20 vs VE 30 LETECH 😅😂

KOCOVINA VE 20 vs VE 30 LETECH 😅😂

Gli occhiali da sole non mi hanno coperto! 😎

Gli occhiali da sole non mi hanno coperto! 😎

Muž projde děsivou operací #creepy #pribeh #horrorshorts #horrorstoryjoke #shortfilm

Muž projde děsivou operací #creepy #pribeh #horrorshorts #horrorstoryjoke #shortfilm

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer Code

Swin Transformer Code

Swin Transformer

Swin Transformer

OpenAI Sora and DiTs: Scalable Diffusion Models with Transformers

OpenAI Sora and DiTs: Scalable Diffusion Models with Transformers

Vision Transformer Basics

Vision Transformer Basics

Vision Transformer (ViT) - An image is worth 16x16 words | Paper Explained

Vision Transformer (ViT) - An image is worth 16x16 words | Paper Explained

Lecture 1: Swin Transformer from Scratch in PyTorch - Hierarchic Structure and Shifted Windows Ideas

Lecture 1: Swin Transformer from Scratch in PyTorch - Hierarchic Structure and Shifted Windows Ideas

Why Does Diffusion Work Better than Auto-Regression?

Why Does Diffusion Work Better than Auto-Regression?

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Sad To Announce I Did Not Qualify For Mens 2024 Olympic Gymnastics Team

Sad To Announce I Did Not Qualify For Mens 2024 Olympic Gymnastics Team

Before VS during the CONCERT 🔥 "Aliby" | Andra Gogan

Before VS during the CONCERT 🔥 "Aliby" | Andra Gogan

SKRYTÝ TALENT MMA ZÁPASNÍKA 😆🫃🏻

SKRYTÝ TALENT MMA ZÁPASNÍKA 😆🫃🏻

Na stavbě už jsem viděl asi všechno, flastry dáváme každý den, říká autor humorných videí s dělníky

Na stavbě už jsem viděl asi všechno, flastry dáváme každý den, říká autor humorných videí s dělníky

Sabrina Carpenter - Taste (Official Video)

Sabrina Carpenter - Taste (Official Video)

Nejlepší zapečené párky 🍺 #ostravskygastrošef #food #heřmangazda

Nejlepší zapečené párky 🍺 #ostravskygastrošef #food #heřmangazda

ŽIJU V ZÁBAVNÍM PARKU 24 HODIN... je mi špatně

ŽIJU V ZÁBAVNÍM PARKU 24 HODIN... je mi špatně