Vision Transformers Need Registers - Fixing a Bug in DINOv2?

Sdílet
Vložit
  • čas přidán 29. 08. 2024

Komentáře • 4

  • @xxlvulkann6743
    @xxlvulkann6743 Před 19 dny

    Great explanation! It is interesting to see how attention matrices aid in interpretability research and in getting better representations! I wonder how this could be applied to other modalities (such as audio).

  • @user-st3dx8pd1o
    @user-st3dx8pd1o Před 2 měsíci

    Thanks a lot!

  • @marzi869
    @marzi869 Před měsícem +1

    Thanks, but remove the music in background.

  • @dhrumil5977
    @dhrumil5977 Před 10 měsíci

    Thanks ❤