Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

Павел Васильев

zhlédnutí 48 107

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 26. 01. 2022
В этом видео я хочу рассказать как можно с нуля разработать и обучить нейронную сеть для распознавания объектов на изображениях.
00:00 - Введение
00:39 - Виды задач распознавания
01:17 - Применяемые архитектуры нейронных сетей
02:00 - Система распознавания объектов
02:39 - Разметка данных
05:04 - Загрузка данных в TensorFlow
09:57 - Способ обработки изображений
11:00 - Архитектура UNet
13:10 - Реализация сети в Keras и TensorFlow
14:56 - Функции потерь и метрики
17:41 - Обучение нейронной сети
19:01 - Тестирование нейронной сети
Исходный код
colab.research.google.com/git...
Статьи
⁃ SegNet arxiv.org/pdf/1511.00561.pdf
⁃ DeepLab arxiv.org/pdf/1606.00915.pdf
⁃ UNet arxiv.org/pdf/1505.04597.pdf
⁃ Обзор функций arxiv.org/pdf/2006.14822.pdf

Komentáře • 66

@goga-pro2024 Před 5 měsíci ⁺¹¹
самое лучшее обьяснение за всю мою жизнь, а я с нейронками с 2014 года, обьясни людям в следующем видео как продолжить обучение не начиная с нуля, этого матерьяла мало в нете
@ernisesama1636 Před 2 lety ⁺¹⁷
Наверное самое понятное обяснение на CZcams. Продолжай пожалуста
@user-ji5fe9pb2b Před rokem ⁺¹⁸
Отличное Видео. С пояснением всего что сделано. Автору большое спасибо. Если такое же видео будет сделано и для других типов сетей или например PyTorch, было бы очень круто! Автору большое уважение.
@user-py2bu9ky2x Před 2 lety ⁺⁷
Отличное видео! Спасибо автору за работу!
@727doto Před 2 lety ⁺¹
Отличное видео, спасибо, очень интересно! С нетерпением жду продолжения !
@TheBestSurvival Před rokem ⁺⁶
Качественно и доступно, а главное реально интересно и полезно! Автору желаю 100500 подписчиков))
@user-ji6ge3py9d Před 2 lety
Надо же как интересно . Класс! Здорово придумано.
@user-ov8jm4uv3w Před rokem
Спасибо! Отличное видео! Все настолько хорошо объяснили!
@user-xc9vu6xq2r Před 2 lety
Очень полезное видео ! Спасибо большое !
@tymurkr Před 25 dny
Классное видео, все понятно объяснил, ещё попробую на этой недели протестить, если получится, напишу в PS(если не забуду).👍
@dyachenkokonstantin67 Před rokem
Спасибо, очень чисто и понятно.
@rspdno Před 2 lety ⁺¹
Спасибо за ролик!
@cekkush Před 2 lety ⁺²
Павел, очень доступно. Огромное спасибо. Ждём продолжения! Привет из Азербайджана.
@user-sk8pc2mc1u Před 2 lety
Очень полезное дело 👍
@user-jh4rw8wr5b Před 2 lety
Очень круто, спасибо большое
@lecturer_abramenkova Před 2 lety ⁺¹
Спасибо)
@seoonlyRU Před 2 lety
красота) лайк от СЕООНЛИ!
@yood1e Před rokem
Годнота
@s1ngle77 Před 2 lety
Блин круто препод топ
@bekabad Před rokem ⁺¹
Теперь я знаю, про что будет моя дипломная работа! Спасибо!
@Diman86ful Před měsícem
ну что? получилось с дипломной?
@bekabad Před měsícem ⁺¹
@@Diman86ful Нет, заставили писать что-то более прикладное. Пришлось CRM на Django бахнуть.
@GAVNO Před 2 lety
спасибо
@user-ct6zd7xm8s Před rokem
круть
@user-iy3yo2wt1n Před 2 lety
👍👍👍👍👍👍👍👍
@revoluxe Před 10 měsíci
💪
@nikolaynovikov5756 Před 2 lety ⁺¹
Жду следующие видео, когда будет ???
@PLenchak Před 8 měsíci
Отличное видео! Подскажите, как можно распечатывать карты признаков по мере обучения?
@MrKappasama Před 4 měsíci
Спасибо за видео! А можете подсказать, в какую сторону копать если нужно найти бинарную маску блоков текста на картинке? (в идеале так вырезать текст и восстановить фон)
@user-ov8jm4uv3w Před rokem
Кстати. А вот если задача стоит так, чтобы модель к цвету не привязывалась, а к форме - перевод в градации серого решит задачу? Например, изменение освещенности это сможет решить?
@user-fn4yc7un8z Před 9 měsíci
Добрый день! Отличное видео, спасибо. Подскажите пожалуйста, в каком формате вы экспортировали данные из supervisely?
@lyftzeigen Před 9 měsíci
Здравствуйте! Sypervisely обновился, наверное сейчас это называется "Export to masks".
@user-fn4yc7un8z Před 9 měsíci
@@lyftzeigen большое спасибо!
@dmitrykhomyakov8451 Před 6 měsíci
@@user-fn4yc7un8z Sypervisely. не предлагает экспорт в таком формате. На выбор дано 6 вариантов: Sypervisely, YOLO8, просто images (видимо без аннотаций), DOTA, COCO Keypoints, image links to CSV. Какой из этих форматов можно использовать в коде по Вашему видео?
@user-qm9xh3je4y Před 8 měsíci
Здравствуйте, у меня вопрос, чем кардинально будет отличаться данный метод от метода локализации? Суть же останется той же, только объект будет всего лишь один или есть различия?
@user-wj8po5ou5c Před rokem ⁺¹
Отличное видео. Подскажите, а что за среда разработки используется на видео?
@user-of-world Před rokem
Юзай Google collab, офигенная штука
@meowxd1337 Před rokem ⁺¹
А есть какой нибудь готовый датасет для лис, котов итд?
@user-nj5vi5dh2f Před rokem
Добрый день, спасибо за видео) очень помогло
Но есть один вопрос, как подтянуть координаты пересмотра классов?
@user-cm8fi9vo8h Před rokem
А куда сохраняются обработанные кадры? Подскажи пожалуйста
Или как сохранить их локально?
@kirilllas7247 Před 12 dny
Как сделать чтобы нейронка распознавала нужные изображения в браузере, например листаешь вкладку с фотографиями, и она как то распознает нужное, по стокам
@user-gv3fx2jh7i Před 2 lety
когда пытаюсь вставить свои изображения вылезает такая ошибка:
TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string.
что мне делать?
@arhalexxx Před 4 měsíci
переобученная модель может получиться, если аугументация это простое копирование. Только эти предметы и будет хавать и то не всегда. чуть другая форма, тон и всё. Интересно вот как видеокарта настроена, если Вы ей собираетесь обучать.
@djosmer2 Před rokem
Подскажи. Допустим есть картинка, на ней один объект и снизу рядом текст, надо сделать рамку вокруг объекта с текстом. Сделать обводку не пойдет, т.к. повторяет форму объекта, надо чтоб линия плавно обводила объект с текстом, например как у стикеров. Сможет ли это сделать нейронка?
@lyftzeigen Před rokem
На мой взгляд, применять нейросеть для решения такой задачи, не самое оптимальное решение. Думаю, что проще воспользоваться классическими методами, например, выделение контуров текста и применение морфологических операций с последующей обработкой.
@user-cm8fi9vo8h Před rokem
Здравствуйте, а куда сохраняются уже обработанные кадры? По коду они должны сохранятся в репозиторий videos/processed, я повторил, но у меня ничего в этой папке не появляется. Помогите, пожалуйста!
@user-cm8fi9vo8h Před rokem
ПОМОГИТЕ ПОЖАЛУЙСТА
@user-mk6yf4lu3p Před 5 měsíci
А для чего применяется подряд tf.image.convert_image_dtype и следом нормализация image/255? Разве это не одно и тоже?
@Grenkitop Před 10 měsíci
Добрый день , Павел .Как с вами связаться ? Я хочу попросить вас обучить Аи под мою модель , я заплачу.
И если интересно в дальнейшем мне нужна будет помощь для добавления разных объектов в мою библиотеку . В целом возможно долгосрочное сотрудничество в этом направлении
@somebody5186 Před rokem
!!!
@user-cq3tt9fv9j Před rokem
Здравствуйте.
Имею следующую ошибку во время первой эпохи обучения:
ValueError: Dimensions must be equal, but are 400 and 8 for '{{node dice_bce_mc_loss/mul}} = Mul[T=DT_FLOAT](dice_bce_mc_loss/unstack, dice_bce_mc_loss/unstack_1)' with input shapes: [?,400,500], [?,8,8].
В коде изменил лишь размер изображения (на 400x500), количество классов-цветов (с 8 на 2) и добавил указание количества каналов для png (mask = tf.io.decode_png(mask, channels=3)), а также небольшое изменение в Skip Connections - downsample_skips = reversed(downsample_skips[:0]).
На какую часть программы порекомендуете взглянуть?
Спасибо.
@lyftzeigen Před rokem ⁺¹
Здравствуйте! Изменение разрешения изображения тянет за собой все остальное. Нужно разобраться в размере данных, которые проходят через нейросеть и через все функции.
А порекомендую взглянуть на связку YOLO + Roboflow:
blog.roboflow.com/train-yolov7-instance-segmentation-on-custom-data/
@grey111111111 Před 4 měsíci
На Colab ошибка на ячейке с обучением модели:
InvalidArgumentError: Graph execution error:
@grey111111111 Před 4 měsíci
поменял GPU на CPU и заработало, почему так может быть?
@user-or5rm1ud9y Před 2 lety
Уважаемый автор, не могли бы вы помочь и предоставить файл с моделью нейронной сети которую Вы реализуете в данном ролике
@lyftzeigen Před 2 lety
В описании к видео есть ссылка на Google Collab, где вы можете самостоятельно опробовать работу нейронной сети.
@user-or5rm1ud9y Před 2 lety
@@lyftzeigen я имею ввиду схему нейронной сети, которая у вас демонстрируется на 2:30
@MrSatanizd Před rokem
г_спади видос на 11 из 10 по объяснению и демонстрации как вся это нейронная хня работает!!!!111.
Есть ли возможность связаться с автором видео для общения по разработке решения распознавания объектов на видео?
@user-pc2ge5km9s Před 2 lety
Как размечать, как выгружать - ни слова об этом :(
@rspdno Před 2 lety
согласен - это достаточно полезная информация была бы!
@user-ji5fe9pb2b Před rokem
На счет этого можно посмотреть видео по разметке данных именно указанными инструментами. Хотя согласен, можно было бы добавить описание.
@romastep6576 Před rokem
Очень интересно, но почти ничего не понятно. Не в сторону автора выпад, а в сторону недостаточности моих знаний для полного понимания разжеваного до атомов материала 😂
@iiiyx Před rokem ⁺⁷
Слишком много "почему" после просмотра, поэтому это, увы, не обучающее видео.
@jeremyfox3031 Před rokem ⁺¹
"хорошее видео"
"отличное видео"
"очень полезно" и бла-бла-бла
пустая, никчёмная болтовня, которая никого,
ничему и никогда не научит
@mattewcox7065 Před rokem
кто нибудь сталкивался с проблемой, что именно маски не читаются с ошибкой:
InvalidArgumentError: Matrix size-incompatible: In[0]: [189888,1], In[1]: [3,1]
[[{{node rgb_to_grayscale/Tensordot/MatMul}}]] [Op:IteratorGetNext]
@mattewcox7065 Před rokem
@@aligatorpe а я ззафиксил кстати и забыл как уже

Další v pořadí

Automatické přehrávání

Как обучить Object Detection Нейросеть на своем наборе данных. Гайд от начала и до конца.