Векторизация русского текста на Python | Обработка естественного языка

Sdílet
Vložit
  • čas přidán 3. 06. 2024
  • Демонстрация простых методов векторизации русского текста на Python
    00:00 - Загрузка и подготовка набора данных
    01:48 - Подсчет частоты встречаемости слов в наборе данных
    05:04 - Составление словаря кодов слов
    10:12 - Преобразование текстов в последовательности кодов слов
    14:52 - Создание мешка слов (bag of words)
    Ноутбук из видео - colab.research.google.com/dri...
    Проект реализуется победителем Конкурса на предоставление грантов преподавателям магистратуры благотворительной программы "Стипендиальная программа Владимира Потанина" Благотворительного фонда Владимира Потанина"
    вКонтакте - avsozykin
    telegram - t.me/a_sozykin
    Мой сайт - www.asozykin.ru
    Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках - / andreysozykincs
  • Věda a technologie

Komentáře • 9

  • @user-hb6dg7gp3b
    @user-hb6dg7gp3b Před 9 měsíci

    Спасибо вам за то, что вы так хорошо и доступно объясняете!

  • @chessketeer
    @chessketeer Před 8 měsíci

    Спасибо! Просто отличный урок👍

  • @sherlockholmes5736
    @sherlockholmes5736 Před rokem +3

    Хорошо объяснили, спасибо! Вовремя урок вышел, читал книгу "Глубокое обучение на python" Шолле(создатель keras), там в первом примере такая же задача) Только с классификацией отзывов IMDB

    • @AndreySozykin
      @AndreySozykin  Před rokem +2

      Да, определение тональности текста - востребованная и популярная задача. Но для нее не всегда нужны нейронные сети, часто достаточно классических алгоритмов машинного обучения.

  • @simplechannel7859
    @simplechannel7859 Před rokem +2

    Андрей, спасибо!

  • @kaperdi1653
    @kaperdi1653 Před rokem

    огонь .сел изучать, нашел подписался))

  • @Julia-ej4jz
    @Julia-ej4jz Před rokem

    Большое спасибо 🤩🤩🤩

  • @TIENTI0000
    @TIENTI0000 Před rokem +1

    годно!