Определение тональности текста c помощью мешка слов | Обработка естественного языка

Sdílet
Vložit
  • čas přidán 3. 06. 2024
  • Определение тональности отзывов на банки с помощью классических алгоритмов машинного обучения. Используем логистическую регрессию и мешок слов.
    00:00 - Начало
    01:45 - Загрузка и предобработка данных
    03:13 - Подготовка данных для обучения
    06:55 - Создание мешка слов
    07:30 - Обучение модели логистической регрессии
    09:00 - Оценка качества обучения модели
    10:10 - Применение модели
    Colab-ноутбук из видео - colab.research.google.com/dri...
    Проект реализуется победителем Конкурса на предоставление грантов преподавателям магистратуры благотворительной программы "Стипендиальная программа Владимира Потанина" Благотворительного фонда Владимира Потанина".
    вКонтакте - avsozykin
    telegram - t.me/a_sozykin
    Мой сайт - www.asozykin.ru
    Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках - / andreysozykincs
  • Věda a technologie

Komentáře • 15

  • @user-li7hi9em2o
    @user-li7hi9em2o Před rokem

    Андрей, здравствуйте! Спасибо большое Вам за труд и такие полезные подробные уроки! Не в первый раз смотрю ваши видео и каждый раз они на высоте. Здоровья, процветания и всех благ вам!

  • @AngelA-jx6vf
    @AngelA-jx6vf Před rokem +4

    Супер 🎉 Андрей, спасибо большое!!!

  • @user-qf7sy6lb5c
    @user-qf7sy6lb5c Před měsícem

    Андрей, здравствуйте! Спасибо, что делитесь своим опытом и знаниями. Будет ли урок, как сохранить подобную модель и использовать её повторно?

  • @Kn_Dmitry
    @Kn_Dmitry Před 5 měsíci +1

    Спасибо большое! Это именно то, что мне сейчас нужно!!!

    • @AndreySozykin
      @AndreySozykin  Před 5 měsíci

      Пожалуйста! Рад, что видео полезно!

  • @user-it5mc8sd5e
    @user-it5mc8sd5e Před rokem +2

    Спасибо вам за ваш плейлист по сетям

  • @smetan42
    @smetan42 Před 3 měsíci

    1:53 - опечатка в ноутбуке (и в других, где есть функция preprocess()).
    В функции preprocess() параметры идут в таком порядке: text, stop_words, punctuation_marks, morph. При добавлении столбца "Preprocessed_texts" к переменной banks, в функцию preprocess() передаются аргументы в другом порядке: row['Text'], punctuation_marks, stop_words, morph.

  • @user-co7wd3cv4x
    @user-co7wd3cv4x Před rokem

    Не планируете ли про трасформеры что-то подобное? RNN-то особо не носят в наше время в продакшене, правильно? :)

  • @user-dc5ku3hy2k
    @user-dc5ku3hy2k Před rokem

    Здравствуйте, можно увеличить количество классов mapping ={1,2,3,4,5....} ?

  • @MEPhIst-economist
    @MEPhIst-economist Před měsícem

    Корректно ли строить словарь на всем объеме данных, а затем тестировать модель, построенную по нему, на части данных, которая участвовала в его построении?

  • @user-to7lv5kp4t
    @user-to7lv5kp4t Před rokem +1

    Здравствуйте! Обратите, пожалуйста, внимание на то, что в плейлисте по SQL перед уроком про агрегатные функции отсутствует видео по GROUP BY

    • @AndreySozykin
      @AndreySozykin  Před rokem

      Да, в видео ошибка. Я его переделаю и снова выложу.

  • @user-co7wd3cv4x
    @user-co7wd3cv4x Před 8 měsíci

    А не хотите ещё с помощью трансформера тональность определить? Декодеры-энкодеры -- сейчас в тренде ! 😀