Парсинг сайтов PYTHON

Sdílet
Vložit
  • čas přidán 6. 09. 2024
  • В данном видео мы будем решать прикладную задачу python - парсинг сайта. Поговорим об особенностях парсинга сайта, о коде страницы и анализе данных. Все это мы будем делать в среде разработке jupyter lab.
    tg: @let_s_program

Komentáře • 54

  • @ureisviridov1795
    @ureisviridov1795 Před 17 dny

    Очень подробно, и понятно. Спасибо автору за материал. 🙏🙏🙏

  • @user-wv4wu4nf5p
    @user-wv4wu4nf5p Před 7 měsíci +9

    У меня даже не базовые, а примитивные знания питона. Оказывается если грамотно объяснить, то даже мне все стало понятно. Огромное спасибо!

    • @let_s_program
      @let_s_program  Před 7 měsíci +1

      Спсаибо за такой комментарий!

  • @Naxfit
    @Naxfit Před 7 měsíci +3

    Посмотрел на одном дыхании. Очень доходчиво объясняете. Спасибо!

  • @user-yu1fw6pe1q
    @user-yu1fw6pe1q Před 5 měsíci

    Спасибо большое, не нашел никого кто объяснил бы лучше вас.

    • @let_s_program
      @let_s_program  Před 4 měsíci

      Спасибо за комментарий! Скоро видео по тг-боту)

  • @fooosters
    @fooosters Před 7 měsíci

    Отдельное спасибо за такие подробные объяснения!

  • @AA-zk1si
    @AA-zk1si Před 4 měsíci

    Как раз бился над проблемой одинаковых тегов и как убрать пробелы перед конечным результатом. Видос супер!

    • @let_s_program
      @let_s_program  Před 4 měsíci +1

      Спасибо большое! Рад, что помог

  • @user-danche
    @user-danche Před 8 měsíci +2

    Объясняете интересно и понятно, единственное, что хотелось бы меньше слышать это заполнение паузы звуком 'аа'. Ставлю лайк 😊

    • @let_s_program
      @let_s_program  Před 8 měsíci

      Спасибо за Ваш комментарий! Буду стараться обращать на это внимание при записи

    • @whosane9923
      @whosane9923 Před 7 měsíci

      ​@@let_s_programда это легко на монтаже убирается, прям из коробки функция у многих

    • @let_s_program
      @let_s_program  Před 7 měsíci

      в последнем видео убрал все лишние звуки)@@whosane9923

  • @user-yq8kt1th9z
    @user-yq8kt1th9z Před 7 měsíci

    Офигенно! Жду с нетерпением следующие видео

  • @FgSOKlSSM3suGkza1089
    @FgSOKlSSM3suGkza1089 Před 6 měsíci +2

    хотел написать гневный пост про забивание гвоздей микроскопом в извращенной форме (это про обработку тегов как строк), но выше уже все написали))
    а разбор работы range в видео парсинга... это как на лекции по ядерной физике рассказывать таблицу умножения)

    • @let_s_program
      @let_s_program  Před 6 měsíci

      Спасибо за ваш комментарий! Да, безусловно, способы в видео не самые оптимальные. Единственное, что стоит отметить, что это видео для самых-самых новичков. И может где-то я действительно уходил в дебри)

    • @FgSOKlSSM3suGkza1089
      @FgSOKlSSM3suGkza1089 Před 6 měsíci +1

      @@let_s_program извините, не хотел никоим образом обидеть. ваше видео уже помогло многим людям, судя по комментариям. прошу счесть мой несколько саркастичный комментарий простым советом по улучшению будущих видео)

  • @pubgmabail3041
    @pubgmabail3041 Před 5 měsíci +1

    Ееееа харошое видео еееееа но много еееееа

    • @let_s_program
      @let_s_program  Před 5 měsíci

      Спасибо за комментарий! В следующих видео этого меньше

    • @tworall6282
      @tworall6282 Před 5 měsíci

      Согласен! Без еееееее было бы идеально)))

  • @MauwTong
    @MauwTong Před 6 měsíci +1

    Интересно

  • @user-nx7cq1wy3f
    @user-nx7cq1wy3f Před 2 měsíci

    зачем на 17 минуте приводить в тип list, если find_all и так возвращает список по умолчанию...

  • @l1acdy
    @l1acdy Před 4 měsíci

    *Можно поставить таймкоды в описание, вот так: "5:00 - Название". Тогда видео можно будет удобно перематывать, так как таймкоды будут отображаться над полосой просмотра

    • @let_s_program
      @let_s_program  Před 4 měsíci

      Спасибо, попробую!

    • @l1acdy
      @l1acdy Před 4 měsíci

      ​@@let_s_programЯ ошибся немного ┐('~`;)┌. Там без дефиса

  • @CodeStarter
    @CodeStarter Před 3 měsíci

    ааааааааааааааааааааааааааааааааааааааааааааааааааааааа

  • @arthurbaghramian143
    @arthurbaghramian143 Před 7 měsíci

    Можно было еще с середины переместить с помощью lstrip() и не замарачиваться))

  • @AITradingLab
    @AITradingLab Před 3 měsíci

    привет, думаю для новичков было бы интересно узнать как установить на комп сам jupiter lab, а потом уже объяснять как с ним работать. Можно, конечно найти эти видосы и на других каналах, но зачем отдавать свою аудиторию другим???

    • @let_s_program
      @let_s_program  Před 3 měsíci +1

      Добрый день! В следующем видео расскажу про этот момент! Спасибо за обратную связь

  • @Figase
    @Figase Před 6 měsíci

    Лучше в Нетворк посмотреть откуда данные приходят и чаще всего в json можно вытащить все данные без ненужного парсинга

  • @circuit55
    @circuit55 Před 7 měsíci

    perfect dude!

  • @SenSei_RB
    @SenSei_RB Před 7 měsíci

    После нескольких попыток выдало ошибку ... До этого всё работало! Я так понимаю превысил кол-во запросов... :(

    • @let_s_program
      @let_s_program  Před 7 měsíci

      Да, скороее всего. То есть если смотреть описание ошибки, то она близка к "ограничению прав доступа"

  • @user-og6sp3ov1h
    @user-og6sp3ov1h Před 5 měsíci

    Парень продолжай тему Парсинга !) спасибо тебе !

    • @let_s_program
      @let_s_program  Před 5 měsíci

      Спасибо! Как победю диплом - сразу в бой)

  • @tulur
    @tulur Před 5 měsíci

    Столько воды пипец. открываем... наводим... вообще то существует специальная панель для выделения элементов на странице. И в целом если человек знает и ищет возможность и способы парсить сайты это подразумевает под собой как минимум знание о том что такое теги и разметка страниц. За инфу в целом спасибо. Мне как раз нужна была информация, по парсингу на питоне. Хотя в нем я нооб)

    • @let_s_program
      @let_s_program  Před 5 měsíci +1

      Спасибо за комментарий! Это самое первое видео на канале, поэтому я еще подбираю формат. В следующих видео немного скорректировался.

  • @gfertr234r
    @gfertr234r Před 7 měsíci

    здравствуйте, можно ваш тг

    • @let_s_program
      @let_s_program  Před 7 měsíci

      Добрый день! t.me/let_s_program

  • @user-dt7rp9hr9v
    @user-dt7rp9hr9v Před 5 měsíci

    Вы забыли про кодировки, а то иногда такая вот ��� фигня лезет.

    • @let_s_program
      @let_s_program  Před 5 měsíci

      Добрый день! Хорошее замечание

  • @ivankislitsin7861
    @ivankislitsin7861 Před 6 měsíci

    Это все интересно, только данные методы устарели в 2000 году ))) Вот ответ "Response [406]"

    • @let_s_program
      @let_s_program  Před 5 měsíci

      Да, можно подобрать более современный метод! Напишите, какой используете вы

  • @art_alf-b9b
    @art_alf-b9b Před 6 měsíci

    где код?!

    • @let_s_program
      @let_s_program  Před 5 měsíci +1

      Добрый день! ТГ-канал t.me/let_s_program

  • @user-ss1rl9sy9e
    @user-ss1rl9sy9e Před 8 měsíci +1

    Я так сделал:
    names = [data[i].text.strip('
    ').strip(' ').strip('
    ') for i in range(len(data))]

  • @user-jg9tm2nn5s
    @user-jg9tm2nn5s Před 7 měsíci +1

    в цикле можно было не играться со строками, а просто написать print(tmp_str.text)

    • @Sky_Lib
      @Sky_Lib Před 7 měsíci

      Согласен так проще,но иногда хочеться сделать свой алгоритм ∠( ᐛ 」∠)_

    • @yrmisi
      @yrmisi Před 7 měsíci

      я тоже посмотрел видео и подумал об этом) зачем усложнять)))