Парсим товары Ozon с помощью Python

Sdílet
Vložit
  • čas přidán 19. 06. 2024
  • Получаем данные о товарах в формате JSON.
    С июня 2022 этот способ не работает, так как на сайте была установлена защита CloudFlare.
    Поблагодарить и поддержать канал:
    pay.cloudtips.ru/p/118e1f87
    00:00:00 Как ozon подгружает данные
    00:06:13 Отправляем запрос - получаем данные в формате json
    00:08:25 Как искать нужный запрос с помощью *.HAR
    00:13:00 Как из json вытащить нужные данные
    00:26:00 Мудрый совет
    00:29:13 Выгружаем данные в таблицу
    Также в видео - два мудрых совета: как работать медленно, чтобы получать быстрые результаты и что должно быть "результатом" любой работы.
    #ozon #парсинг
    Ссылка на скрипт в видео:
    gist.github.com/DxDiagDx/710a...
    Телеграм-чат про парсинг:
    t.me/proparsing
    Для связи пишите:
    Почта lukin@usota.ru
    WhatsApp +79053311246
    Telegram @lukin_ea
    Профи.ру - profi.ru/profile/LukinEA8/

Komentáře • 81

  • @nickklick5824
    @nickklick5824 Před 2 lety +6

    Евгений, спасибо! Очень нравятся видео на тему парсинга. Продолжайте в том же духе!

    • @usota
      @usota  Před 2 lety +2

      Спасибо ☺️

  • @mihun4ik
    @mihun4ik Před 2 lety +3

    Спасибо за гайд! Будет полезно новичкам как урок для простого реверса

  • @makedatauseful1015
    @makedatauseful1015 Před rokem +2

    Спасибо большое за видео. Вы ответили на многие вопросы.

  • @kyrylo7795
    @kyrylo7795 Před 2 lety +1

    Супер! Было полезно, спасибо!

  • @forzzplay
    @forzzplay Před rokem +2

    Очень круто, спасибо!!!

  • @odinMillion
    @odinMillion Před 2 lety +2

    Ну хоть один человек сделал толковое видео

  • @EvgeniySakharov
    @EvgeniySakharov Před 11 měsíci +2

    Тёзка, здравствуйте. Смотрю видео. Дошел до момента -Вступайте в чат- и вступил.))) 1 156 человек уже в чате. Начал парсить, вопросов куча. Уверен, там помогут. Почему уверен? У меня есть подобный чат по питону. Там всегда ребята помогут. Постебаются, как же без этого?! Но не со зла. Так, смеха ради. Но помогают. А тут еще и парсинг. Так сказать узконаправленный чат. Класс!

  • @bill8126
    @bill8126 Před rokem +1

    Добрый день, отличный контент у Вас, дико недооцененный канал ! Сделайте пожалуйста обучающее видео, как заполнить форму авторизации пост запросом, только не на простеньком сайте, а на каком нибудь популярном, потому что популярные сайты, ставят всякие препоны джаваскриптами и прочим, чтобы это было сделать сложно

  • @user-kk7jz4gs1t
    @user-kk7jz4gs1t Před 2 lety

    спасибо

  • @unknjown
    @unknjown Před 10 měsíci +1

    способ помог, обошел проверку ботов через undetected_chromedriver и сохранил страницу с запросом api как html и через lxml уже все распарсил и получил чистый json

    • @usota
      @usota  Před 10 měsíci

      Отличное решение 👍

    • @user-gk1rn5lm6t
      @user-gk1rn5lm6t Před 10 měsíci

      Только undetected_chromedriver помог? без селениума совсем никак сейчас не распарсить?

    • @unknjown
      @unknjown Před 10 měsíci

      @@user-gk1rn5lm6t без селениума не получилось, так же пытался воспользоваться cloudscraper (requests) и увы не вышло

  • @ihorrible
    @ihorrible Před 7 měsíci

    а сейчас есть рабочие варианты парсить отзывы с Ozon ?

  • @dmitriivanov7010
    @dmitriivanov7010 Před 2 lety

    А как сделать так, чтобы скачивать инфу по множеству товаров?
    И ещё Просьба ответить какой редактор json вы используете, а то на видео не очень понятно. Вс, это вижуал студию?

    • @usota
      @usota  Před 2 lety +1

      Да, VS Code.

    • @dmitriivanov7010
      @dmitriivanov7010 Před 2 lety

      @@usota Евгений, спасибо большое за ответ.
      А есть ли какой-то простой алгоритм парсить json сразу множества товаров. Ну например по товарной группе.

    • @usota
      @usota  Před 2 lety

      Да, алгоритм такой же. Открываем товарную группу и смотрим, по какому запросу отдаётся список товаров.

  • @user-jw7ki8gv8r
    @user-jw7ki8gv8r Před rokem +2

    Потратил несколько дней чтобы понять, что спарсить по этой методе не получится из-за cloudflare , а потом прочёл описание к видео

    • @usota
      @usota  Před rokem +1

      Да, в парсинге постоянно всё меняется. Но это хорошая новость - без работы не останемся )

    • @user-jw7ki8gv8r
      @user-jw7ki8gv8r Před rokem +1

      @@usota ждём видео как обойти))

    • @usota
      @usota  Před rokem +1

      Любое видео по selenium

  • @user-si2sd4nd4x
    @user-si2sd4nd4x Před 2 měsíci +1

    У меня получилось, только я использовал react js никакую защиту не обходил для работы с api использовал axios

  • @TheDoartLos
    @TheDoartLos Před 9 měsíci

    в этом api запросе не нашел одного из самого главного - цены, кто-нибудь в курсе откуда ее вззять?

  • @user-pr7oh2fq5l
    @user-pr7oh2fq5l Před 10 měsíci +1

    Добрый день, скрипт до сих пор актуален? Не удается спарсить таким образом на php curl.

    • @usota
      @usota  Před 10 měsíci

      Прямым запросом уже не получится, сайт обнаруживает скрипт.

    • @user-pr7oh2fq5l
      @user-pr7oh2fq5l Před 10 měsíci

      @@usota спасибо за ответ, есть ли выход?

    • @usota
      @usota  Před 10 měsíci

      К сожалению, в php не знаю. Но мы разбирали этот вопрос в нашем чате t.me/proparsing

    • @user-pr7oh2fq5l
      @user-pr7oh2fq5l Před 10 měsíci

      @@usota большое спасибо!

  • @SashaK-mw6fw
    @SashaK-mw6fw Před rokem +1

    какие плагины вы додавали?

    • @usota
      @usota  Před rokem

      Не понял вопрос, уточните?

  • @kirik_bog
    @kirik_bog Před rokem +1

    На 7:52 выдает ошибку requests.exceptions.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

    • @usota
      @usota  Před rokem

      Этот парсер уже не актуален, причина - в описании. Соответственно, ничего не получив, парсер и выдаёт ошибку)

  • @WrldsporteventsR.Y..V.1992

    подскажите плиз, а если я не вижу значка как у Вас поиск, а только масштаб, что делать? 3:58

    • @usota
      @usota  Před rokem

      Немного не понял вопрос… Окно поиска я вызываю комбинацией клавиш Ctrl + F

    • @WrldsporteventsR.Y..V.1992
      @WrldsporteventsR.Y..V.1992 Před rokem

      @@usota хотел узнать как вызывать окно поиска, благодарю!

    • @usota
      @usota  Před rokem

      В консоли есть иконка фильтра

  • @user-re4pu5sy4u
    @user-re4pu5sy4u Před 2 lety

    Только присоединился к каналу, но пробежал глазами по каналу и немного посмотрел. А нету видео где происходит парсинг двух и более сайтов в одном скрипте?

    • @usota
      @usota  Před 2 lety

      Даже не представляю, когда это может потребоваться. Приведите пример задачи?

    • @user-re4pu5sy4u
      @user-re4pu5sy4u Před 2 lety

      @@usota в моем случае поиск работы по стране (не РФ) так как отсуствует общий агрегатор и присутствует большое количество сайтов представляющие вакансии. Фактически они однообразные по структуре.

    • @usota
      @usota  Před 2 lety +1

      У меня много похожих проектов, но все делаю по одной схеме - под каждый сайт свой парсер с единой базой данных. Так проще обслуживать парсеры. А ломаются они регулярно )

    • @usota
      @usota  Před 2 lety +1

      Сделайте свой агрегатор 😁

    • @HyiPizdaSkovoroda
      @HyiPizdaSkovoroda Před 2 lety +1

      @@usotaнапример агрегатор ставок букмекерских контор, - вилочники за это готовы платить гигантские деньги ))

  • @MarkTheCat
    @MarkTheCat Před 2 lety +1

    Скачал pycharm, установил requests, повторил все в точности по видео - получаю ошибку 1, в тексте ошибки вижу в начале просьбу включить javascript, а дальше по тексту вступает cloudflare и просит ввести капчу
    что нужно сделать/установить/настроить, чтобы повторить тот же самый код, что и у вас на видео (на момент получения сырого json в принте в первой трети видео), чтобы все заработало?

    • @usota
      @usota  Před 2 lety

      Код из видео ещё не знал про блокировку, поэтому нужно доработать, может попробовать Селениум

    • @MarkTheCat
      @MarkTheCat Před 2 lety

      @@usota то есть с момента записи и публикации видео Озон принял меры против парсинга?

    • @usota
      @usota  Před 2 lety

      Да, с 19 мая по моим ощущениям

    • @MarkTheCat
      @MarkTheCat Před 2 lety

      @@usota ждём от вас новый видеоурок 😁

    • @usota
      @usota  Před 2 lety

      Будем разбираться ) Если будут идеи или другие вопросы - пишите в чат по парсингу, там обсуждаем эту тему.

  • @TheStrix1
    @TheStrix1 Před 3 měsíci +1

    так понимаю такими рода запросами не получится пользоваться - озон быстро забанит либо капчу выставит

    • @usota
      @usota  Před 3 měsíci

      Да, этот способ уже не актуальный.

  • @TheStrix1
    @TheStrix1 Před 3 měsíci +1

    хорошо когда ты шаришь (( а я как баран на новые ворота ((

    • @usota
      @usota  Před 2 měsíci

      Поверьте, я тоже знаю чуть больше 1%. Опыт приходит со временем.

  • @user-ee6xm8hj7x
    @user-ee6xm8hj7x Před rokem +1

    The Mezanam

  • @vladmindochin
    @vladmindochin Před rokem +2

    маякните как будет найдено какое-то решение против блокировки

    • @usota
      @usota  Před rokem

      У нас в телеграм-чате есть варианты решений, ссылка есть в описании, присоединяйтесь

  • @user-sn5nm5rm3v
    @user-sn5nm5rm3v Před rokem +1

    Парсинг одного товара - это конечно круто. Но если мне нужно спарсить категорию. А там нужен поиск товаров. Список адресов. Это уже все реально сложнее.

  • @rolandwalker4434
    @rolandwalker4434 Před rokem

    А выйдет видео о том, как обойти эту защиту cloudflare ?

    • @usota
      @usota  Před rokem

      Я думаю не будет. В таких случаях остаётся использовать Селениум. А по селениуму полно видео уже снято, вряд ли я сделаю лучше.

    • @rolandwalker4434
      @rolandwalker4434 Před rokem +1

      @@usota Наверное вы правы, спасибо за ответ

    • @user-xu8ti4zl3n
      @user-xu8ti4zl3n Před 11 měsíci

      @@usota cloufare не обходится sileniumom

    • @usota
      @usota  Před 11 měsíci

      Возможно вы правы.

  • @WrldsporteventsR.Y..V.1992

    не работает почему-то 7:50.

  • @MixaCooL
    @MixaCooL Před rokem +1

    В данный момент данный способ не работает

    • @usota
      @usota  Před rokem +1

      Да, верно - с июня 2022 года сайт защитил доступ к api с помощью CloudFlare.

    • @usota
      @usota  Před rokem

      Отличная идея, спасибо 🙏

  • @GroundStreamTV
    @GroundStreamTV Před 2 lety +1

    Ну хоть один человек сделай толковое видео

  • @canal-bx8wr
    @canal-bx8wr Před 2 měsíci

    вся суть парсинга сводится к тому, как на этом потом легально заработать
    иначе это хобби

    • @usota
      @usota  Před 2 měsíci

      Разве парсинг - это нелегально?

    • @canal-bx8wr
      @canal-bx8wr Před 2 měsíci +1

      @@usota сам парсинг нет, а вот использование того, что вы собрали в коммерческих целях - уже совсем другое.
      одно дело, если вы риэлтор, и собрали для себя свежую инфу автоматически, а если вы это завернули в проект, и продаете базу многим клиентам - это уже вам юристы гигантов объяснят. С авторскими правами і тд. Они живут с платных услуг, которые вы у них отбираете.
      Но все зависит от ваших юристов).
      Если наложат арест на ваше имущество на время рассмотрения в суде, и не будут никуда спешить. Вам это не понравится.
      именно по этому он серый))) и лучше делать это не публично. И именно поэтому парсеры только парсят, и дальше не идут(или говорят что не идут).
      Как и вся муть в телеграм каналах ведь уголовно не наказуемая. Пока вы понемногу стрижете пассивных пользователей. Но когда потери будут у гигантов, сразу найдутся инструменты познакомится с вами)) тоже с серого инструментария.. А дальше у кого шары прочнее. Не каждый умный айтишник - морально крепкий айтишник). Особенно если о нем много информации и рычагов влияния.
      Или поработаете на дядю на его условиях, если вы хороший спец)). Сейчас люди пропадают даже на высоких должностях, а какого там айтишника удалить не сложно.
      Или идти в паблик максимально. Но паблик не про парсинг. Там вашим действиям понимания не будет. А если еще подсветят типа "из-за ваших действий сайт лежал 2 дня", ищите где это опровергнуть(на такую же аудиторию).

    • @usota
      @usota  Před 2 měsíci

      @canal-bx8wr вы правы на 100%. Я к тому, что парсинг - это легально. Использовать данные парсинга в коммерческих целях - тоже легально, если все стороны согласны, как например поставщик, который предоставляет данные по API, например тот же Озон для своих селлеров. Парсинг - это обычный легальный бизнес, как и фермерство. Просто нужно знать, какие растения можно сажать, а от выращивания, обработки и продажи каких лучше отказаться.
      Спасибо за развернутый комментарий.
      Не понял только про паблик. Что значит идти в паблик максимально?

    • @canal-bx8wr
      @canal-bx8wr Před 2 měsíci +1

      @@usota то что поставщик сам дает - это понятно, это детский сад)) но вот если поставщик тратит на защиту от другого парсинга огромные средства, а его данные продают - это уже не хорошо)
      И за это по рукам дают.
      И если пришли уже по бесприделу (не спрашивая законен ли ваш парсинг или нет) - иногда публичность может откатить назад подобный наезд.
      Или вас по тихому закроют, и об этом никто не узнает.
      Но для этого нужны независимые СМИ.