PySpark tuto 1 : Ingestion, Manipulation et Analyse d'un grand volume de données | Big Data

Sdílet
Vložit
  • čas přidán 17. 03. 2024
  • Dans le paysage actuel de l'analyse de données en entreprise, la manipulation et l'analyse de gros volumes de données #bigdata sont devenus monnaie courante. C'est là que #pyspark entre en jeu. PySpark est un outil puissant qui offre une solution efficace pour travailler avec des ensembles de données massifs, et c'est pourquoi il est devenu indispensable pour tout professionnel des données.
    Que vous soyez un #datascientist, un #dataanalyst, un #dataengineer ou un développeur, maîtriser PySpark ouvre un monde de possibilités dans le domaine de l'analyse de données. En effet, être capable de manipuler et d'analyser de gros volumes de données en utilisant PySpark vous donne un avantage concurrentiel indéniable sur le marché du travail.
    Dans cette vidéo, nous plongerons dans les bases de PySpark, en explorant ses fonctionnalités essentielles pour la manipulation et l'analyse des données. Que vous soyez débutant ou que vous cherchiez à approfondir vos connaissances, cette vidéo vous fournira les bases nécessaires pour démarrer avec PySpark et vous préparer à manipuler efficacement de gros volumes de données en entreprise.
    Le contenu de cette vidéo provient de mon livre 𝐏𝐲𝐒𝐩𝐚𝐫𝐤 𝐞𝐧 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞: 𝐂𝐚𝐬 𝐝'𝐮𝐬𝐚𝐠𝐞𝐬 𝐫𝐞́𝐞𝐥𝐬 𝐞𝐭 𝐞𝐱𝐞𝐦𝐩𝐥𝐞𝐬 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞𝐬 𝐞𝐧 𝐃𝐚𝐭𝐚 𝐒𝐜𝐢𝐞𝐧𝐜𝐞 𝐞𝐭 𝐌𝐚𝐜𝐡𝐢𝐧𝐞 𝐋𝐞𝐚𝐫𝐧𝐢𝐧𝐠 dont vous pouvez acheter la version papier via ce lien : www.amazon.fr/dp/B0C9K6GTNH?r... ou la version PDF via ce lien : afoudajosue.gumroad.com/l/yeatg
    Voici la vidéo de présentation de PySpark et du contenu du livre : • PySpark en pratique : ...
    Source des données : data.cityofchicago.org/Public...
    Lien pour télécharger directement les données : data.cityofchicago.org/api/vi...
    Lien du Notebook : github.com/JosueAfouda/Pyspar...
    𝑽𝒐𝒖𝒔 𝒂𝒗𝒆𝒛 𝒕𝒐𝒖𝒔 𝒍𝒆𝒔 𝒅𝒆́𝒕𝒂𝒊𝒍𝒔, 𝒄𝒐𝒎𝒎𝒆𝒏𝒕𝒂𝒊𝒓𝒆𝒔 𝒂𝒊𝒏𝒔𝒊 𝒒𝒖𝒆 𝒍𝒆𝒔 𝒆𝒙𝒑𝒍𝒊𝒄𝒂𝒕𝒊𝒐𝒏𝒔 𝒅𝒖 𝒄𝒐𝒅𝒆 𝒅𝒂𝒏𝒔 𝒍𝒆 𝒍𝒊𝒗𝒓𝒆.
    Merci de vous abonner à ma chaîne CZcams / @realprodatascience et à ma page #linkedin : / josu%c3%a9-afouda

Komentáře • 7

  • @fabricekra1418
    @fabricekra1418 Před 2 měsíci

    Merci à vous monsieur

  • @billessomba1212
    @billessomba1212 Před 3 měsíci

    Merci beaucoup. Pourrais tu faire d'autres vidéos sur Pyspark et si possible un tutoriel Kafka?

  • @RealProDatascience
    @RealProDatascience  Před 3 měsíci

    Le contenu de cette vidéo provient de mon livre 𝐏𝐲𝐒𝐩𝐚𝐫𝐤 𝐞𝐧 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞: 𝐂𝐚𝐬 𝐝'𝐮𝐬𝐚𝐠𝐞𝐬 𝐫𝐞́𝐞𝐥𝐬 𝐞𝐭 𝐞𝐱𝐞𝐦𝐩𝐥𝐞𝐬 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞𝐬 𝐞𝐧 𝐃𝐚𝐭𝐚 𝐒𝐜𝐢𝐞𝐧𝐜𝐞 𝐞𝐭 𝐌𝐚𝐜𝐡𝐢𝐧𝐞 𝐋𝐞𝐚𝐫𝐧𝐢𝐧𝐠 dont vous pouvez acheter la version papier via ce lien : www.amazon.fr/dp/B0C9K6GTNH?ref_=ast_author_ofdp ou la version PDF via ce lien : afoudajosue.gumroad.com/l/yeatg

    • @dongmoazafack2130
      @dongmoazafack2130 Před 3 měsíci

      Salut Josue j’espère que tu vas bien!
      Comment faire pour entrer en contact avec toi

  • @user-zr2ir9yz4w
    @user-zr2ir9yz4w Před 3 měsíci

    Bonjour!
    Vraiment une très belle vidéo
    comment pouvons nous implémenter nos modèles du deep learning sous pyspark?
    ça va m'aider. je me dis aussi qu'on peut utiliser GPU sous colab pour aller plus vite

  • @abdoulayediole460
    @abdoulayediole460 Před 3 měsíci +1

    Bonsoir M Afouda, merci pour tout l’effort. Au fait un ami qui réside en France m’a acheté le livre pyspark la version kindle, mais j’arrive pas à y accéder depuis le maroc. Est-ce qu’il ya un autre moyen, pour que je puis en profiter? Merci

    • @RealProDatascience
      @RealProDatascience  Před 3 měsíci

      Allez regarder dans la description de la vidéo. Vous trouverez le lien d'achat de la version PDF