Les bases de la data science avec Python
Vložit
- čas přidán 9. 07. 2024
- Dans cette vidéo, je vous montre toutes les bases de la data science avec Python et la bibliothèque pandas. Lecture d'un fichier CSV, analyse des données, ajout et suppression et traitement des données ainsi que l'affichage de graphiques avec matplotlib. Après cette formation, vous serez en mesure de faire parler les chiffres de vos dataframes grâce à des fonctions très faciles à prendre en main de pandas et matplotlib.
🔗 Fichiers sources
● github.com/DocstringFr/les-ba...
🔗 La formation en entier sur Docstring
● www.docstring.fr/formations/l...
👨💻 Apprends Python
● www.docstring.fr/formations/?...
📖 Les articles du blog
● www.docstring.fr/blog/?...
🎙Écoute le Podcast
● www.docstring.fr/podcast/?utm...
💬 Rejoins le serveur Discord
● www.docstring.fr/discord/?utm...
Chapitres
00:00:00 Introduction
00:00:33 Introduction à la formation
00:02:25 Qu'est-ce que la science des données ?
00:08:29 WINDOWS : Configuration de Jupyter Lab
00:12:27 MAC OS : Configuration de Jupyter Lab
00:16:05 Lire un fichier CSV avec pandas
00:22:21 Analyser le dataframe
00:29:44 Sélectionner des données
00:39:10 Les filtres
00:47:59 Supprimer une colonne
00:52:53 Traiter les valeurs manquantes
01:00:13 Ajouter des colonnes
01:07:53 Analyser les données
01:19:23 Installation de matplotlib
01:20:40 Tracer une courbe
01:23:23 D'autres types de graphiques
Merci bcp pour la clarté et la pertinence de vos présentations
Très beau Tuto, très pratique pour une révision rapide!!
Encore merci!
Coucou ! Franchement t’es un super prof , tu explique trop bien, J’attends la suite avec impatience ... je veux apprendre à faire des calculs avancer !
Superbe video Docstring, merci!
Tuto efficace et clair, merci :)
Très bon cours, un professeur très pédagogue : Nice Job
Merci Docstring pour ce bon resumer de l analyse data science.
Cours très intéressant et très clair, félicitations! Un petit hic sur la formule mathématique qui permet de passer du prix TTC au prix HT, en effet il faut dans ce cas diviser par le coeff = (1+Taux) et non multiplier par le coeff =(1-Taux) comme cela a été présenté dans cette vidéo 😳 cela ne donne pas le même résultat....
Bravo pour ta qualité pédagogique, excellente formation, mes respects :)
Excellente tuto ça m'a vraiment aidé, merci beaucoup
J'aime vos tutos.
Vs êtes le meilleur.
Mes Respects
Excellente tuto ça m'a vraiment aidé mille merci
Vraiment top ce tuto, merci !!!
Excellent tutoriel. Merci et bonne continuation
Merci pour ce contenu très utile et super bien expliqué ! (y)
Merci beaucoup pour ce très beau tuto :)
Géniale cette vidéo . Un grand MERCI.
Franchement rien à dire sur cette vidéo enfin si elle est tout simplement géniale 🙌🏽
Superbe video, un grand merci, je commence à mieux comprendre pandas et ca fait du bien.
Génial! Merci pour toute l'aide que vous nous apportez à travers ces merveilleux cours!
Ça fait plaisir 😊
@@Docstring Vidéo impeccable, très pédagogique et illustrée, bravo
franchement c'est un cours très pédagogique et bien explicite
Merci pour cette formation très explicite
C'est décidé,je me mets à fond sur python. Une fois les bases acquises ici. J'achèterais toutes tes formations les yeux fermés
Merci et bonne formation !
Merci t'es un super prof, tu expliques d'une manière très spéciale : )
Mercii 😌😊🥳
tes contenus gratuits sont tellement didactiques et agréables à apprendre, c'est décidé j'achète tes formations pour bénéficier aux max des connaissances et compétences.
Merci pour ton soutien Abel et bonne formation !
juste le debut de la video me seduit
merci vraiment
Merci pour l'explication et la simplicité ...
Très pédagogique. Merci bien
Trop bien détaillé 👏👏 un grand merci à vous 🙏 🙏 🙏
😊😊😊
Excellent tuto, merci pour votre travail 🙏
Merci !
Merci bcp , vraiment c'est superbe
Superbe vidéo merci ☺️
C'était super intéressant, merci beaucoup
Merci, bonne continuation !
Tu es un As !!
Très bien expliqué
J'en reviens pas que ce contenu soit gratuit ! Bonne vidéo
Merci pour cette vidéo
bravo un tres bon tuto
print("merci cette chaine merite d'etre connu , beau travail encore une fois merci")
Merci !! Pour ça aucun secret : partagez la vidéo partout autour de vous, mettez des pouces bleus, des commentaires, abonnez-vous etc etc ^^
Excellente vidéo. J'ai acheté plusieurs formations sur Udemy traitant de la programmation python et la votre est de loin celle que je préfère.
Merci beaucoup Bertrand !
claire et limpide
merci
Merci tres explicite
j'adore merci bcp
wonderfull Job that helps a lot
j'aime ta manière de faire et ta pédagogie, j'ai acheté ta formation sur UDEMY et je ne regrette pas c'est simple et clair, reste à pratiquer bien sur.
Je ne vais pas faire le gourmand mais je serai assez intéressé par du contenu en data science. ;)
Merci ! Content de voir que la pédagogie te plait. Pour l’instant je n’ai que cette formation d’introduction mais j’ai prévu plus de contenu sur le sujet en 2022 :)
Merci pour la bonne prononciation des termes anglais!
Certains me le reproche... content de voir que d'autres apprécient :) Merci !
Une mine d'or cette vidéo, je vais acheter tes formations sur udemy. Merci vraiment
Mercii ! Bonne formation !
Très cool mon prof
Slt, alors franchement j'avais super peur de me lancer dans ce domaine =, mais avec ta vidéo, j'ai découvert la data science sous un meilleur angle. Merci!!
😍 Merci pour ton commentaire et bonne continuation !!
Tu viens de me donner le goût d'apprendre la data sans avoir une base en mathématique. Je me sens capable de le faire. Merci beaucoup
Bonjour monsieur Ngoulou
@@soka2334 bonjour comment allez-vous ? que puis-je faire pour vous?
Waouh, Mec tu m'erite le million d'abonné
Faut partager les vidéos le plus possible pour y arriver 😄 Merci !
very good video
Très bonne vidéo d’initiation. Pour quand la suite?
merci 🙏
Bonjour Thibault,
Je suis vos cours sur Udemy et CZcams,
Le carnet Jupyter s'affiche partiellement en français.
J'utilise Jupyter pour la programmation Python sur Windows 10 et une partie du texte est traduit en français mais pas tout
par exemple: si j'exécute le code ci-dessous, ca m'affiche "ONU" pour les Etats-Unis et "maman" pour le Maroc
Merci pour toute l'aide que vous nous apportez à travers ces merveilleux cours :
countries = {"United States":"UN", "France":"FR", "Canada":"CA", "Morocco":"MA"}
df["country_code"] = df["country"].map(countries)
merci bcp
Top vidép :)
thanks alot.
super génial
Super merci 😊 !!
felicitation
Bonjour Monsieur,non votre explication a été super pour moi franchement,merci et remercie
Avec plaisir ^^
franchement Bravo, c'est possible de nous faire des cours sur les chat bot avec les machine Learning s'il vous plait ?
Très bonne méthode d'explications. Merci de la part d'un prof de mathematiques
Faites nous encore une vidéo sur numpy,Searborn et pourquoi pas d’autres bibliothèques de data science
Bonjour,j'ai une question.
Quelle est la différence entre Business data analyst et data scientist analyst ?
Merci.
Hello Thibault
Merci beaucoup pour cette formation mais je n'arrive pas à télécharger les fichiers.
Merci de m'aider si possible
Superbe vidéo, merci pour ce contenu. Il y aura-il une suite ???
Si vous mettez des pouces bleus, oui 😆
@@Docstring c'est déjà fait. Dommage que je ne puisse en mettre plus.
@@fernandtape9363 tu peux partager la vidéo autour de toi, ça aide beaucoup aussi ! Parles en a tes amis, sur LinkedIn, Twitter, Facebook ! Ça fait effet boule de neige rapidement !
Bonsoir je voudrais savoir comment on fait pour télécharger les fichiers et merci pour les cours.
Merci pour cet effort !
Gitbach, je l'installe ou comment?
Je suis sur Windows ?
Bravo pr ce magnifique tuto !Vous êtes très doué à transmettre l information.. sinon je voulais savoir comment extraire les motifs fréquents dans des séries temporelles si vous avez une idée ?
Merci Yasmine ! Pour répondre à ta question je te conseille de regarder les expressions régulières :)
tu parles de la désaisonnalisation ?
Bonjour je suis étudiant en 2ème année en cycle d'ingénieur en informatique je m'intéresse énormément à la data science premièrement je vous remercie pour la vidéo. Ma requête est la suivante est-ce possible d'avoir une vidéo sur ACP AFD aussi ? Merci beaucoup
Bonjour, je n'arrive pas à télécharger les fichiers sources : en cliquant sur "télécharger", un code source apparait sur une page blanche, rien de plus. Comment puis-je télécharger les fichiers sources que vous avez mis dans les descriptions de la vidéo ?
Bonjour Cédric,
Cliquez sur le bouton vert 'Code' et vous aurez l'option de télécharger le dépôt Git au format Zip (Download ZIP).
🙏❤
Bonjour l’Équipe de Docstring !
j'ai besoin d'un déblocage à un problème de ce genre "File Load Error for bb.csv
C:\Users\PC\Desktop\bassiroudata\bb.csv is not UTF-8 encoded"
bonsoir, j'aimerais utiliser django rest pour developper une api mais je ne sait pas trop comment faire
ont fait comment pour installer git bash correctement, car si git bash est mal installé ont peut rien faire .
Merci excellente vidéo ! par contre je pense qu'il y a une faute a 1:04:10 car dans cet exemple price_paid c'est le prix TTC payé par le client et il faut calculer le prixHT : on a Prix TTC = PrixHT *( 1 + TAX/100) et donc PrixHT = PrixTTC/( 1 + TAX/100) , on doit mettre alors
df["prix_HT] = df["price_paid]/(1+df["tax"]/100)
merci
Oui effectivement la formule n'est pas bonne mais le but était juste de montrer comment faire un calcul x) mais oui la TVA ne se calcule pas comme ça (mais j'espère que personne ne se base sur cette vidéo pour calculer sa tva 😄)
@@Docstring merci bonne continuation et bravo pour ces vidéos gratuits mais de très grande qualité grâce à vous beaucoup de gens comme moi retrouvent le goût pour la programmatio
merci encore
Bonjour merci pour cette formation. je n'arrive pas a telecharger les fichiers sources pouvez vous me guider svp
bonjour professeur. juste savoir si je suis obligé de suivre votre formation complète avant d'assimiler cette formation ?
Si tu n'as aucune connaissance en Python, oui !
Bonjour, d'abord merci pour toutes les aides que vous nous apporter à travers ces vidéos très instructifs. Mais j'aimerais savoir comment publier tous ces résultats en PDF ou en fichier Excel pour présenter à son supérieur par exemple dans le cadre du travail. Merci d'avance
Vous pouvez prendre votre notebook jupyter et faire, dans votre navigateur, une impression pour obtenir un .pdf.
Également, vous pouvez enregistrer votre notebook sous forme d'un .html: vous aurez alors toutes les figures faites avec matplotlib exportées sous forme de fichiers bitmap dans le sous-répertoire du même nom que le fichier .html généré.
Libre à vous d'aller prendre ces images et de les mettre dans n'importe quel programme, tableur, traitement de texte, etc.
Et le bon vieux copier-coller marche aussi très bien.
Il me semble qu'il y a un souci dans l'exemple de la création de colonne (transformation des prix TTC en HT) ; une sombre histoire de produit en croix lol.
Aussi, choisir le code "UN" pour les état Unis pourrait porter à confusion. L'ISO préfère le code "US", pour réserver "UN" aux Nations unies.
Mais ça n'a pas vraiment d'importance sur le sujet des fonctionnalités de Pandas 😅 Donc, très bon tuto, félicitations. Il est vraiment pratique et parfaitement clair. Ça sert beaucoup, merci.
Tchuss.
Oui effectivement il faut diviser par 1.2, j’ai mal fait le calcul « on the fly » x)
Bien vu pour le US aussi ;) merci !
@@Docstring Au plaisir :) Mais apparemment, je n'étais pas le premier à remarquer cela. Donc deso pour la lourdeur ! je ne voulais pas "troller".
salut, j'arrive pas à télécharger les fichiers en question sur le site....
Clique sur le bouton vert "Code" et ensuite sur "Download ZIP"
salut . comment faire un CSV avec SC.textfile ?
Bonjour je reçois des erreurs sr jupyterlab: permission denied pouvez-vous m’aider à résoudre ce problème svp
Svp j'arrive pas à télécharger les fichiers source
salut j'ai commencer a suivre ton tuto hier et je voulais continuer aujourd'hui mais aucune commande ne marche cela me marque message d'erreur aurais-tu une solution
df.groupby(["gender","country"]).sum() fonctionne mais avec des colonnes en plus (y compris Dates). Erreur avec .mean(), car les dates posent problème de même que les noms... Pourquoi python veut les intégrer dans un calcul ?
Bonjour merci beaucoup pour tes vidéos. J'ai un projet que je dois réaliser. Il faut prédire le prix d'une maison aux Etats-Unis, pour l'instant je ne sais pas vraiment commencer, si tu pouvais me donner des pistes. Surtout savoir si la transformation des variables catégorielles en variables numérique peut changer la prédiction? Merci par avance
c'est bon , j'ai réussi à l'avoir....Merci beaucoup monsieur......
Merci bcp pour cette vidéo. Il y a un truc que je ne comprends pas. Tout cela est faisable assez facilement avec excel. Quel est la plus value de Python pour ce type de travaux ? Merci encore !
Tu peux automatiser tout ça beaucoup plus facilement. Télécharger automatiquement des fichiers, appliquer un traitement, mettre ça sur un serveur, créer des rapports. Potentiellement possible avec Excel aussi j'imagine via des macros.. en soi rien n'est impossible à qui se donne les moyens, mais le fait de pouvoir le faire en programmation t'ouvre souvent beaucoup de portes ou te simplifie la vie sur certaines choses. Possible aussi notamment de traiter des volumes de données gigantesques (pas sûr ce que ça donne niveau performance avec Excel quand tu dois créer une formule sur un tableau de 100 millions de lignes).
on peut utiliser Vscode a la place de jupyter?
Possible mais je conseille fortement Jupyter notebook pour tout ce qui touche à la data science.
Excellente vidéo. C'est pas comme utiliser un tableur, par hasard ?
Un peu, mais de façon, je trouve, beaucoup plus souple et puissante !
Et encore là on fait juste effleurer la surface de ce qu’il est possible de faire !
@@Docstring D'accord merci beaucoup
est-ce obligatoire d'avoir jupyter, pouvons nous le faire juste avec un editeur normal comme pycharm ?
Pour de la data science jupyter est bien plus pratique. Tu peux faire tes scripts dans PyCharm mais ça va être beaucoup plus pénible pour voir le résultat.
Après tu as la possibilité maintenant dans beaucoup d’éditeurs d’avoir des notebook jupyter mais ça revient au meme du coup, ça sera quand même dans le style « notebook »
@@Docstring ok merci 😁👌
Merci pour le contenu très intéressent, je n'ai pas réussie à faire les moyenne "df.groupby(["gender", "country",]).mean()" cela me renvoi une erreur, si je fais la somme ça fonctionne mais il m'affiche tout le DF. Et ça viens de la par ce qu'il me dit qu'il ne peux pas convertir certaine donnée en numérique notamment les nom et les dates, je vais voir de mon côté si je trouve des réponses, mais c'était très instructif merci encore.
Même problème pour moi cc : @docstring . Il y avait sans doute des choses à faire en amont ?
svp ou est le fichier csv
Tes vidéos sont vraiment parfaites. Merci infiniment!
Juste une remarque: pour obtenir le prix hors taxe, il faut diviser par 1+"taux taxe"/100 et pas multiplier par 1-"taux taxe"/100 ;)
Bonjour @Nicolas,
Le prix qu'on paie comporten la taxe et le vrai prix du produit HT, donc pour savoir le prix HT, faut soustraire la taxe qui est de 20% dans ce cas. Le calcul me semble bon.
@@amirouchebrahim3985 la taxe payé est sur le prix HT pas sur le prix TTC.
la TVA à 20% correspond donc à 20/120 du prix TTC
Simplement : un article TTC à 120 € coute 100€ HT, la TVA étant de 20€soit 20% de 100€
Bonjour j'ai un message d'erreur pour la création du dossier mkdir accès refusé
Si tu es sur Windows lance ton terminal en tant qu’administrateur.
@@Docstring merci pour votre efficacité , c'est très professionnel de votre part et tout marche bien jusqu'à présent
cc les fichiers data.csv et ....... seront téléchargé où?
Le lien est dans la description..
github.com/DocstringFr/les-bases-de-la-data-science
🙂
Tu es un fervent défenseur de Pycharm. Est-ce que tu pourrais faire la même chose sur Pycharm?
Bonjour, Serait-il possible de montrer la configurations de jupyter sous Linux svp ?? Merci pour votre aide
Salut ! C’est pareil que sur Mac OS :
www.docstring.fr/formations/les-bases-de-la-data-science-avec-pandas/configuration-de-jupyter-lab-sur-linux-1494/
@@Docstring Merci. Il met commanden introuvable pour jupyter-lab.
@@Pablo-qb2hw essaie juste jupyter ou jupyter-notebook. Et relance ton terminal.
@@Docstring Marche pas 😅
@@Pablo-qb2hw rejoins nous sur le Discord, trop dur de debugger sur CZcams.. 😕