Comment construire un modèle de Machine Learning avec Python et Scikit-Learn | Tutoriel complet
Vložit
- čas přidán 28. 01. 2021
- La construction d'un modèle de Machine Learning est tout un art. Dans cette vidéo, je vous montre les étapes rigoureusement à suivre lorsqu'on construit un modèle de machine learning. A travers ce tutoriel, vous apprendrez entres autres à :
- nettoyer vos données (gestion des valeurs manquantes et gestion des valeurs aberrantes) via des techniques simples et efficaces ;
- diviser votre ensemble de données en données d'entraînement, de validation et de test ;
- résoudre le problème de déséquilibre de classe rencontré dans les tâches de classification automatique à partir des méthodes de sur-échantillonnage et de sous-échantillonnage ;
- sélectionner les meilleurs prédicteurs pour vos algorithmes ;
- construire différents modèles à partir de divers algorithmes de machine learning (régression logistique, forêt aléatoire, SVM, etc.
- évaluer les performances des modèles construits ;
- choisir le meilleur modèle sur la base d'une métrique bien définie ;
- évaluer la performance du modèle choisi sur les données de test.
✅ Notebook : github.com/JosueAfouda/TUTORI...
✅ Merci de partager cette vidéo et vous abonner à ma chaîne CZcams : / @realprodatascience
✅ Lien de mon livre "Machine Learning par la pratique : Projets réels dans les Finances, l'Immobilier, le Trading, la Santé, le Marketing, etc. www.amazon.fr/gp/product/B08D...
Vous pouvez aussi me contacter par mail : j.a.datatech.consulting@gmail.com
En tout cas ce tuto m'a beaucoup aidé. Je suis en master II en Ingenering data, franchement cette vidéo m'a permis de maitriser beaucoup de concept flou du cours. Je la répète plusieurs fois. Merci encoure
Trop intéressant. Merci beaucoup. Ce week-end je n'ai fait que voir vos vidéos. C'est TOP. Je commandé votre livre ML.
Très clair et pédagogique.Merci mille fois
Très pédagogique et vraiment merci car grâce a cet tutoriel j'ais saisir plein de choses qui était vraiment flou dans ma tête .
Je suis très ravis de ce tuto. Merci maestro
Merci beaucoup notre cher Africain qui pense à ses frères
Merci beaucoup. Une vidéo de bonne qualité.
Après avoir regardé la vidéo. La pédagogie m’a convaincu. J’ai commandé deux de vos livres : statistiques et machine learning. Vous m’avez bien fait rire à 1:14:30. Bonne continuation. Et plus de vidéo avec python serait cool. J’aimerais rentrer en contact avec vous.
Très intéressant et bien expliqué. Merci
Merci infiniment pour le partage de savoir. C'est une formation riche et bien rendue. Toutes mes félicitations pour l'excellente présentation.
Merci beaucoup la vidéo est très intéressante et complète et merci aussi pour le partage c'est gentil.
bravo pour cette vidéo détaillée 👏🏼
Super, je l'avais déjà fait avec R je vais tenter avec Python grâce à ce tuto. Merci
Avec plaisir 🙂
Merci beaucoup pour cette vidéo vraiment riche, je suis débutant dans ce domaine et je travaille sur l'investigation numérique sur les logs système, avec cette présentation
j'ai après beaucoups d'information, et j'aimerais bien avoir quelques vos orientations sur mon sujet si c'est possible. Cordialement
Merci je la partagerai à tout le monde car c'est intéressant
SUPER. Merci à vous.
Bonjour monsieur, félicitations votre vidéo est juste phénoménale. Pouvez vous faire une vidéo sur les étapes à suivre pour réaliser une application shiny
Je vais lancer une formation sur Shiny sur mon site web dans la semaine du 8 mars. afouda-datascience.com/
Merci pour cette vidéo intéressant, très bien adapté, simple et précis.
> Par contre, je remarque sauf erreur de ma part que à la minute (1:15:13) dans le calcul de l'interquartile, tu as confondu 0.75 avec 0.55 dans le formule pour l'age
> Et aussi, je tien à préciser aussi que si une distribution n'est pas normale, l'idée d'utiliser ma moyenne pour le remplacement des valeurs manquantes n'est pas adapté mieux vaut la median (c'est plus prudent)
merci pour ce beau travail
Merci à vous
Excellent.
merci beacoup
Great thanks
Merci
bravo bravo
merci bcp pour cette video . je voulais juste savoir quel serez la methode de resampling si notre target comportée 3 classes par exemple
Réponse dans cette vidéo : czcams.com/video/WWyg5r7dIIU/video.html
merci pour cette belle vidéo, svp vous avez travaillé par quel logiciel jupyter ?
J'ai utilisé jupyter notebook de Anaconda
Merci beaucoup ! Pourriez-vous m'indiquer pourquoi a 2:01:30, on a rf.fit(X_train, y_train_up) ? On aurait pu/du utiliser X_train_up ? Merci d'avancer !!
Edit : Tu l'as edit un peu plus tard, my bad :)
Bonjour Monsieur! Je viens de découvrir cet excellent cours, que je regarde avec beaucoup t’attention. Il est très claire, j’aime votre pédagogie. J’ai partagé cette vidéo à mes amis, tout en les joignant à s’abonner à la chaîne. J’en profite pour poser une question : s’agissant des données manquantes, puisqu’on connaît un peu mieux la structure de cette base de données et ses variables, aurait-on pu remplacer les valeurs manquantes du champ « age » par la médiane en fonction de la répartition selon le champ « pclass »? Par exemple, les valeurs de l’âge manquantes pour la première classe seraient remplacées par l’âge médian de la classe 1, ainsi de suite. Merci d’avance pour votre réponse.
Oui Éric, c'est possible de le faire. Gardez en esprit qu'il faut essayer plusieurs techniques de nettoyage des données et analyser leurs impacts sur la performance du modèle afin de pouvoir choisir la "meilleure technique "
@@RealProDatascience D’accord c’est noté, merci beaucoup!
Et si on a notre propre dataset
On fait comment pour les exporter ?
le plus simple est de le passer en fromat csv (il y a des convertisseurs gratuits sur le web. Ensuite, dans colab, il faut cliquer à gauche près du sommaire sur l'icône fichier, puis sur l'icône la plus à gauche 'importer', si tout se passe bien il le nom s'affiche à la suite de 'sample_data'. Enfin, pour le lire sur colab le plus commun est d'utiliser la bibliothèque pandas (as pd par exemple). Donc d'abord importer pandas comme montré au début de la vidéo, puis créer une variable avec le nom du dataframe, par exemple df, et comme valeur : pd.read_csv('df.csv').
Je souhaite installer le module myanfis sous jupyter, comment faire ? merci pour cette vidéo?
pip install
duplicated n a pas été traité a priori !
L'adage les femmes et les enfants d'abord n'est pas vraiment juste pour le Titanic, ce sont les femmes jeune qui ont le moins survécu...