Comment construire un modèle de Machine Learning avec Python et Scikit-Learn | Tutoriel complet

Sdílet
Vložit
  • čas přidán 28. 01. 2021
  • La construction d'un modèle de Machine Learning est tout un art. Dans cette vidéo, je vous montre les étapes rigoureusement à suivre lorsqu'on construit un modèle de machine learning. A travers ce tutoriel, vous apprendrez entres autres à :
    - nettoyer vos données (gestion des valeurs manquantes et gestion des valeurs aberrantes) via des techniques simples et efficaces ;
    - diviser votre ensemble de données en données d'entraînement, de validation et de test ;
    - résoudre le problème de déséquilibre de classe rencontré dans les tâches de classification automatique à partir des méthodes de sur-échantillonnage et de sous-échantillonnage ;
    - sélectionner les meilleurs prédicteurs pour vos algorithmes ;
    - construire différents modèles à partir de divers algorithmes de machine learning (régression logistique, forêt aléatoire, SVM, etc.
    - évaluer les performances des modèles construits ;
    - choisir le meilleur modèle sur la base d'une métrique bien définie ;
    - évaluer la performance du modèle choisi sur les données de test.
    ✅ Notebook : github.com/JosueAfouda/TUTORI...
    ✅ Merci de partager cette vidéo et vous abonner à ma chaîne CZcams : / @realprodatascience
    ✅ Lien de mon livre "Machine Learning par la pratique : Projets réels dans les Finances, l'Immobilier, le Trading, la Santé, le Marketing, etc. www.amazon.fr/gp/product/B08D...
    Vous pouvez aussi me contacter par mail : j.a.datatech.consulting@gmail.com

Komentáře • 41

  • @lydieokosa1596
    @lydieokosa1596 Před 2 lety +5

    En tout cas ce tuto m'a beaucoup aidé. Je suis en master II en Ingenering data, franchement cette vidéo m'a permis de maitriser beaucoup de concept flou du cours. Je la répète plusieurs fois. Merci encoure

  • @najatboutabratine2833
    @najatboutabratine2833 Před 2 měsíci

    Trop intéressant. Merci beaucoup. Ce week-end je n'ai fait que voir vos vidéos. C'est TOP. Je commandé votre livre ML.

  • @louisthiebaud9999
    @louisthiebaud9999 Před 2 lety +1

    Très clair et pédagogique.Merci mille fois

  • @ballakoleakoivogui3675

    Très pédagogique et vraiment merci car grâce a cet tutoriel j'ais saisir plein de choses qui était vraiment flou dans ma tête .

  • @ornelkigo4815
    @ornelkigo4815 Před 7 měsíci

    Je suis très ravis de ce tuto. Merci maestro

  • @seraphngoyi8449
    @seraphngoyi8449 Před rokem +1

    Merci beaucoup notre cher Africain qui pense à ses frères

  • @bibichesas7385
    @bibichesas7385 Před 2 lety +3

    Merci beaucoup. Une vidéo de bonne qualité.
    Après avoir regardé la vidéo. La pédagogie m’a convaincu. J’ai commandé deux de vos livres : statistiques et machine learning. Vous m’avez bien fait rire à 1:14:30. Bonne continuation. Et plus de vidéo avec python serait cool. J’aimerais rentrer en contact avec vous.

  • @chidiackieffer515
    @chidiackieffer515 Před 2 lety

    Très intéressant et bien expliqué. Merci

  • @sondoeloi5004
    @sondoeloi5004 Před 2 lety +1

    Merci infiniment pour le partage de savoir. C'est une formation riche et bien rendue. Toutes mes félicitations pour l'excellente présentation.

  • @mberrydiop8375
    @mberrydiop8375 Před rokem

    Merci beaucoup la vidéo est très intéressante et complète et merci aussi pour le partage c'est gentil.

  • @nacim9113
    @nacim9113 Před rokem

    bravo pour cette vidéo détaillée 👏🏼

  • @wisecatnoroboris
    @wisecatnoroboris Před 3 lety +1

    Super, je l'avais déjà fait avec R je vais tenter avec Python grâce à ce tuto. Merci

  • @abdelilahelfarkouchi8398

    Merci beaucoup pour cette vidéo vraiment riche, je suis débutant dans ce domaine et je travaille sur l'investigation numérique sur les logs système, avec cette présentation
    j'ai après beaucoups d'information, et j'aimerais bien avoir quelques vos orientations sur mon sujet si c'est possible. Cordialement

  • @athoumanimoustadjib7813
    @athoumanimoustadjib7813 Před 3 lety +1

    Merci je la partagerai à tout le monde car c'est intéressant

  • @alioumakalou5583
    @alioumakalou5583 Před 3 lety +1

    Bonjour monsieur, félicitations votre vidéo est juste phénoménale. Pouvez vous faire une vidéo sur les étapes à suivre pour réaliser une application shiny

    • @RealProDatascience
      @RealProDatascience  Před 3 lety

      Je vais lancer une formation sur Shiny sur mon site web dans la semaine du 8 mars. afouda-datascience.com/

  • @yarribbarry
    @yarribbarry Před 2 lety +3

    Merci pour cette vidéo intéressant, très bien adapté, simple et précis.
    > Par contre, je remarque sauf erreur de ma part que à la minute (1:15:13) dans le calcul de l'interquartile, tu as confondu 0.75 avec 0.55 dans le formule pour l'age
    > Et aussi, je tien à préciser aussi que si une distribution n'est pas normale, l'idée d'utiliser ma moyenne pour le remplacement des valeurs manquantes n'est pas adapté mieux vaut la median (c'est plus prudent)

  • @issadiatta5770
    @issadiatta5770 Před 3 lety +1

    merci pour ce beau travail

  • @philtoa334
    @philtoa334 Před 2 lety

    Excellent.

  • @nathanbayoro2376
    @nathanbayoro2376 Před 4 měsíci

    merci beacoup

  • @Jamal_EH
    @Jamal_EH Před 2 lety

    Great thanks

  • @sifaoufatai8775
    @sifaoufatai8775 Před rokem

    Merci

  • @yousseflakouider2279
    @yousseflakouider2279 Před rokem

    bravo bravo

  • @souleymane728
    @souleymane728 Před rokem

    merci bcp pour cette video . je voulais juste savoir quel serez la methode de resampling si notre target comportée 3 classes par exemple

    • @RealProDatascience
      @RealProDatascience  Před rokem +1

      Réponse dans cette vidéo : czcams.com/video/WWyg5r7dIIU/video.html

  • @bahijatantaoui6908
    @bahijatantaoui6908 Před 3 lety

    merci pour cette belle vidéo, svp vous avez travaillé par quel logiciel jupyter ?

  • @amine5169
    @amine5169 Před rokem

    Merci beaucoup ! Pourriez-vous m'indiquer pourquoi a 2:01:30, on a rf.fit(X_train, y_train_up) ? On aurait pu/du utiliser X_train_up ? Merci d'avancer !!

    • @amine5169
      @amine5169 Před rokem

      Edit : Tu l'as edit un peu plus tard, my bad :)

  • @savage5771
    @savage5771 Před 2 lety

    Bonjour Monsieur! Je viens de découvrir cet excellent cours, que je regarde avec beaucoup t’attention. Il est très claire, j’aime votre pédagogie. J’ai partagé cette vidéo à mes amis, tout en les joignant à s’abonner à la chaîne. J’en profite pour poser une question : s’agissant des données manquantes, puisqu’on connaît un peu mieux la structure de cette base de données et ses variables, aurait-on pu remplacer les valeurs manquantes du champ « age » par la médiane en fonction de la répartition selon le champ « pclass »? Par exemple, les valeurs de l’âge manquantes pour la première classe seraient remplacées par l’âge médian de la classe 1, ainsi de suite. Merci d’avance pour votre réponse.

    • @RealProDatascience
      @RealProDatascience  Před 2 lety +1

      Oui Éric, c'est possible de le faire. Gardez en esprit qu'il faut essayer plusieurs techniques de nettoyage des données et analyser leurs impacts sur la performance du modèle afin de pouvoir choisir la "meilleure technique "

    • @savage5771
      @savage5771 Před 2 lety

      @@RealProDatascience D’accord c’est noté, merci beaucoup!

  • @ismailadoctor9710
    @ismailadoctor9710 Před 2 lety +1

    Et si on a notre propre dataset
    On fait comment pour les exporter ?

    • @nowansend
      @nowansend Před 2 lety +1

      le plus simple est de le passer en fromat csv (il y a des convertisseurs gratuits sur le web. Ensuite, dans colab, il faut cliquer à gauche près du sommaire sur l'icône fichier, puis sur l'icône la plus à gauche 'importer', si tout se passe bien il le nom s'affiche à la suite de 'sample_data'. Enfin, pour le lire sur colab le plus commun est d'utiliser la bibliothèque pandas (as pd par exemple). Donc d'abord importer pandas comme montré au début de la vidéo, puis créer une variable avec le nom du dataframe, par exemple df, et comme valeur : pd.read_csv('df.csv').

  • @marcotsayo
    @marcotsayo Před rokem

    Je souhaite installer le module myanfis sous jupyter, comment faire ? merci pour cette vidéo?

  • @radyoalmikyel6881
    @radyoalmikyel6881 Před 2 lety

    duplicated n a pas été traité a priori !

  • @albart1732
    @albart1732 Před 2 lety

    L'adage les femmes et les enfants d'abord n'est pas vraiment juste pour le Titanic, ce sont les femmes jeune qui ont le moins survécu...