TRAITER LES VALEURS ABERRANTES

Sdílet
Vložit
  • čas přidán 7. 02. 2022
  • TRAITER LES VALEURS ABERRANTES OU OUTLIERS [ preparation de donnees, diagramme de boite a moustaches ou boxplot, detection de valeurs aberrantes, détection des anomalies, suppression de valeurs aberrantes, nettoyage de données ], PARTIE II (DATA PRE-PROCESSING, NETTOYAGE DES DONNEES ), JE VOUS MONTRE POURQUOI, COMMENT ET QUANT IL FAUT TRAITER LES VALEURS ABERRANTES(OUTLIERS), C'EST A DIRE DETECTER, REMPLACER, SUPPRIMER OU RECUPERER LES VALEURS ABERRANTES DANS UN SOUS DATASET LES VALEURS ABERRANTES OU OUTLIERS. JE VOUS MONTRE TOUTES LES TECHNIQUES ET ASTUCES POUR TRAITER DE FACON CORRECTE LES VALEURS EXTREMES.
    #datapreparation #openclass4all #datacleaning
    REJOINDRE LA COMMUNAUTÉ: / @openclass4all
    MON PROFIL LINKEDIN: / ousman-hamit-hassani
    PLAYLISTS(FORMATIONS) A REGARDER ET COMMENTER ABSOLUMENT:
    1. ANALYSEEXPLORATION DE DONNEES
    • Visualisation de donnees
    2. DATA PRE-PROCESSING:
    • TRAITER LES VALEURS AB...
    3. MODELE DE MACHINE LEARNING:
    • REGRESSION LINEAIRE - ...
    4. VIDEOS TUTORIELLE(PRISE EN MAIN DE JUPYTER NOTE BOOK):
    • Maitriser les raccourc...

Komentáře • 92

  • @openclass4all
    @openclass4all  Před rokem +2

    *REJOINDRE LA COMMUNAUTE OPENCLASS4ALL 👉**czcams.com/channels/E-613S-bsuLukwHDhnRxIA.html*

  • @elpacifico7782
    @elpacifico7782 Před 2 lety +4

    Merci, j'ai pu résoudre mon problème grace à votre video

    • @openclass4all
      @openclass4all  Před 2 lety +3

      Je suis vraiment ravi que ca vous a aide, merci beaucoup 👍

  • @appartementschambres140
    @appartementschambres140 Před 2 lety +4

    Merci @Ousman, cette video m'a permis de resoudre plusieurs de mes problemes.

    • @openclass4all
      @openclass4all  Před 2 lety +1

      Ravi d'apprendre que ca vous a aide, merci de la partager avec tes amis 👍

  • @vosinh2180
    @vosinh2180 Před 2 lety +9

    Vraiment une excellente vidéo pour traiter les valeurs aberrantes, j'ai pas trouvé meilleure que celle-ci.
    Merci beaucoup.

    • @openclass4all
      @openclass4all  Před 2 lety +7

      Je suis vraiment contient que ca vous aide, merci de votre commentaire

    • @openclass4all
      @openclass4all  Před 2 lety +5

      J'ai egalement d'autres videos a cette URL czcams.com/video/E3HbvAH9W0A/video.html si vous etes interesses

  • @khadimsene
    @khadimsene Před 2 lety +5

    Merci pour cette belle vidéo le grand professeur. Ça va beaucoup nous aider sur les problèmes que nous rencontrons chaque jour dans le prétraitement de nos donnés. Merci 🙏.

    • @openclass4all
      @openclass4all  Před 2 lety +5

      Merci pour votre commentaire, c'est extrement encourageant 👍

  • @appartementschambres140
    @appartementschambres140 Před 2 lety +2

    Plus riche que les formations payantes que j'ai achetes.

    • @openclass4all
      @openclass4all  Před 2 lety +1

      Merci, C'EST TOUT CE QUE JE VOULAIS ENTENDRE 😄

  • @serigneabdoulazizdrame1359

    Bonne continuation frère

    • @openclass4all
      @openclass4all  Před 2 lety +3

      Merci Serigne, on va aller plus loin insha ALLAH.

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    j'ai reçu votre message, c'est la cellule 5 , à 17:37. Merci à vous.

    • @openclass4all
      @openclass4all  Před 2 lety

      OK, JE REGARDE ET JE VOUS REVIENS TOUT DE SUITE

    • @openclass4all
      @openclass4all  Před 2 lety

      VOUS AVEZ SUREMENT MAL NOTE QUELQUE CHOSE DANS LE CODE SUIVANT ==>
      def drop_outliers(df, feature):
      Q1 = np.percentile(df[feature], 25)
      Q3 = np.percentile(df[feature], 75)
      limit = 1.5*(Q3 - Q1)
      df.drop(df[df[feature] > limit + Q3].index, inplace = True)
      df.drop(df[df[feature] < Q1 - limit].index, inplace = True)
      VERIFIER QUE TOUT EST BIEN ECRIT COMME CECI 👆
      N'OUBLIEZ PAS AUSSI LES INDENTATIONS

    • @openclass4all
      @openclass4all  Před 2 lety

      POUR LA BOUCLE FOR 👇, N'OUBLIEZ PAS QUE LE df NE PAS DE VALEURS ABERRANTES(IL A ETE COMPLETEMENT NETTOYE DANS LES QUESTIONS PRECEDENTES), UTILISER *cp* 👈👈👈
      for feature in features:
      drop_outliers(cp, feature)

  • @yannehouman5776
    @yannehouman5776 Před 2 lety +1

    Merci beaucoup 🙏

  • @brabeatz197
    @brabeatz197 Před rokem +2

    Merci beaucoup pour vos cours. De la part d'un étudiant de MSDA Université Iba Der THIAM. Sinon on aimerait également des tutos sur le Data Engineering genre Spark, Hadoop. Merci d'avance 🤲

    • @openclass4all
      @openclass4all  Před rokem +1

      Merci THIAM pour votre commentaire.

    • @openclass4all
      @openclass4all  Před rokem +2

      J'ai pris note de votre demande, car les deux formations(Analyse exploratoire des données et Data Pre-processing déjà disponibles sur cette chaîne ne sont pas encore achevées), même si ça va prendre un peu du temps, il y aura du contenu sur SPARK.

    • @brabeatz197
      @brabeatz197 Před rokem +1

      Super on sera la inchallah pour les suivre et merci beaucoup pour tout.

  • @PiracyChecker
    @PiracyChecker Před rokem +1

    BONJOUR j'aime beaucoup le contenu de tes tutoriels. je travail sur un projet de prediction des matchs de football et je dispose d'un api qui me fourni toutes les statistique complet equivalent au statistiques des bookmakers. peux tu faire des tutoriel sur orange data mining qui est aussi basé sur python avec plusieurs algorythme.

    • @openclass4all
      @openclass4all  Před rokem

      Bonjour, merci beaucoup pour le commentaire, l'outil orange data mining je sais de quoi il s'agit mais je ne l'ai jamais utilise dans un projet, c'est assez difficile pour moi de vous proposer des tutos, car cela necessite un temps considerable

  • @mohamedettadrarty7404
    @mohamedettadrarty7404 Před rokem +1

    merci

    • @openclass4all
      @openclass4all  Před rokem

      Merci a vous de l'avoir suivie

    • @openclass4all
      @openclass4all  Před rokem

      *SI CA VOUS INTÉRESSE J'AI UNE PLAYLIST ENTIEREMENT DÉDIÉE AU DATA PREPROCESSING* 👉 czcams.com/video/SJNw_kxcnpE/video.html

  • @mostafajerari7560
    @mostafajerari7560 Před rokem +1

    Merci pour l'effort.
    J'ai un problème que je vous ai expliqué en privé sur Facebook messenger.
    merci infiniment

  • @katibakhaber3493
    @katibakhaber3493 Před rokem +1

    Merci beaucoup beaucoup pour l'explication.

  • @hichamkalkha3694
    @hichamkalkha3694 Před 2 lety +1

    the best :)

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    Bravo pour la pédagogie : ce cours est claire et complet. Merci.

    • @openclass4all
      @openclass4all  Před 2 lety

      Merci beaucoup pour votre appréciation, ça nous encourage à proposer toujours plus de contenu.

    • @openclass4all
      @openclass4all  Před 2 lety

      *SI CA VOUS INTÉRESSE J'AI UNE PLAYLIST ENTIEREMENT DÉDIÉE AU DATA PREPROCESSING* 👉👉 czcams.com/video/SJNw_kxcnpE/video.html

    • @brigitterabarijaona3872
      @brigitterabarijaona3872 Před 2 lety +1

      Bjr, J'ai besoin du drop mais "df.drop(df[df[feature]>limit+Q3].index, inplace = True)" ne fonctionne pas, car df[feature] n'existe pas. Merci de me répondre. Cdlt.

    • @openclass4all
      @openclass4all  Před 2 lety

      @@brigitterabarijaona3872 Bonjour

    • @openclass4all
      @openclass4all  Před 2 lety

      @@brigitterabarijaona3872 Vous pouvez telecharger le notebook a cette URL => github.com/OusmanHamit/JUPYTER-NOTEBOOK/blob/master/OUTLIERS(PARTIE%20II).ipynb

  • @octopusconseil8571
    @octopusconseil8571 Před 2 lety +1

    Merci beaucoup ! Pour les vidéos et les notebook sur la gestion des outliers. C'est hyper clair et très apprécié :)

    • @openclass4all
      @openclass4all  Před 2 lety +1

      Merci pour votre appréciation, vos commentaires m'aident beaucoup a améliorer le contenu de prochaines vidéos.

    • @openclass4all
      @openclass4all  Před 2 lety +1

      D'autres vidéos dans le mème ordre d’idée sont également disponible a cette 👉 URL : czcams.com/video/nJ0olHCZgZI/video.html
      Si vous trouvez que c'est intéressant, merci de les partager avec vos amis qui seraient intéressés, ça aide énormément la chaîne à s’agrandir.

  • @HamzaNour
    @HamzaNour Před 2 lety +1

    Vidéo encore une fois instructive. Merci

    • @openclass4all
      @openclass4all  Před 2 lety

      Merci a toi de l'avoir regarde 👍

    • @openclass4all
      @openclass4all  Před 2 lety +1

      Si ca vous interesse, j'ai une video encore plus interessante a cette URL 👉 czcams.com/video/t7ZoE9XrF1M/video.html

  • @daliladerdar7755
    @daliladerdar7755 Před rokem +1

    Super intéressant et très claire ! Merci beaucoup !

    • @openclass4all
      @openclass4all  Před rokem

      Merci @Dalila Derdar pour votre appreciation

    • @openclass4all
      @openclass4all  Před rokem

      Si vous êtes intéressés voici toute la playlist dédiée au DATA PRE-PROCESSING ICI 👉 czcams.com/video/SJNw_kxcnpE/video.html

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    Ok!!!! ça marche ! vous m'avez aidée. Je suis en formation, c'est votre cours qui m'explique TOUT ! J'ai compris votre cours sur régression linéaire, on attaque l'ACP, multivariée, est-ce que vous traiter tous cela ? Comment payer vos cours par mois, ma formation va durer encore 6 mois, au moins. j'aimerais payer par western union, si possible, en début du mois. Merci de me répondre. Cdlt

    • @openclass4all
      @openclass4all  Před 2 lety

      Merci, ravi que le problème soit réglé, je n'ai pas encore de formation payante disponible immédiatement(ça sera l’année prochaine 2023), je ferai également une formation gratuite sur l'ACP, des que j'ai un peu du temps disponible.
      Est-ce vous avez regarde toute les playlist de ma chaine 👉 czcams.com/users/openclass4allplaylists

    • @brigitterabarijaona3872
      @brigitterabarijaona3872 Před 2 lety +1

      @@openclass4all Bonjour, non, je n'ai appris vu que celui-là: je vais m'y mettre dès demain. Merci de m'informer pour la suite. Bien cordialement à vous.

    • @openclass4all
      @openclass4all  Před 2 lety

      @@brigitterabarijaona3872 Il suffit d'activer la cloche de notification pour être automatiquement informée des je publie du nouveau contenu.

  • @olyneniyomwungere5991
    @olyneniyomwungere5991 Před 2 lety +1

    Très intéressantes

  • @openclass4all
    @openclass4all  Před 2 lety +3

    👉 github.com/ousmanhamit

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    Bonjour, veuillez m'excuser de vous rappeler que je souhaite intégrer votre groupe de discussion si c'est possible: comment faire ? Merci d'avance. cdlt

    • @openclass4all
      @openclass4all  Před 2 lety

      Merci pour l’intérêt que portez au contenu que nous proposons, vous pouvez me contactez via le formulaire de contact à cette URL 👉 ousmanhamithassani.herokuapp.com/ afin que je puisse vous recontacter des que tout le processus d'organisation qui tourne autour de nos formations est achevé.

  • @brigitterabarijaona3872

    features = ['energy_100g','proteins_100g', 'salt_100g','sodium_100g','sugars_100g','fat_100g','carbohydrates_100g','saturated-fat_100g','nutrition-score-fr_100g']

    • @openclass4all
      @openclass4all  Před 2 lety

      SI VOUS AVEZ UN GITHUB, DEPOSEZ VOTRE NOTEBOOK LABAS, DE CETTE FACON, JE PREND VOTRE NOTEBOOK, JE LE CORRIGE PUIS VOUS L'ENVOYER.

  • @Mohamedtababi-x6j
    @Mohamedtababi-x6j Před 11 dny +1

    Bonsoir Mr
    J'ai travaillé sur une dataset sujet du changement climatique en Afrique mais quelque codes ne fonctionnent pas comme vous le signalé
    cordialement

    • @openclass4all
      @openclass4all  Před 11 dny

      Merci de me décrire en détail ton problème à cette URL 👉 ousmanhamit.com/contact/

    • @openclass4all
      @openclass4all  Před 11 dny

      Je vais être disponible demain soir

  • @alima5003
    @alima5003 Před rokem +1

    Bonjour prof merci pour votre vidéo j'ai une question après avoir créer un subdataset pour les valeurs aberrantes est ce qu'on va après les supprimer de notre base data initiale ou bien?

    • @openclass4all
      @openclass4all  Před rokem

      Non, en fait il y a 3 possibilites:
      1. Vous les supprimez comme je vous ai montre dans la video.
      2. Vous les recuperez dans un subdataset pour les analyser a part les autres donnees
      3. Vous les remplacer

    • @openclass4all
      @openclass4all  Před rokem

      J'ai traite les 3 cas, parce que ca depend de ce que vous voulez faire

    • @openclass4all
      @openclass4all  Před rokem

      Merci pour la question et dites-moi si vous avez compris ou pas ?

    • @alima5003
      @alima5003 Před rokem

      ​@@openclass4all Moi pour mon travail je les récupérez dans un subdataset mais le problème en ai que quand j'exécute la distribution des variables qui se trouve dans ma base data j'ai toujours les valeurs aberrantes je sais pas ou se trouve le problème.

    • @openclass4all
      @openclass4all  Před rokem

      Une fois recuperee, vous les SUPPRIMER DE VOTRE DATASET INITIAL, CAR VOUS N'AVEZ PLUS BESOIN,

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    la boucle parcourt bien les features, mais c'est "df = df.drop(df[df.feature >limit + Q3].index, inplace = True)" , le df.feature ne comprend pas les éléments de features.

    • @openclass4all
      @openclass4all  Před 2 lety

      Vous m'avez pas encore précisé quelle fonction, ni a quelle minute de la video mais feature(sans s) contient LA COLONNE COURANTE DANS LA BOUCLE FOR pour parcourir l'objet FEATURES(avec s a la fin)

    • @openclass4all
      @openclass4all  Před 2 lety

      *VOUS NE DEVEZ PAS NOTER df.feature MAIS IL FAUT ECRIRE df[feature] 👈 SANS LES APOSTROPHES A L'INTERIEUR DES CROCHETS*

  • @brigitterabarijaona3872

    Merci, le problème: 1°) " df = df.drop(df[df.feature >limit + Q3].index, inplace = True)" , 2°) "AttributeError: 'DataFrame' object has no attribute 'feature', "

    • @openclass4all
      @openclass4all  Před 2 lety

      A quelle minute(Preciser) exactement de la video ?

  • @mauyvesdonaldchancelnkondo2779

    def impute_outliers(outliers_100g, features):
    q1 = np.percentile(outliers_100g[feature], 25)
    q3 = np.percentile(outliers_100g[feature], 75)
    iqr = q3 - q1
    lower_bound= q1 - 1.5*iqr
    upper_bound= q3 - 1.5*iqr
    outliers_100g.loc[outliers_100g[feature] < lower_bound,feature] = lower_bound
    outliers_100g.loc[outliers_100g[feature] < upper_bound,feature] = upper_bound
    for feature in features:
    impute_outliers(data, feature)
    ce code envoie une erreur

    • @mauyvesdonaldchancelnkondo2779
      @mauyvesdonaldchancelnkondo2779 Před rokem

      TypeError: '

    • @openclass4all
      @openclass4all  Před rokem

      Que contient ta variable features ?

    • @openclass4all
      @openclass4all  Před rokem

      Le code est parfaitement correct, regarde seulement la liste de tes variables *features* ou bien ton df que tu as nomme *data*

    • @openclass4all
      @openclass4all  Před rokem

      Si malgre tout vous avez une erreur, coppier/coller l'erreur en commentaitre, je vais la voir

    • @mauyvesdonaldchancelnkondo2779
      @mauyvesdonaldchancelnkondo2779 Před rokem

      @@openclass4all features= ['code','product_name','quantity','categories','energy-kj_100g','energy-kcal_100g']

  • @brigitterabarijaona3872
    @brigitterabarijaona3872 Před 2 lety +1

    le drop marche bien si j'exécute pour une variable précise, sans paramètre feature ni features. Je vous rappelle: je n'ai pas réussi : "from jupyterthemes.stylefx import set_nb_theme
    set_nb_theme('grade3') ". C'est peut-être la raison pour laquelle "df.feature" ne fonctionne pas ?

    • @openclass4all
      @openclass4all  Před 2 lety

      VOUS N'AVEZ PAS BESOIN DE CES from jupyterthemes.stylefx import set_nb_theme
      set_nb_theme('grade3') CA C'EST JUSTE POUR CHANGER LE THEME, VOUS LES SUPPRIMEZ OU ALORS VOUS INSTALLEZ
      !pip install jupyterthemes