Machine Learning : Comment BIEN mesurer la performance de son modèle ?

Sdílet
Vložit
  • čas přidán 9. 07. 2024
  • 📝 AMELIOREZ VOS COMPETENCES EN DATA SCIENCE : damienchambon.podia.com/email...
    Machine Learning : Comment mesurer la performance de son modèle ?
    00:00 Introduction
    01:07 Performance d'un modèle de Machine Learning
    03:07 Les mesures de performance en régression
    04:58 Les mesures de performance en régression
    05:54 Comment évaluer la performance obtenue en régression ?
    08:39 Comment évaluer la performance obtenue en classification ?
    Une fois son projet de Machine Learning terminé, on calcule la performance de son modèle de Machine Learning. On est vite tenté d’être satisfait de la performance de son algorithme mais comment peut-on en être sûr ? Comment sait-on si notre modèle de Machine Learning est optimal ou non ? Réponse dans cette vidéo sur le Machine Learning en français.
    Tout d’abord, il est important d’évaluer la performance de son modèle de Machine Learning. Cela permet de savoir si notre travail de Data Scientist s’est bien déroulé. On teste notre algorithme sur des données qu’il n’a jamais vu afin de prévenir tout problème lié à l’overfitting, un problème courant en Machine Learning.
    On évalue sa performance grâce à des mesures de performance comme le MSE ou le RMSE pour la régression en Machine Learning. En classification, on utilise plutôt la précision et le rappel. Mais comment savoir si le score obtenu avec le RMSE ou la précision est suffisant ?
    On va devoir utiliser des méthodes selon la tâche sur laquelle on travaille. Si on fait de la régression en Machine Learning, il faut utiliser un rapport qui consiste à diviser la performance du RMSE par exemple par la moyenne de la variable étudiée chez les données de test. Plus ce rapport est proche de 0, mieux c’est.
    Concernant la classification en Machine Learning, il est préférable d’utiliser un modèle naïf. Un modèle naïf en Machine Learning est un modèle qui prédit soit toujours la même classe, soit fait des prédictions au hasard. Il est important de confronter la performance de notre modèle face à ces deux variantes de modèle naïf afin de voir si notre algorithme performe bien mieux que ceux-ci.
    👋🏼 Qui suis-je ?
    Je m'appelle Damien et je suis Data Scientist. Au cours de mes expériences professionnelles, j'ai découvert à quel point la Data Science peut être un puissant outil lorsqu'on la maîtrise.
    Grâce à mes formations en Data Science, des dizaines d'étudiants ont gagné en compétences techniques et peuvent ainsi répondre plus efficacement aux enjeux actuels.
    💻 Mon site : damienchambon.podia.com
    Crédit musique : idealisme - seeing you
  • Věda a technologie

Komentáře • 8

  • @lilaberkani4376
    @lilaberkani4376 Před 3 lety +1

    Très utile , merci ! je m'abonne !

    • @latelierdata
      @latelierdata  Před 3 lety +1

      Merci beaucoup Lila ! Content de pouvoir t’aider ;)

  • @latelierdata
    @latelierdata  Před 3 lety

    📝 AMELIOREZ VOS COMPETENCES EN DATA SCIENCE : damienchambon.podia.com/emails-prives

  • @SWEARENGENAlbert
    @SWEARENGENAlbert Před 2 lety +1

    bonjour, Damien je viens de m'inscrire à ta newsletter. J'ai une question as-tu des recommandation de livre en machine learning et big data pour les néophytes à conseiller ?

    • @latelierdata
      @latelierdata  Před 2 lety +1

      J'espère que la newsletter te sera utile pour avoir des conseils en Data Science :D Un des livres sur le Machine Learning qui m'a le plus aidé, c'est celui d'Aurélien Géron "Hands-on Machine Learning". Il est bien expliqué et très concret je trouve.
      Je te conseille aussi ma formation sur Udemy qui te permettra de réaliser un projet de Machine Learning en moins de 2 heures, même sans avoir trop de connaissances sur le sujet. Je te mets le lien ici : www.udemy.com/course/machine-learning-realiser-son-projet-en-python/?referralCode=D3C0086334D1E643CA22

  • @thomasstroebel2266
    @thomasstroebel2266 Před 2 lety

    Bonjour Damien,
    Pour la régression, comment se nomme la métrique évoquée (Performance modèle / Moyenne) ?
    Merci d'avance

    • @latelierdata
      @latelierdata  Před 2 lety

      Salut Thomas ! Je parle du RMSE, qui est la Root Mean Square Error (ou la racine carrée de la moyenne des erreurs au carré). C'est une métrique qui est très utilisée en Data Science pour évaluer la performance de modèles.

    • @captaincat999
      @captaincat999 Před 7 měsíci

      @@latelierdata Je pense qu'il voulait savoir si la mesure (RMSE / Moyenne de la variable en question, dans la vidéo) avait un nom particulier.