MASTER 2 SISE DATA SCIENCE
MASTER 2 SISE DATA SCIENCE
  • 204
  • 345 426
Transfer Learning avec PyTorch (torchvision / Python)
Deep Learning, réseaux de neurones convolutifs. Principe du transfer learning en computer vision. Comment construire un modèle hybride en appariant un modèle pré-entraîné sur des grands corpus (VGG19 sur ImageNet) avec un classifieur ad hoc pour un classement binaire (les fameux chats et chiens). Gap des performances entre un modèle ad hoc et le modèle hybride. Parallèle avec les embeddings en NLP (natural language processing).
Notebook et données : tutoriels-data-science.blogspot.com/p/tutoriels-en-francais.html#HnKn1hi7ImyeMSxoqfU
Site de PyTorch : pytorch.org/tutorials/beginner/transfer_learning_tutorial.html
Base d'images : www.microsoft.com/en-us/download/details.aspx?id=54765
Page de cours : cours-machine-learning.blogspot.com/
00:00 Principe du transfer learning
05:58 Transfer learning avec PyTorch en computer vision (VGG19)
11:09 La base des images "Cats and Dogs"
13:33 Démarrage du notebook - Importation des images TRAIN
17:18 ConvNet "from scratch" à partir de la base TRAIN
19:40 Entraînement du modèle
21:20 Chargement de base TEST, prédiction, évaluation
22:29 Premier bilan - Comment aller plus loin
25:25 Instanciation du modèle pré-entraîné VGG19
25:58 Application de VGG19 sur une image
26:58 Prédiction d'une des classes d'ImageNet
27:21 Architecture de VGG19 (features vs. classifier)
28:24 Nombre de couches dans la partie dense (classifier)
28:40 Structure de la dernière couche (4096 vs. 1000 classes ImageNet)
29:19 Création d'une couche spécifique au problème traité
31:12 Greffe de la nouvelle couche dans VGG19
32:34 Reconfiguration de l'entraînement (fonction de perte, algo d'optimisation)
32:47 Relancer l'entraînement (de la dernière couche) du VGG19 modifié
35:10 Prédiction sur TEST et amélioration des performances
zhlédnutí: 287

Video

Modèles pré-entraînés pour le classement d’images (PyTorch / Python)
zhlédnutí 199Před měsícem
Mise en oeuvre de modèles de deep learning pré-entraînés sur des grands corpus étiquetés (ImageNet en l’occurrence) pour le classement d’images supplémentaires. Utilisation des librairies PyTorch / Torchvision pour Python. Etude du fonctionnement en particulier des classifieurs ResNet-50 et VGG-19. Principales étapes du processus : inspection de l’image, instanciation du modèle (avec pour la pr...
Réseau de neurones convolutifs avec tensorflow / keras (Python)
zhlédnutí 343Před měsícem
Définition et mise en œuvre d’un réseau de neurones convolutifs (cnn / convnet - convolutional neural network) pour le classement d’images via le tandem de librairies de deep learning tensorflow / keras. Mise en parallèle des - exactement - mêmes traitements effectués à l’aide de PyTorch. Base exemple des figures « Pokémon ». Importation et préparation de la base étiquetée d’apprentissage. Arch...
Réseau de neurones convolutifs avec PyTorch (torchvision / Python)
zhlédnutí 947Před měsícem
Définition et mise en œuvre d’un réseau de neurones convolutifs (cnn / convnet - convolutional neural network) pour le classement d’images via la librairie de deep learning PyTorch. Utilisation de l’extension « torchvision ». Base exemple des figures « Pokémon ». Importation et préparation de la base étiquetée d’apprentissage avec, notamment, le typage en « tenseur » (tensor) des images. Archit...
Classement multiclasse avec PyTorch (Python)
zhlédnutí 246Před 2 měsíci
Suite de la vidéo consacrée à la classification supervisée à l’aide des perceptrons simples et multicouches (réseaux de neurones), utilisation de la librairie PyTorch dédiée au machine learning / deep learning. Par rapport à classification binaire (cf. lien de la vidéo ci-dessous), plusieurs spécificités pour pouvoir traiter un problème multiclasse (variable cible catégorielle à plus [stricteme...
Classement binaire avec PyTorch (Python)
zhlédnutí 213Před 2 měsíci
Classement ou classification supervisée binaire avec la librairie PyTorch (Python). Particularités de l’outil dans le cadre de la définition et de la mise en œuvre des perceptrons simples et multicouches (réseaux de neurones) : mettre les données sous la forme de tenseurs (tensor, des matrices et vecteurs optimisés pour les calculs de machine learning) ; définir l’architecture et le comportemen...
Formulaire interactif dans un notebook (ipywigdets / Python)
zhlédnutí 299Před 2 měsíci
Création de formulaire interactif dans un notebook Jupyter à l'aide du package « Ipywidgets » pour Python. Initialisation, disposition et paramétrage des objets visuels ; programmation des gestionnaires d'évènements. Plusieurs exemples de programmes très simples, mise en parallèle avec le fonctionnement d'une application console que l'on chercherait à faire exécuter au sein d'un notebook. Utili...
Clustering - Déploiement Web App (streamlit / Python)
zhlédnutí 533Před 3 měsíci
Déploiement d'un modèle de clustering (classification automatique, non-supervisée) sous la forme d'une Web App développée à l'aide de la technologie « streamlit » pour Python. Le « modèle » correspond en réalité à un processus encapsulé dans une structure Pipeline de « scikit-learn ». Il comprend un mécanisme d'imputation des données manquantes (SimpleImputer), la standardisation des données (S...
Pipeline - FunctionTransformer (scikit-learn / Python)
zhlédnutí 319Před 3 měsíci
Utilisation de l'outil FunctionTransformer dans une phase de préparation de données, incorporée dans un Pipeline scikit-learn. La fonction de transformation peut être définie à la volée (fonction lambda) ou implémentée à part. Le plus important est d'être en cohérence avec le format des variables passées en paramètres. Sérialisation du workflow complet (préparation des données modèle de machine...
Pipeline - Paramétrage (scikit-learn / Python)
zhlédnutí 286Před 3 měsíci
Pipeline sous Python dans le cadre de l'analyse conjointe (tandem clustering) mixant analyse factorielle et classification automatique (clustering). Accès aux étapes intermédiaires du pipeline avec une double finalité : (1) lecture des résultats ; (2) manipulation des paramètres des algorithmes pour pouvoir relancer les calculs sans avoir à réinstancier à chaque fois le pipeline dans sa globali...
Microsoft Copilot... est mon ami
zhlédnutí 492Před 3 měsíci
Quelques expériences amusantes (?) avec Microsoft Copilot. Inspection des résultats et surtout des sources utilisées lors de requêtes relatives au machine learning (analyse discriminante prédictive, catégorisation de documents [NLP], identification de communautés dans les réseaux sociaux, clustering mixte). Avec, en filigrane, des questions (ou des remises en question) sur nos pratiques pédagog...
Pipeline avec ColumnTransformer (scikit-learn / Python)
zhlédnutí 337Před 3 měsíci
Implémentation de l'AFDM (analyse factorielle des données mixtes) à l'aide d'un "Pipeline" scikit-learn. Utilisation de l'outil "ColumnTransformer" pour effectuer les transformations de variables conditionnellement à leurs types (quantitatives [StandardScaler] et qualitatives [OneHotEncoder, Réduction par la racine de la fréquence]), les données étant ensuite présentées à un algorithme d'ACP (a...
LibreOffice Calc - Filtres et Tableaux croisés dynamiques
zhlédnutí 423Před 5 měsíci
Manipulation des données sous le tableur LibreOffice Calc : AutoFiltre (filtre automatique), filtre standard, filtre spécial (filtres avancés, avec les zones de données, de critères et d'extraction), tableaux croisés dynamiques (TCD, champs de filtres et champs calculés). La vidéo équivalente pour Excel : czcams.com/video/UBdv-8hnxwA/video.html Site web de LibreOffice : fr.libreoffice.org
Macros Python pour LibreOffice Calc (2) - Sélections simples et multiples
zhlédnutí 465Před 6 měsíci
Programmation de macros Python pour LibreOffice Calc, le tableur de la suite bureautique LibreOffice. Traitement des plages de cellules sélectionnées par l'utilisateur. Identification du type de sélection : une seule plage de cellules ou plusieurs plages non-contigües. Parcours des zones, parcours des cellules à l'intérieur d'une zone. Lecture, écriture et mise en forme des cellules. Vidéo liée...
Fonctions personnalisées Python pour LibreOffice Calc
zhlédnutí 418Před 6 měsíci
Implémentation de fonctions dans des modules Python que l'on peut exploiter sous la forme de fonctions personnalisées dans une feuille de calcul du tableur Calc de la suite bureautique LibreOffice. Création et localisation du module Python dans le dossier "user". Elaboration d'une unité d'import Basic dans un classeur. Programmation en Basic de la fonction d'appel des fonctions Python. Page de ...
Macros Python pour LibreOffice Calc
zhlédnutí 1,5KPřed 6 měsíci
Macros Python pour LibreOffice Calc
Requêtes SQL sur DataFrame Pandas (pandasql / Python)
zhlédnutí 579Před 7 měsíci
Requêtes SQL sur DataFrame Pandas (pandasql / Python)
Dockerisation (Base de données [SQLite] + Web App Python [gradio])
zhlédnutí 571Před 7 měsíci
Dockerisation (Base de données [SQLite] Web App Python [gradio])
NLP - Catégorisation de documents avec "fasttext" (Python)
zhlédnutí 361Před 7 měsíci
NLP - Catégorisation de documents avec "fasttext" (Python)
Reconnaissance automatique de la langue avec "fasttext" (Python)
zhlédnutí 245Před 7 měsíci
Reconnaissance automatique de la langue avec "fasttext" (Python)
Déploiement des classifieurs avec R Shiny + Docker
zhlédnutí 483Před 7 měsíci
Déploiement des classifieurs avec R Shiny Docker
Suivi des expérimentations avec MLFLOW TRACKING (PyCaret / Python)
zhlédnutí 321Před 7 měsíci
Suivi des expérimentations avec MLFLOW TRACKING (PyCaret / Python)
Déploiement facile via GRADIO (PyCaret / Python)
zhlédnutí 408Před 7 měsíci
Déploiement facile via GRADIO (PyCaret / Python)
Déploiement facile via STREAMLIT + DOCKER (Pycaret / PYTHON)
zhlédnutí 830Před 7 měsíci
Déploiement facile via STREAMLIT DOCKER (Pycaret / PYTHON)
Déploiement facile via une API REST avec PyCaret / PYTHON
zhlédnutí 642Před 8 měsíci
Déploiement facile via une API REST avec PyCaret / PYTHON
Machine learning avec tidymodels pour R
zhlédnutí 518Před 8 měsíci
Machine learning avec tidymodels pour R
Text Mining (NLP) - Le package spaCy pour Python
zhlédnutí 572Před 8 měsíci
Text Mining (NLP) - Le package spaCy pour Python
La méthode DISMIX (Python / scientisttools)
zhlédnutí 330Před rokem
La méthode DISMIX (Python / scientisttools)
La méthode DISQUAL (Python / scientisttools)
zhlédnutí 415Před rokem
La méthode DISQUAL (Python / scientisttools)
Analyse factorielle discriminante (CANDISC) avec "scientisttools" (Python)
zhlédnutí 836Před rokem
Analyse factorielle discriminante (CANDISC) avec "scientisttools" (Python)