Introduction
  • Quel est le programme de la formation Machine Learning?
  • Installation Anaconda / Python
  • Installation Anaconda (version texte)
  • Installation bibliothèques requises dans la formation
  • Pré-requis Python / Pandas : rattrapage accéléré
--------------- PARTIE 1 -- MACHINE LEARNING : LES FONDAMENTAUX ----------------
  • Programme
Introduction aux K plus proches voisins - k Nearest Neigbors (kNN)
  • Définition du problème : qu'est-ce que le Machine Learning?
  • Introduction au dataset
  • Les k plus proches voisins - k Nearest Neighbors
  • Distance euclidienne
  • Calculer la distance pour toutes les observations
  • Randomiser et trier
  • Prix moyen
  • Fonction pour faire des prédictions
Evaluer la performance du modèle
  • Tester la qualité des prédictions
  • Les métriques d'erreur
  • Erreur quadratique moyenne (MSE)
  • Entrainer un autre modèle
  • Racine carrée de l'erreur quadratique moyenne (RMSE)
  • Comparaison des erreurs
Modèle multivarié des K plus proches voisins
  • Récapitulatif
  • Supprimer des caractéristiques
  • Gérer les valeurs manquantes
  • Normaliser les colonnes
  • Distance Euclidienne pour le cas multivarié
  • Introduction à la bibliothèque Scikit-learn
  • Entrainer un modèle et faire des prédictions en utilisant Scikit-learn
  • Calculer l'erreur quadratique moyenne en utilisant Scikit-learn
  • Utiliser plus de caractéristiques
  • Utiliser toutes les caractéristiques
Optimisation hyper paramétrique
  • Récapitulatif
  • Optimisation hyper paramétrique
  • Elargir la grille de recherche
  • Visualiser les valeurs des hyper paramètres
  • Varier les caractéristiques et les hyper paramètres
  • Pratiquer le déroulement des opérations (workflow)
Validation croisée
  • Introduction
  • Validation croisée Holdout
  • Validation croisée des K-Fold
  • Première itération
  • Fonction pour entrainer des modèles
  • Exécuter une validation croisée des K-Fold en utilisant Scikit-learn
  • Explorer différentes valeurs de K
  • Compromis Biais - Variance
Projet guidé 1 : Prédiction de prix de voitures
  • Introduction au dataset
  • Solution - Introduction au dataset
  • Nettoyage de données
  • Solution - Nettoyage de données
  • Modèle univarié
  • Solution - Modèle univarié
  • Modèle multivarié
  • Solution - Modèle multivarié
  • Variation des hyperparamètres
  • Solution - Variation des hyperparamètres
-------- PARTIE 2 -- REGRESSION LINEAIRE appliquée au MACHINE LEARNING --------
  • Programme
Modèle de Régression Linéaire
  • Apprentissage basé sur une instance Vs. Apprentissage basé sur un modèle
  • Introduction aux données
  • Régression linéaire simple
  • Méthode des moindres carrés
  • Entrainer un modèle de régression linéaire avec Scikit-learn
  • Faire des prédictions
  • Régression linéaire multiple
Sélection des caractéristiques
  • Valeurs manquantes
  • Corrélation des colonnes de caractéristiques avec la colonne cible
  • Heatmap de la matrice de corrélation
  • Entrainer et tester le modèle
  • Supprimer les caractéristiques de faible variance
  • Modèle final
Gradient Descent
  • Introduction au Gradient Descent
  • Gradient Descent à un seul paramètre
  • Dérivée de la fonction de coût d'erreur
  • Fonction Gradient Descent
  • Fonction dérivée
  • Comprendre le gradient descendant pour des paramètres multiples
  • Gradient de la fonction coût pour plusieurs paramètres
Moindres carrés ordinaires
  • Estimation des moindres carrés ordinaires
  • La fonction de coût
  • Dérivée de la fonction de coût
  • Gradient Descendant vs. Moindres carrés ordinaires
Traitement, nettoyage et transformation des caractéristiques
  • Introduction
  • Caractéristiques de catégorie
  • Technique pour gérer les caractéristiques de catégorie: colonnes factices
  • Transformer des caractéristiques numériques impropres ou inappropriées
  • Valeurs manquantes
  • Imputer des valeurs manquantes
Projet guidé 2 : Prédiction des prix de vente de maisons