Soyons enthousiastes !
  • Bienvenue au cours Data Science A-Z
Que sont les Data Sciences ?
  • Intro (ce que vous allez apprendre dans cette section)
  • Le job du futur
  • Les domaines des Data Sciences
  • Important: Approches du cours
--------------------------- Partie 1: Visualisation ---------------------------
  • Bienvenue à la Partie 1
Introduction à Tableau
  • Intro (ce que vous allez apprendre dans cette section)
  • Installer Tableau Desktop et Tableau Public
  • Description du challenge et des données
  • Connecter Tableau à un fichier CSV
  • Naviguer dans Tableau - Mesures et Dimensions
  • Créer un calculated field
  • Ajouter des couleurs
  • Ajouter des labels et changer le format
  • Exporter votre worksheet
  • Récapitulatif de la section
Utiliser Tableau pour le Data Mining
  • Intro (ce que vous allez apprendre dans cette section)
  • Obtenir le Dataset
  • Connecter Tableau à un fichier Excel
  • Visualiser un A-B test dans Tableau
  • Travailler avec les Aliases
  • Ajouter une Reference Line
  • Chercher des anomalies
  • Une astuce pratique pour valider votre approche
  • Récapitulatif de la section
Data Mining avancé avec Tableau
  • Intro (ce que vous allez apprendre dans cette section)
  • Créer des bins et visualiser des distributions
  • Créer un test de classification pour une variable numérique
  • Combiner deux graphes et travailler avec dans Tableau
  • Valider le Data Mining dans Tableau avec un test du khi-deux
  • Test du khi-deux quand il y a plus de deux catégories
  • Visualiser le solde et la distribution du salaire estimé
  • Bonus: Test du khi-deux Partie 1 (Tutoriel de Stats)
  • Bonus: Test du khi-deux Partie 2 (Tutoriel de Stats)
  • Récapitulatif de la section
  • Les bases de Tableau
---------------------------- Partie 2: Modélisation ----------------------------
  • Bienvenue à la Partie 2
Rappels de Statistiques
  • Intro (ce que vous allez apprendre dans cette section)
  • Types de variables: Catégorique vs Numérique
  • Types de régressions
  • Méthode des moindres carrés ordinaires
  • R-squared
  • Adjusted R-squared
Régression Linéaire Simple
  • Intro (ce que vous allez apprendre dans cette section)
  • Introduction à Gretl
  • Obtenir le dataset
  • Importer les données et faire des statistiques descriptives
  • Lire des outputs de Régression Linéaire Simple
  • Tracer et analyser un graphe
Régression Linéaire Multiple
  • Intro (ce que vous allez apprendre dans cette section)
  • Attention: les hypothèses de la Régression Linéaire Multiple
  • Obtenir le dataset
  • Les Dummy Variables
  • Le piège des Dummy Variables
  • Manières de construire un modèle: BACKWARD, FORWARD, STEPWISE
  • Backward Elimination - Un peu de pratique
  • Utiliser le Adjusted R-squared pour créer des modèles robustes
  • Interpréter les coefficients de la Régression Linéraire Multiple
  • Récapitulatif de la section
Régression Logistique
  • Intro (ce que vous allez apprendre dans cette section)
  • Obtenir le dataset
  • Problèmes Business de type Oui/Non
  • L'intuition de la Régression Logistique
  • Votre première Régression Logistique
  • False Positives et False Negatives
  • Matrice de Confusion
  • Interpréter les coefficients de la Régression Logistique
Construire un modèle robuste de segmentation géo-démographique
  • Intro (ce que vous allez apprendre dans cette section)
  • Obtenir le dataset
  • Qu'est-ce que la segmentation géo-demographique ?
  • Construisons le modèle - première itération
  • Construisons le modèle - backward elimination: STEP-BY-STEP
  • Transformer des variables indépendantes
  • Créer des variables dérivées
  • Vérifier la multi-colinéarité en utilisant VIF
  • Matrice de Corrélation et Intuition de la multi-colinéarité
  • Récapitulatif de la section
Evaluer votre modèle
  • Intro (ce que vous allez apprendre dans cette section)
  • Le paradoxe de la précision
  • Cumulative Accuracy Profile (CAP)
  • Construire une courbe CAP avec Excel
  • Evaluer le modèle en utilisant une courbe CAP
  • Obtenir le template de courbe CAP
  • Utiliser un test set pour empêcher l'overfitting
  • Appliquer le modèle à un test set
  • Comparer la performance sur le training set et le test set
  • Récapitulatif de la section