Introduction
  • Installation Jupyter Notebook
  • Utilisation Jupyter Notebook
APIs Scraping
  • Introduction aux APIs et à la requête GET
  • Les codes Status
  • Paramètres de requête
  • Format JSON
  • Obtenir un JSON depuis une requête
  • Type de contenu
  • Défi: Trouver le nombre de personnes dans l'espace
Authentification à une API
  • Authentification à l'API de Github
  • Points d'accès ou endpoints
  • Pagination
  • Point d'accès User-Level
  • Requête POST
  • Requête PATCH/PUT
  • Requête DELETE
Cas pratique: API Reddit
  • Authentification à l'API de Reddit
  • Extraire l'article le plus populaire
  • Extraire tous les commentaires de cet article
  • Extraire le commentaire le plus populaire
Web Scraping
  • Introduction au web scraping
  • Récupérer des éléments d'une page
  • Utiliser Find All
  • Eléments correspondant aux IDs
  • Les classes
  • Sélecteurs CSS
  • Association de sélecteurs en CSS
Challenge 1: Site météo
  • Exploration de la structure de la page web
  • Extraire toutes les informations d'un élément
  • Extraire toutes les informations de la page
  • Affichage du résultat avec Pandas
Challenge 2: Critique de films
  • Introduction au site web
  • Structure de l'URL
  • Structure HTML de la page
  • Extraire la data pour un seul film
  • Script pour scraper une seule page
  • Affichage du DataFrame avec Pandas
  • Script pour toutes les pages
  • Contrôler le taux des requêtes envoyées
  • Script final
  • Script final (code)
  • Affichage final des données
SECTION BONUS : MERCI
  • Session Bonus