Introduzione
  • Introduzione
  • Data Science e Machine learning
  • Il processo di analisi
  • Codice del corso
Basi di R
  • Installare R
  • Installare RStudio
  • Personalizzare e utilizzare RStudio
  • Utilizzare altri IDE
  • R pro e contro
  • Commentare il codice
  • Operazioni matematiche di base
  • Creazione di oggetti
  • Le parentesi
  • Tipi di variabili in statistica
  • Le strutture dati in R
  • Vettori
  • Matrici
  • Array
  • Liste
  • Fattori
  • Dataframe
  • Stringhe
  • Date
  • Convertire le strutture dati
  • R base versus tidyverse
  • Operatori relazionali
  • Strutture di controllo
  • Funzioni
  • Impostare una directory di lavoro
  • Installare e richiamare un pacchetto
  • Formati dati e fonti comuni per l'analisi
  • Importazione dati
  • Files csv
  • Files Excel
  • Files txt
  • Subsetting
  • La famiglia apply
  • Manipolazione dati con dplyr
  • Altri pacchetti per la manipolazione dati
  • Unire due dataset
Analisi esplorativa
  • Analisi esplorativa
  • La funzione set.seed
  • Data cleaning
  • Alcuni metodi per la preparazione dei dati
  • Il pacchetto outliers
  • Forzare una variabile come fattore
  • Codificare le variabili categoriche
  • Standardizzazione dei dati
Machine learning
  • Introduzione al machine learning
  • Fasi del machine learning
  • Tipi di algoritmi per il machine learning
  • Problemi del machine learning
  • Metodi supervisionati
  • Analisi di regressione
  • Regressione lineare semplice
  • Regressione multipla in R
Classificazione
  • Regressione logistica in R
  • k-nearest neighbors
  • Calcolo della distanza
  • La distanza euclidea
  • Esempio di k-nn con R
  • Support Vector machines
  • Divisione dei dati in spazi non lineari
  • Esempi di SVM con R
  • Alberi di decisione
  • Esempi di DT con R
  • Il calcolo delle probabilità
  • Probabilità e metodo predittivo
  • Esempio di Naive Bayes con R
Metodi non supervisionati
  • Metodi non supervisionati
  • Clustering
  • L'algoritmo kmeans
  • Esempio di kmeans con R
  • Analisi delle associazioni
  • Apriori con R
Metodi ensemble
  • Metodi ensemble
  • Bagging
  • Boosting
  • Random Forest
  • XGBoost
  • Esempi di metodi ensemble con R
  • Tecniche per la riduzione della dimensionalità
  • Riduzione della dimensionalità con R
Text mining
  • L’uso del machine learning nell’analisi dei testi
  • Natural Language Processing
  • Trattamento e pulizia dei testi
  • Vettorializzazione di un testo
  • Misurare la distanza tra due testi
  • TF-IDF
  • Tipi di strutture per l'analisi
  • Le espressioni regolari con R
  • Naïve Bayes in R sullo spam