Introduzione al corso
  • Come ottenere il rimborso del corso in caso di problemi
  • CODICE
Basi di R
  • Installare R
  • Installare RStudio
  • Personalizzare e utilizzare RStudio
  • Utilizzare altri IDE
  • R: pro e contro
  • Commentare il codice
  • Operazioni matematiche di base
  • Creazione di oggetti
  • Le parentesi
  • Tipi di variabili in statistica
  • Le strutture dati in R
  • Vettori
  • Matrici
  • Array
  • Liste
  • Fattori
  • Dataframe
  • Date
  • Convertire le strutture dati
  • R base versus tidyverse
  • Operatori relazionali
  • Files csv
  • Files Excel
  • Files txt
  • Subsetting
  • La famiglia apply
  • Manipolazione dati con dplyr
  • Altri pacchetti per la manipolazione dati
  • Unire due dataset
Le basi del text mining
  • Introduzione al text mining
  • Utilizzi dell'analisi del linguaggio
  • Strutture dati per l'analisi testi
  • I problemi nel trattamento del linguaggio
  • Le fasi dell'analisi testi
Gestire le stringhe
  • Le librerie per il trattamento del linguaggio con R
  • Gestione delle stringhe con R
  • Codice per la gestione delle stringhe in R
  • Codice per la gestione delle stringhe in R / seconda parte
  • Le espressioni regolari
Importazione dati
  • Formati dati e fonti comuni nel text mining
Text mining con R base
  • Introduzione al text mining con R base
  • Codice per l’analisi di testi tramite le funzioni base
  • Codice per l’importazione e analisi di un corpus
Text mining con tm
  • Il pacchetto tm
  • Importazione dati
  • Pulizia e analisi del testo con tm
  • Importazione di un corpus di documenti
  • Analisi di base di un corpus
  • Creare le matrici
Machine learning supervisionato sui testi
  • L'uso del machine learning per l'analisi dei testi
  • Metodi supervisionati
  • Metodi di regressione
  • La regressione logistica
  • Codice per la regressione logistica sui testi con R
  • Probabilità e metodi bayesiani
  • Codice per il Naive Bayes sullo spam
  • Decision Trees
  • Codice per gli alberi di decisione
Machine learning non supervisionato sui testi
  • Metodi non supervisionati
  • Clustering
  • Codice per il clustering sui testi
  • LDA e topic models
  • Codice per i topic models con R
Social Media Mining e analisi sui testi
  • Creazione di un account Twitter per sviluppatori
  • Il pacchetto rtweet
  • Analisi sui tweet con il pacchetto tm
Altri pacchetti per il text mining
  • Altri pacchetti per il text mining
  • Il pacchetto tau
  • Il pacchetto textcat
  • Il pacchetto qdap per la pulizia dei testi
  • Il pacchetto koRpus
  • text2vec
  • Natural Language Processing
  • Calcolo degli N-gram
Visualizzazione dei dati testuali
  • Visualizzazione dati testuali
  • Creazione di wordcloud
  • Creazione di wordcloud su corpus di documenti
  • Creazione di piramidi polarizzate
  • Rappresentare i cluster
Sentiment Analysis
  • Introduzione alla Sentiment Analysis
  • Sentiment Analysis - metodi non supervisionati
  • Sentiment - pacchetto syuzhet
  • Sentiment - qdap
  • Sentiment - sentR
  • Sentiment - sentimentr