Questo corso base sui Python si pone l'obiettivo di accompagnare chi non conosce questo linguaggio attraverso le basi del linguaggio stesso verso i concetti più importanti del data mining.
Python è uno dei linguaggi di programmazione più conosciuti e utilizzati nel campo dell'analisi dati e data science. Questo corso si rivolge soprattutto a chi vuole proviene da un altro linguaggio o non sa programmare, ma vuole imparare a farlo in un'ottica di analisi dati.
Questo corso Python ti spiega per prima cosa sono e come creare degli oggetti: Python si basa su alcune strutture che è necessario conoscere, come tuple, liste, set, dizionari e dataframe. In questo corso Python imparerai a crearle e manipolarle.
Una volta create queste strutture dati, imparerai a manipolarle, salvarle sul computer ed estrarne degli elementi. In questo corso Python ti insegnerò anche le basi di creazione di una funzione.
Nelle sezioni del corso Python imparerai una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test, come rimuovere degli elementi duplicati, come iterare un'azione e come gestire le date. Parleremo anche di alcune nozioni importanti nella programmazione ad oggetti, ad esempio come creare una classe e come gestire errori ed eccezioni.
Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. In questo corso Python imparerai come si importa un dataframe dal computer, o da internet.
Un altro argomento importante cha affrontiamo in questo corso Python è come gestire i dati, come manipolarli, modificarli, aggregarli, ordinarli in maniera orizzontale e longitudinale. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come pandas, uno dei pacchetti più importanti per l'analisi dati in Python.
Una delle strutture più importanti nella programmazione Python è l'array creato col pacchetto Numpy: grazie a questo pacchetto imparerai a manipolare questo tipo di struttura e a generare dei dataset casuali.
Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso Python a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto Matplotlib.
Nelle ultime parti del corso Python cercherò di darti un'idea del pacchetto scikit-learn, uno dei più importanti quando si parla di machine learning. Per ultimo riepilogheremo gli argomenti visti e vedremo come gestire le date e reperire dei dataset online per i test.