Introducción a la ciencia de datos y machine learning
  • Introducción
  • Definiciones
  • Introducción al aprendizaje automático
  • Tipos de aprendizaje automático
  • Aprendizaje supervisado vs no supervisado
  • Problema del sobreentrenamiento
  • Pasos para construir un modelo de machine learning
  • Cuestionario de evaluación machine learning
Librerías para tratamiento y visualización de datos con python
  • Librerías de Python para machine learning:Numpy, SciPy, Pandas
  • Instalación anaconda + jupyter notebook
  • Conjunto de datasets
  • Crear nuestro propio dataset
  • Introducción a pandas
  • Ejemplos prácticos tratamiento de datos con pandas
  • Librerías de visualización de datos con python
  • Ejemplos prácticos visualización de datos
  • Visualizacion datos con bokeh última version 0.12.10
  • Librerías de machine learning con python
  • Cuestionario de evaluación tratamiento y visualización de datos
Scikit-learn como librería de machine learning
  • Introducción a scikit-learn
  • Datasets sklearn
  • Algoritmos de Machine Learning en scikit-learn
  • Introducción a la regresión lineal
  • LinearRegression como algoritmo de regresión lineal
  • Resolver problema de predecir el tráfico web
  • Logistic Regression como algoritmo de regresión logística
  • LogisticRegresion gráfico
  • Introducción a los árboles de decisión
  • DecissionTreeClassifier como algoritmo de árboles de decision
  • DecissionTreeRegressor como algoritmo de selección de mejores atributos
  • SVM como algoritmo de máquinas de vectores de soporte
  • Implementación del algoritmo SVM en scikit-learn
  • Clasificador de dígitos con el algoritmo SVM en scikit-learn
  • K-NN (K Nearest Neighbor) como algoritmo de clasificación supervisada
  • Implementación de KNeighborsClassifier en scikit-learn
  • KneighborsClassifier vs RadiusNeighborsClassifier
  • Clustering y aprendizaje no supervisado
  • Aplicaciones de clustering
  • Tipos de clustering
  • K-means como algoritmo de clustering
  • Implementación de K-means en scikit-learn
  • Ejemplos kmeans en scikit-learn
  • AffinityPropagation en scikit-learn
  • Titanic Dataset gráficos
  • Titanic Dataset Scikit-learn
  • Cuestionario de evaluación scikit-learn
Pyspark como librería de big data y data science
  • Introducción al big data
  • Introducción a Apache Spark
  • Módulos de Apache Spark
  • Spark para Científicos de Datos
  • Instalación de Apache Spark
  • Consola interactiva en pyspark
  • SparkContext y esqueleto de una aplicación con pyspark
  • SparkSubmit para la ejecución de scripts python
  • SparkSubmit parte práctica
  • Datasets y RDD con pyspark
  • Crear un RDD en python con pyspark
  • Operaciones sobre un RDD
  • Transformaciones sobre un RDD
  • Map Reduce en pyspark
  • Funciones lambda en python
  • Resumen operaciones pyspark
  • Resumen operaciones map reduce
  • Instalar y ejecutar Pyspark con docker
  • Instalar y ejecutar Pyspark con docker
  • Contador de palabras con pyspark
  • Palabras más frecuentes de un texto con pyspark
  • Leer ficheros csv
  • Lectura ficheros json con pyspark
  • Trabajando con Spark SQL y dataframes
  • Resumen operaciones sql dataframes pyspark
  • Docker compose y ejemplo cluster con pyspark
  • MLlib como módulo de machine learning con pyspark
  • Introducción a MLlib
  • Ejemplo clasificación Spam con mLlib
  • Clustering con pyspark. Algoritmo Kmeans
  • Cuestionario de evaluación pyspark
Sistemas de recomendación
  • Definir sistema de recomendación
  • Tipos de sistemas de recomendación
  • Filtros basados en contenido (Content-Based Filtering)
  • Practica filtro basado en contenido
  • Practica filtro basado en contenido mediante extracción de atributos
  • Filtros colaborativos (Collaborative Filtering)
  • Práctica filtro colaborativo
  • Práctica filtro colaborativo csv
  • Conclusiones
  • Cuestionario de evaluación sistemas de recomendación
Recursos y artículos
  • Recursos y artículos
  • Artículos deep learning