Introducción
  • Introducción
  • Pre requisitos del curso
  • Contenidos del curso
  • Conoce a Juan Gabriel Gomila, tu profesor de Data Science
  • Acerca de la valoración prematura del curso en Udemy
Conoce R y RStudio
  • Descargando nuestra herramienta de trabajo: R y R Studio
  • Ayuda con la instalación de R y Rstudio
  • Si tienes problemas con Ubuntu...
  • La organización es la clave
  • Repositorio de los proyectos del curso de Data Science
  • Un paseo por la interfaz de R Studio
  • Comunidad de estudiantes del curso
Adquirir y preparar nuestros ingredientes - Los datos
  • Preparando los datos para su análisis
  • ¿En qué consiste esto del Data Science?
  • El fichero CSV y la función read.csv
  • Opciones adicionales de read.csv
  • Los datos en CSV
  • Leyendo datos de un XML
  • Leyendo tablas incrustadas en un HTML
  • Problemas leyendo tablas en HTML
  • Los datos en XML
  • Leyendo datos desde un JSON
  • Alternativa a la API de Yahoo finanzas
  • Acceso a los datos con la sintaxis de $
  • Los datos en un JSON
  • Los ficheros de ancho fijo
  • Los datos en un fichero de ancho fijo
  • Creando ficheros Rdata y rds
  • Cargando ficheros Rdata y rds
  • Los ficheros de datos de R
  • Eliminar datos sin valor con na.omit
  • Limpieza selectiva de los datos sin valor
  • Reemplazo de NA con la media o extracción aleatoria
  • Evitando duplicaciones de entradas
  • Reescalado lineal de datos
  • Normalizando o estandarizando datos de un data frame
  • Limpieza de datos
  • Categorizando información numérica
  • Variables ficticias para categorizaciones
  • Formas de eliminar la información que falta
  • Formas de completar la información que falta
  • Preparando nuestros datos iniciales
  • Combinando y separando los datos
  • Uso de modelos predictivos para eliminar NAs
  • Detección de outliers a través de box plots
  • Enmascarando los outliers con transformaciones y cappings
  • Corrección de los datos
¿Qué tenemos aquí? - El análisis exploratorio datos
  • Acerca del análisis exploratorio de los datos
  • Resumiendo nuestros datos con summary y str
  • Estadísticos y medidas básicas
  • Análisis exploratorio inicial
  • Subconjuntos de datos
  • Divisiones con split
  • Partición de data frames con variables numéricas
  • Partición de data frames con variables categóricas
  • División de los datos
  • Histogramas, boxplots y scatterplots
  • Personalizando nuestros gráficos
  • Múltiples gráficos con la función par
  • El paquete lattice
  • Comparación a través de representaciones
  • El gráfico de las judías
  • Análisis de la causalidad
  • Representación de los datos
  • La técnica de la validación cruzada
  • Gráficos cuantil - cuantil
¿Donde pongo esto? - El proceso de clasificación
  • Acerca de la clasificación en data science
  • Cómo generar matrices de confusión
  • Diagramas de mosaico
  • Análisis de componentes principales
  • Diagramas ROC
  • Análisis y representaciones para clasificar correctamente
  • Los árboles de clasificación
  • La poda del árbol de clasificación
  • Los bosques aleatorios
  • Árboles y bosques de clasificación
  • Máquinas de soporte vectorial
  • Naïve Bayes
  • K Nearest Neighbors
  • Eligiendo el mejor número de vecinos para la decisión
  • Redes neuronales para clasificar
  • Análisis del discriminante lineal
  • La regresión logística
  • Técnicas de clasificación
  • Conexión a la API de Twitter
  • Limpiando los tweets descargados
  • Clasificación de textos para análisis de sentimiento
¿Cuanto voy a vender? - Regresión
  • La regresión para predecir valores
  • La raíz del error cuadrático medio
  • K nearest neighbors
  • K Nearest Neighbors sin partición de validación
  • Regresión Lineal
  • Entendiendo los gráficos de los residuos en un modelo lineal
  • Opciones para las fórmulas de un modelo lineal