Princípios de Big Data
  • Introdução ao curso
  • O que é um cluster?
  • Introdução a Big Data
  • Aplicações de Big Data
  • A História do Hadoop
  • Infraestrutura - Crescimento Vertical e Horizontal
  • Funcionamento do HDFS
  • Hadoop Map Reduce
  • Entenda agora! Resumão do Capítulo
Infraestrutura - Montando um ambiente de Big Data
  • Resumo do Ambiente
  • Instalando o VirtualBox
  • Instalando o Windows 10
  • Habilitando e configurando os adicionais de convidados
  • Entendendo as variáveis de ambiente
  • Executando o programa pelo Path
  • Instalação e configuração do JDK e do JRE
  • Instalando o Anaconda e verificando as variáveis de ambiente
Configuração do Apache Spark no Windows 10
  • Descompactando e configurando o Spark
  • Configurando o Hive SQL
  • Executando o PySpark e entendendo o Spark Context
Princípios de Desenvolvimento em Spark
  • Funções Lambda
  • List Comprehensions
  • Utilizando a função Map
  • Utilizando Map com boleanos
  • Função Filter
  • Princípios de RDD
  • Aplicando a função Reduce
Arquitetura Spark
  • Spark x Hadoop Map Reduce
Utilizando o Apache Spark
  • Introdução a RDDs e contexto
  • Operações com RDDs