Bem-vindo(a) ao curso!
  • Boas vindas
  • Mais sobre Inteligência Artificial
----- Parte 1 - Fundamentos de Aprendizagem por Reforço -----
  • Bem-vindo(a) à Parte 1 - Fundamentos de Aprendizagem por Reforço
Q-Learning - Intuição e Visualização
  • Conteúdo
  • O que é aprendizagem por reforço?
  • A Equação de Bellman
  • O Plano
  • Markov Decision Process - MDP
  • Política x Plano
  • Adição de Penalidades - Living Penalty
  • Q-Learning - Intuição
  • Diferença Temporal
  • Q-Learning - Visualização
----- Parte 2 - Intuição Deep Q-Learning -----
  • Bem-vindo(a) à Parte 2 - Intuição Deep Q-Learning
Deep Q-Learning - Intuição
  • Conteúdo
  • Intuição Deep Q-Learning - Aprendizagem
  • Intuição Deep Q-Learning - Ações
  • Replay de Experiência
  • Políticas de Seleções de Ações
----- Parte 3 - Implementação Deep Q-Learning -----
  • Bem-vindo(a) à Parte 3 - Implementação Deep Q-Learning
Implementação Deep Q-Learning
  • Conteúdo
  • Configuração do Ambiente
  • IMPORTANTE: Configuração do ambiente
  • Carro autônomo - Parte 1
  • Carro autônomo - Parte 2
  • Carro autônomo - Parte 3
  • Carro autônomo - Parte 4
  • Carro autônomo - Parte 5
  • Carro autônomo - Parte 6
  • Carro autônomo - Parte 7
  • Carro autônomo - Parte 8
  • Carro autônomo - Parte 9
  • Carro autônomo - Parte 10
  • Carro autônomo - Parte 11
  • Carro autônomo - Parte 12
  • Carro autônomo - Parte 13
  • Carro autônomo - Parte 14
  • Carro autônomo - Parte 15
  • Carro autônomo - Parte 16
Visualização Deep Q-Learning
  • Carro autônomo - Nível 1
  • Carro autônomo - Nível 2
  • Carro autônomo - Nível 3
  • Carro autônomo - Nível 4
Anexo I - Redes Neurais Artificiais
  • Perceptron de uma camada
  • Redes multicamada - função soma e função de ativação
  • Redes multicamada - cálculo do erro
  • Descida do gradiente
  • Cálculo do parâmetro delta
  • Ajuste dos pesos com backpropagation
  • Bias, erro, descida do gradiente estocástica e mais parâmetros
  • Funções de ativação I
  • Funções de ativação II
Considerações finais
  • AULA BÔNUS