イントロと環境構築
  • このコースの概要
  • 強化学習の枠組み
環境構築(Windows)
  • Anaconda3 5.0.0 のインストール
  • 仮想環境の追加とTensorFlowのインストール
  • TensorFlow 1.3 GPU版のインストール(NVIDIA GPU搭載機のみ可能)
環境構築(macOS)
  • Anaconda3のインストール
  • TensorFlowのインストール(macOS)
Qテーブルによる学習
  • FrozenLake問題
  • FrozenLake問題に取り組む上での注意
  • OpenAI GymとJupyter Notebookをインストールしよう
  • Qテーブルを更新するプログラムを書こう
  • 課題: Qテーブル
Qネットワーク学習
  • QテーブルからQネットワークへ
  • Qネットワーク学習(1/3)ノートブックの追加
  • Qネットワーク学習(2/3)学習の流れ
  • Qネットワーク学習(3/3)学習の実行
  • 課題: Qネットワーク学習
  • コードサンプル(課題)
多腕バンディット問題(方策勾配)
  • Q学習から方策勾配へ
  • プログラムの処理の流れ
  • Pythonでコードを書いてみよう(1/2)
  • Pythonでコードを書いてみよう(2/2)
  • 課題: 多腕バンディット(腕の数を変更して実行)
カートポール問題(方策勾配法 その2)
  • このセクションの概要
  • カートポール問題のGymを動かしてみよう
  • 倒れたら環境をリセットしよう
  • DQNとエクスペリエンス・リプレイ
  • TensorFlowで実装してみよう(ネットワークのクラス定義)
  • Experienceを格納するMemoryクラスの定義
  • パラメーター初期化とエクスペリエンスの保存
  • エクスペリエンスメモリーを蓄積しよう
  • トレーニングを実行しよう(1/2)
  • トレーニングを実行しよう(2/2)
  • matplotlibで結果を可視化しよう
  • テスト(エージェントにゲームをプレイさせてみよう)
  • このセクションで使用したノートブック
ボーナスセクション
  • 外部リファレンスや参考図書
  • AI・ディープラーニングのおすすめコース
  • CUDAのインストール(TensorFlow入門より)
  • cuDNNのインストール(TensorFlow入門より)