データサイエンスの理解
- 1-1成り立ちと現在
- 1-2具体的事例
2回Rの導入
- 2-1-1データサイエンスの道具
- 2-1.1 検定
- 2-1-2相関と回帰
- 2-1-3分類
- 2-2-1データサイエンスのソフトウェア
- 2-2-2R/RStudioのインストール
- 2-3Rstudioの画面操作
- 2-4-1データの読み込み
- 2-4-2Rで使用される用語
- 2-5-1前回までの確認
- 2-5-2データの中心
- 2-5-3データの幅
- 2-6-1モダンな操作
- 2-6-2母集団と標本そして検定
- 2-7-1モダンなグラフ日本語設定
- 2-7-2ggplot2によるヒストグラム
- 2-7-3散布図
- 2-7-4グループを分ける
- 2-7-5クラスター分析
- 2-7-6主成分分析
3回データサイエンスの手法
- 3-1検定
- 3-2-1回帰・分析
- 3-2-2ロジステック回帰分析
- 3-2-3決定木
- 3-3クラスタリング
- 3-3-1階層型クラスタリング
- 3-3-2k平均法
- 3-4-1次元削減とは
- 3-4-2-1主成分分析
- 3-4-2-2主成分分析の実行
- 3-4-2-3主成分の抽出とバイプロット
- 3-4-2-4累積寄与率の計算
4回データ分析プロセス
- 4-1分析プロセスの概要
- 4-2ビジネス課題の明確化
- 4-3分析計画の立案
- 4-4データの選定収集
- Rコード解説について
- 4-5データの特性理解
- 4-6データの前処理
- 4-7予測モデルの構築
- 4-7-2予測モデルの構築2
5回データ活用事例
- 5-1e-statの紹介
- 5-1e-statからのデータ取得&日本地図への描画_1
- 5-1e-statからのデータ取得&日本地図への描画_2
- 5-1e-statからのデータ取得&日本地図への描画_3
- 5-1e-statからのデータ取得&日本地図への描画_4
- 5-2テキストマイニング