学習内容
- Pythonと機械学習、データマイニング、およびデータサイエンスの様々な技術を用いて大規模なデータを分析できるようになります。
- Apache SparkとMLLibパッケージを使用して、「ビッグデータ」上で機械学習を行うことができるようになります。
- A / Bテストを設計し、結果を分析できるようになります。
- matplotlibを用いて、Pythonによるクラスタリングと回帰分析を可視化できるようになります。
- 協調フィルタリング技術を用いて、製品やコンテンツの自動リコメンドができるようになります。
- 分析前のデータクリーニング、及びデータの準備のベストプラクティスが身につきます。
講座内容
Amazonで長年レコメンドシステムの開発に携わった、Frank Kaneが教えるデータサイエンスと機械学習のコースです。Pythonを用いて統計学を基礎から学び、商品のレコメンドシステムや、簡易な検索エンジン、スパムメールのフィルタなどの構築も実際に行います。
データサイエンスと機械学習は、今最も学ぶに値する技術の一つです。
調査会社Glassdoorの発表によると、データサイエンティストは最も収入の高い職業のひとつで、全米平均で一人あたり$ 120,000の年収を得ているとのことです。また、データサイエンスを学ぶことは、巨大なデータの活用がビジネスの成否を左右する現代において、様々な局面であなたの力になります。
このコースは、基本的なプログラミングやコーディングのスキル、高校以上の数学の知識をお持ちの人が対象です。Tech業界で実際に使われているデータサイエンスのスキルを身につけ、データサイエンティストとしての即戦力を身につけられます。コースは全体で9時間、68のレクチャーからなり、実践的な学び方を重視しています。また、参考となるPythonのソースコードも活用いただけます。Frank KaneのAmazonやインターネット・ムービー・データベース(IMDB)における9年間の経験をもとに、データサイエンティストの現場の実情を交えながらお話します。
このコースで扱うトピックは、最先端のtech企業が実際に求人情報に出している、データサイエンティスト採用の要件をベースにしています。機械学習とデータマイニングにおいて、実際の企業が求めているスキルをカバーします。
- 回帰分析
- K平均法
- 主成分分析
- 訓練/テストと交差検定
- ベイズ法
- 決定木とランダムフォレスト
- 多変数回帰
- マルチレベルモデル
- サポートベクターマシン
- 強化学習
- 協調フィルタリング
- K近傍法
- バイアス/バリアンスのトレードオフ
- アンサンブル学習
- TF-IDF
- 実験計画法およびA / Bテスト
そして、Apache Sparkでの機械学習についてのセクションでは、上記のスキルをビッグデータ分析でも扱えるようになります。
Pythonを初めて学ぶかた向けには、短期集中でPythonを学べるセクションを用意しています。少しプログラミングの経験があるかたならば、比較的容易に身につけることができるはずです。このコースでは、Microsoft WindowsベースのPCでセットアップをしていきます。サンプルコードは、MacOSやLinux上でも実行可能ですが、OS固有のサポートを提供できないことはあらかじめご了承ください。
それぞれの分析手法について難しい数学用語や専門用語を避け、なるべく平易な言葉で説明を行います。また、コース内ではPythonを使ってデモを行いますが、同じソースコードを使って、ご自身のPCで実証をしていただけます。また、今後のための参考資料も用意しています。
次のキャリアを模索しているプログラマの方や、tech業界への転職をお考えのデータ・アナリストの方、実際のデータサイエンティスが業務で使っているテクニックを身につけてみませんか。
また、データサイエンスの知識を実際の業務に活かしたい方、人工知能や機械学習に興味がある方にもお勧めです。データに基づくロジカルな思考は、様々なビジネスの場面であなたをサポートします。
ぜひ、コースをお楽しみください。
受講生が購入したその他のコース
講師のプロフィール
- 4.24 Calificación
- 58941 Estudiantes
- 16 Cursos
我妻 幸長 Yukinaga Azuma
人工知能(AI) / ディープラーニング / 機械学習 / プログラミング / iOS
「ヒトとAIの共生」がミッションの会社、SAI-Lab株式会社の代表取締役。AI関連の教育と研究開発に従事。
東北大学大学院理学研究科修了。理学博士(物理学)。
法政大学デザイン工学部兼任講師。
興味の対象は、人工知能(AI)、脳科学、ネイティブアプリ開発、シンギュラリティなど。
オンライン教育プラットフォームUdemyで、数万人にAIを教える人気講師。
複数の有名企業でAI研修を担当。
エンジニアとして、VR、ゲーム、SNSなどジャンルを問わず様々なアプリを開発し、多数の講演を行う。
著書に、「はじめてのディープラーニング」「はじめてのディープラーニング2」(SBクリエイティブ)、「Pythonで動かして学ぶ!あたらしい数学の教科書 機械学習・深層学習に必要な基礎知識」「あたらしい脳科学と人工知能の教科書」(翔泳社)。共著に「No.1スクール講師陣による 世界一受けたいiPhoneアプリ開発の授業」(技術評論社)。
受講生からのフィードバック
コース評価
レビュー
データサイエンス初心者の私には内容があいませんでした。 理由は以下です。 1.コースで利用するEnthought Canopyが現時点では利用できないのにそれベースで研修が進められていること。Anacondaでも利用可能とありますが、それであればコースを作り直すべきだと思います。 2.資料が翻訳をベースとされているからか記載内容が浅いように感じました。また資料の内容を補完するために音声での解説を期待していましたが、基本的に資料の内容を読んでおられるだけでした。 3.コースにストーリーが感じられず、ばらばらのトピックを並べられるように思い、受講後にこれができるようになったという実感が得られませんでした。
データの取り扱いや機械学習のアルゴリズムが学習できる有意義なコースでした。 環境構築等から始めて苦労して勉強出来たのでとても勉強になったかと思います。 Sparkの部分は記事が古く、canopyがダウンロードが出来なくなり、Google colabかWindowsのanaconda環境のどちらで検証した方が良いか分からなかったのでそちらの部分は記載があると良かったかと思います。