- はじめに
- Webスクレイピングとは
- 今回使用するサイトについて
- Seleniumのインストールと準備
- 自動でログイン
- 演習:パスワードを入力せよ
- テキストデータの取得
- 演習:各項目の抽出
- テキストデータを一括取得
- 演習:値の抽出
- CSVファイルに出力
- 1つの観光地の情報を取得
- 演習:総合評価の取得
- すべての観光地の情報を取得
- 演習:総合評価と各項目をまとめて取得
- 全ページの情報を取得
- Pillowの使い方
- 1枚の画像を取得
- すべての画像を取得
- Xpathとは
- Yahoo!路線情報で検索
受講生8,000人を超えるキカガク講師によるPythonによるWebスクレイピング入門が登場。
PythonによるWebスクレイピングの実装方法を学び、定期的なデータの収集を効率化しましょう。
Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。
【コース概要】
以下、本コースで扱う大枠の内容となっております。
Webページに自動でログイン
テキストデータを取得
ランキング形式のサイトから一括で情報を取得
画像データを取得
まとめた情報をCSVファイルに出力
検索サイトのクエリを把握
本講座では、講師自作のWebページを用いてWebスクレイピングを行います。
画像処理ライブラリであるPillowやスクレイピング・クローリングライブラリであるSeleniumの導入についても解説します。
【注意】
本講座はWebスクレイピング初学者向けであり、Webスクレイピングの基礎をしっかりと身につけていただきたいので高度な内容は抑えております。
しっかりとカリキュラムをご覧になった上でご受講ください。
HTML, CSSの基礎的な知識がある前提で講座を進めております。
理解できていない方はprogateで勉強してから受講してください。
Pythonの基本的な文法、Jupyter Notebookの使い方がわかる前提で講座を進めております。
理解できていない方は以下2つの動画(Udemy)で勉強してから受講してください。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】プログラミング力向上のためのPythonで学ぶアルゴリズム論(前編)
プログラミング教育系YouTuber
2021年1月現在、約2万人のチャンネル登録者がいる「いまにゅのプログラミング塾」を運営。
プログラミング初学者がプログラミングを楽しみ、ビジネス活用につなげていくための講座を公開中。
■書籍
・図解ポケット 今日から使える! データサイエンスがよくわかる本
・Tableauで始めるデータサイエンス
-----
元 株式会社キカガク 取締役COO
大学では多変量解析を専攻。大学時代4年間、塾講師として「教育」に熱中し、300名以上の中高生の授業を担当。
現在はキカガク開催の短期セミナー・長期コースのメイン講師、社内外の講師育成を担当。ビジネスパーソン向けのAI関連セミナーにて300名以上の教育実績を持ち、セミナー事業の責任者として機械学習教育に注力。
Udemyデビュー作はベストセラーとなり、2作目はわずか1ヶ月で受講生1000名を突破。初学者・中級者をメインに講座を展開しています。