【番外編】スクレイピングせずにWebページ上の表データを一瞬で取得する方法をわかりやすく解説!

Sdílet
Vložit
  • čas přidán 4. 07. 2024
  • PythonによるWebスクレイピング番外編です!
    今回はWebページ上にある表データを一瞬で取得する方法をわかりやすく解説いたします。
    データの取得だけではすぐに終わってしまうので取得したデータを整形する方法もお伝えしていきます。
    非常に実践的な内容となっております。是非お楽しみください!
    00:00 イントロ
    01:02 データを一瞬で取得
    06:17 データの後処理
    ◎講義で使用するページ
    info.finance.yahoo.co.jp/rank...
    ■ 本講座のベースになっているUdemy講座
    PythonによるWebスクレイピング〜入門編〜
    www.udemy.com/course/python-s...
    ■ PythonによるWebスクレイピング入門
    Pythonを用いた業務効率化、自動化の中でも代表的なWebスクレイピングについてお伝えしていきます。ブラウザ操作の自動化からテキストや画像データの自動抽出等を行う方法についてわかりやすくお伝えします。
    【PythonによるWebスクレイピング入門】vol.01:ログインなどのブラウザ操作を自動化しよう(Selenium)
    • 【PythonによるWebスクレイピング...
    【PythonによるWebスクレイピング入門】vol.02:Webページ内のテキストデータを自動で抽出(Selenium)
    • 【PythonによるWebスクレイピング...
    【PythonによるWebスクレイピング入門】vol.03:Webページ内のテキストデータを自動で抽出(Beautiful Soup)
    • 【PythonによるWebスクレイピング...
    【PythonによるWebスクレイピング入門】vol.04:ランキングサイトの掲載情報を全て自動で取得する方法を徹底解説!
    • 【PythonによるWebスクレイピング...
    ■ 他シリーズ人気動画
    習得したい言語第1位!!Pythonとは? | 中学生でもわかるPython入門シリーズ
    • 01. 習得したい言語第1位!!Python...
    クラス | 中学生でもわかるPython入門シリーズ
    • 15. クラス | 中学生でもわかるPyth...
    PythonでぐるなびAPIを扱おう | Python活用シリーズ
    • PythonでぐるなびAPIを扱おう | P...
    ■ Twitter
    / 03imanyu
    ■ Udemy
    www.udemy.com/user/jin-xi-han...
    #スクレイピング #Python

Komentáře • 21

  • @supergiyao
    @supergiyao Před 3 lety +2

    ちょっとした入力ミスとかがあり、少し、つまづきながらですが
    楽しく学ばせてもらってます。
    上手に説明されておられるので、理解しやすいです。

    • @user-nm7pz5fk3y
      @user-nm7pz5fk3y Před 3 lety +1

      コメントありがとうございます!!
      そのようにおっしゃっていただき嬉しいです!!!
      引き続き楽しみながら頑張ってください!

  • @kzinnya988
    @kzinnya988 Před 2 lety +2

    いつもわかりやすい動画ありがとうございます。
    現在ヤフーファイナンス確認しますと、同一表の項目内に複数の数値が含まれていました。
    この場合、処理どのようにすればよいでしょうか?
    サンプル)「取引値」→数字、日にち / 「前日比」→数値、%(増減率)

  • @user-gd2cg9sz6k
    @user-gd2cg9sz6k Před 2 lety +1

    ちょうどやりたいことでした!助かります!

  • @chunpuzhang9656
    @chunpuzhang9656 Před 3 lety +3

    内容がとても分かりやすかったので勉強になりました!
    1:39にウェブページの裏のコードを確認する検証ツールの話をされたと思いますが,何を使っているかをお伺いしたくコメントさせていただきます.ご回答頂ければと思います.

    • @imanyu_programming
      @imanyu_programming  Před 3 lety

      Google Chromeの検証ツールを使用しているだけですよ!
      ferret-plus.com/1880

  • @tyama1224
    @tyama1224 Před 3 lety +2

    眼からウロコ。requestsもselenium考えなくていい。ちょー楽ですね。ありがとうござました。恐るべし、パンダっす。(笑)

  • @wataruamayumi
    @wataruamayumi Před 2 lety +1

    データの取り込みのところは簡単にできて感動しましたが、後処理は正直言って??でした。awkとかsedを使ったほうが楽なのでは???私はひねくれものなので気を悪くされたらごめんなさい。

  • @user-cg8zs1hb2x
    @user-cg8zs1hb2x Před 3 lety +2

    あるサイトで動画の方法を試してみました。
    そのサイトの検証ページを見ると、以下のように明らかにtableがあるのですが、
    「No tables found」と返っていてしまいます。
    考えられる対処方法などありますでしょうか…?
    中略
    (Yahoo株価など他のサイトで試すとうまくスクレイピングできるので、そのサイトの問題でしょうか…)

    • @imanyu_programming
      @imanyu_programming  Před 3 lety +1

      サイト側の問題な気がしますね、、、
      普通にスクレイピングを行うしかないかもしれません、、、

    • @user-cg8zs1hb2x
      @user-cg8zs1hb2x Před 3 lety

      ありがとうございます!

  • @user-fg7xy9zz7p
    @user-fg7xy9zz7p Před 3 lety +2

    df = df.astype({'順位': int})でエラーがでてしまいます。何故でしょうか;;

  • @ouka471
    @ouka471 Před 3 lety +2

    いまにゅさんって 若い頃の設楽統っぽい声

    • @imanyu_programming
      @imanyu_programming  Před 3 lety +2

      若い頃の設楽さんの声が分かりませんが、、、ありがとうございます!!笑

  • @user-mu3cu9zk6t
    @user-mu3cu9zk6t Před 3 lety +1

    ',' が消せません

    • @imanyu_programming
      @imanyu_programming  Před 3 lety

      コメントありがとうございます!
      どの部分のことでしょうか、、?