Webスクレイピングをするときは、Selenium
がとても便利ですよね。
Python
でSelenium
を利用することが増えてきたので、
いつでもすぐに始められるようにSelenium
の環境構築手順をまとめました。
環境
- macOS
- Python 3.7~
- Google Chrome 80~
※Pythonをインストールしていない方は事前にインストールをお願いします。
ChromeDriverのインストール
ターミナルを開き、homebrew
でchromedriver
をインストールします。
$ brew install chromedriver
もしエラーが出たら、こちらを実行すれば大丈夫です。
$ brew cask install chromedriver
pip
でインストールもできます。
$ pip install chromedriver
pip
インストールでSelenium
をインストールします。
pip
が入っていない方は、事前にインストールをお願いします。
$ pip install selenium
Pythonソースコード
以下のコードのように実装することで、Selenium
を動かすことができます。
以下はWordPress
の公式ページにアクセスして閉じるだけのコードですが、
フォームに自動で入力させたり、ボタンを押下させたりできます。
# coding: UTF-8 import chromedriver_binary from selenium import webdriver # WebDriver のオプションを設定する options = webdriver.ChromeOptions() # Chromeを起動します driver = webdriver.Chrome(options=options) # アクセスしたいサイトのURLを記載します driver.get('https://ja.wordpress.com/') # ブラウザを終了します driver.quit()
上記のソースでエラーが出る場合
chromedriverでエラーが出る場合はこちらでインストールしてみます。
$ pip install chromedriver-binary
また、chromedriver
のバージョンでエラーが起こる場合は、
バージョンを指定してインストールします。
Chrome
のブラウザのバージョンと同じにしないといけない場合が多いです。
Chrome
のバージョンと同じものを指定します。
(Chromeのバージョンはツールバーにあるボタンをクリックし、「ヘルプ」→「Google Chromeについて」から確認できます。)
chromedriver
のバージョンはこちらから確認します。
バージョンを確認できたら、バージョンを指定してインストールします。
$ pip install chromedriver-binary==80.0.3987.149
これからもSelenium
について追記していきます!