Python requestsを使ってグーグル検索をする

Pythonでは「requests」を使ってかんたんにグーグル検索をすることができます。

WEBへの接続の1例としてグーグル検索を取り上げますが、そのほかにも様々なWEBサイトへ接続することができます。

今回は、requestsを使ってグーグル検索をする方法を解説します。

requestsを使ってグーグル検索をする

準備

「requests」はPython標準ライブラリではありません。「requests」を事前にダウンロード・インストールしておく必要があります。

参考ページRequestsをインストールする方法

 

グーグルで検索する

import requests

url = 'https://www.google.co.jp/search'

# グーグルへ接続
req = requests.get(url, params={'q': 'パイソン'})

# アドレス取得
req.url
#[結果] 'https://www.google.co.jp/search?q=%E3%83%91%E3%82%A4%E3%82%BD%E3%83%B3'

# 検索結果取得
req.text
#[結果] <!doctype html><html itemscope="" 以下省略

「requests」を使ってグーグルで「パイソン」を検索しました。

requests.get

「requests.get」でWEBサイトへアクセスします。第一パラメータには接続先のアドレス、第二パラメータにはアドレスに渡すパラメータです。グーグルでは「検索ワード」になります。

パラメーターは「params={‘q’: ‘検索文字’}」のように設定します。今回は検索ワードのみでしたが、文字コードや言語など検索詳細を設定可能です。詳しくは後述するパラメータ一覧を確認ください。

検索結果ページは「requestsの戻り値.text」で取得します。ここでは「req.text」で取得しました。

グーグル検索パラメータ一覧

Pythonのrequestsで設定する「params={パラメータ記号: 設定値}」について使用頻度が高いものをまとめました。

パラメータ 意味 補足
q 検索文字 複数検索は+で連結する
ie 文字コード(クエリ) utf-8
shift_jis
oe 文字コード(検索結果) utf-8
shift_jis
hl 言語 ja(日本語)
en(英語)
lr 検索言語 lang_ja(日本語)
lang_en(英語)
tbm 検索カテゴリ 指定なし・・通常の検索
isch・・画像検索
vid・・動画検索
bks・・書籍検索
blg・・ブログ検索
pts・・特許検索
nws・・ニュース検索
shop・・ショッピング
pws パーソナライズ設定 0:無効
1:有効
num 1ページの検索数

 

Pythonの「requests」を使ってグーグル検索をし、結果を取得することができました。

以上、Pythonの「requests」を使ってグーグル検索をする方法でした。

コメント