Webサイトから画像を一括ダウンロードする方法

Webページ上の画像をすべて保存したいとき、1枚ずつ保存するのは非常に面倒です。単調な作業の繰り返しに嫌気が差したり、他の業務に取りかかれず業務生産性を大きく低下させます。

そこでおすすめなのが、Webサイトから画像を一括ダウンロードできる「Webスクレイピングツール」の活用です。Webスクレイピングツールを使えば、わずか5分程度の設定作業だけで、Webクローラーを作成し、サイト内に掲載されている画像の自動取得が可能になります。

本記事では、Webサイトから画像を一括ダウンロードする「Webスクレイピングツール」の活用方法を手順に沿って解説します。

目次

Webスクレイピングとは

ステップ1. Webスクレイピングツールをダウンロードする

ステップ2.画像を一括ダウンロードする

スクレイピングタスクに不具合が生じる場合の対処方法

まとめ

Webスクレイピングとは

Webサイトから全ての画像を一括で保存したいとき、1枚ずつ保存するのは非常に面倒です。これは非常に退屈なプロセスであり、仕事の効率を低下させます。

実際、Webスクレイピングツールは、この作業を自動化するの最適な選択肢です。Webページを無限にクリックする代わりに、5分以内にタスクを設定するだけで、クローラーがすべての画像URLを取得してくれます。画像を一括でダウンロードツールにコピーすると、わずか10分で完成させます。

ステップ1. Webスクレイピングツールをダウンロードする

今回は、数あるWebスクレイピングツールの中から「Octoparse(オクトパス)」を例に挙げ、実際に画像をダウンロードする手順を紹介します。プログラミングの知識・経験は一切必要ありませんので、こちらの手順を見ながらぜひ実際に操作してみてください。

Octoparseのトップページを開き、「ダウンロード」をクリックします。お使いのOSにあわせて、ダウンロードをしてください。

Octoparseをダウンロードする 

注:Octoparseでは無料プランを提供しています。このガイドに記載されている機能にお金を払う必要はありません。

ステップ2.画像を一括ダウンロードする

1.WebページのURLを入力する

Octoparseを起動し、スクレイピングしたいWebページのURLを入力します。次に「抽出開始」を クリックして進みます。

もうすぐハロウィンですので、今回は楽天市場内のハロウィンの画像を例にしてみましょう。

サンプルURL: https://search.rakuten.co.jp/search/mall/ハロウィン/

(このリンクが無効になった場合は、楽天市場の別の検索結果のリンクを使用してください)

1.Webページ内で、任意の画像を1枚クリックします。そして、操作ヒントから「すべて選択」を押します。

2.データフィールドが表示されるので、操作ヒントから「選んだ画像リンクを抽出し、ダウンロードする」をクリックします。

3.識別が完了すると、データプレビューで画像のURLと保存先が表示されます。データ型に合ったSrc属性が自動的に選択されので、ダウンロードファイルの命名規則を確認し、「はい」をクリックします

 4.タスクを実行する

「実行」ボタンをクリックすると、スクレイピングタスクが開始されます。タスク実行中は以下のような画面が表示されますので、完了するまで暫く待ちましょう。たったこれだけの操作で、画像のデータを自動取得できるのは驚きですね!

5.タスク実行が完了したら、「保存先」を押すと、抽出したすべての画像が確認できます。

いかがでしょうか?一度Octoparseの操作に慣れてしまえば、これまでデータを取得するために無駄な時間を費やしていたことを後悔するに違いありません。

スクレイピングタスクに不具合が生じる場合の対処方法

ここまで紹介した例のように自動識別で生成したスクレイピングタスクは問題なく実行できますが、もしタスクに不具合が生じた場合は、どのように修正すればいいでしょうか。ここでは2つのケースを紹介します。

1. ページネーションが無効の場合

ページネーション(ページ送り)が無効の場合は、タスクからページネーションを確認し、必要に応じてXpathを修正します。ページネーションの詳しい説明はこちらの記事もご覧ください。

<修正方法>

ステップ「ページネーション」をダブルクリックすると、ページネーションの設定画面が表示されます。その中に、自動識別で作成された「要素のXpath」があります。

Xpathの右側にある小さな矢印(②)をクリックして、「次のページ」ボタン(③)をクリックします。この操作によってWebクローラーに「これが私がクリックしたいボタン」を指示しています。

 もし上記の方法を試しても不具合が解消しない場合は、下記のXpathを入力してください。

(//a[@class="item -next nextPage"][contains(string(),"次のページ")][not(@disabled)])[1]

 

2. 画像が読み込まれない場合

ページ内が完全に読み込まれるための、スクロールダウン設定に不具合の可能性があります。Octoparseでは、数回のクリックだけでスクロールダウンを設定できます。

<修正方法>

ワークフローから「Webページを開く」をダブルクリックし、詳細設定を開きます。次に、「ほかのオプション」で「スクロールダウン」にチェックを入れます。2秒間隔でスクロール1回、回数50回を設定します。

まとめ

今回は、楽天市場を例にWebページ内の画像を一括ダウンロードする方法を紹介しました。最後にポイントをまとめます。 

1.Octoparseは、無料で使えるWebスクレイピングツールです。ノーコード技術を使うため、非エンジニアでもスクレイピングすることができます。Webスクレイピングプロジェクトをイチから始めるのに最適なツールです。

2.ウェブページからファイルをダウンロードする機能が充実しています。画像、音声、動画、ドキュメントを、わずか数秒でダウンロードが可能です。

画像以外にも様々な情報を収集することがもちろん、Octoparseの自動識別機能を利用すれば、Webサイトから簡単にデータを取得できます。さらにテンプレート機能を使えば、ワークフローやXpathの設定も不要です。本ブログでは、テンプレート機能の使い方も紹介していますので、ぜひ参考にしてください。

関連記事

スクレイピングテクニック - バレないようにする方法を解説

iPhone 14 発表!Twitterをスクレイピングして世論分析してみた

Googleマップから座標(緯度·経度)を取得する方法ご紹介

Webスクレイピングを始める前に確認すべきこと10