logo
languageJPdown
menu

Webサイトから画像を一括ダウンロードする方法

約7分で読めます

Webページ上の画像をすべて保存したいとき、1枚ずつ保存するのは非常に面倒です。単調な作業の繰り返しに嫌気が差したり、他の業務に取りかかれず業務生産性を大きく低下させます。

そこでおすすめなのが、Webサイトから画像を一括ダウンロードできる「Webスクレイピングツール」の活用です。Webスクレイピングツールを使えば、わずか5分程度の設定作業だけで、Webクローラーを作成し、サイト内に掲載されている画像の自動取得が可能になります。

本記事では、Webサイトから画像を一括ダウンロードする「Webスクレイピングツール」の活用方法を手順に沿って解説します。

Webスクレイピングとは

Webサイトから全ての画像を一括で保存したいとき、1枚ずつ保存するのは非常に面倒です。これは非常に退屈なプロセスであり、仕事の効率を低下させます。

実際、Webスクレイピングツールは、この作業を自動化するの最適な選択肢です。Webページを無限にクリックする代わりに、5分以内にタスクを設定するだけで、クローラーがすべての画像URLを取得してくれます。画像を一括でダウンロードツールにコピーすると、わずか10分で完成させます。

ステップ1. Webスクレイピングツールをダウンロードする

今回は、数あるWebスクレイピングツールの中から「Octoparse(オクトパス)」を例に挙げ、実際に画像をダウンロードする手順を紹介します。プログラミングの知識・経験は一切必要ありませんので、こちらの手順を見ながらぜひ実際に操作してみてください。

Octoparseのトップページを開き、「ダウンロード」をクリックします。お使いのOSにあわせて、ダウンロードをしてください。

Octoparseをダウンロードする 

注:Octoparseでは無料プランを提供しています。このガイドに記載されている機能にお金を払う必要はありません。

ステップ2.画像を一括ダウンロードする

1.WebページのURLを入力する

Octoparseを起動し、スクレイピングしたいWebページのURLを入力します。次に「抽出開始」を クリックして進みます。

もうすぐハロウィンですので、今回は楽天市場内のハロウィンの画像を例にしてみましょう。

サンプルURL: 【楽天市場】ハロウィンの通販

(このリンクが無効になった場合は、楽天市場の別の検索結果のリンクを使用してください)

1.Webページ内で、任意の画像を1枚クリックします。そして、操作ヒントから「すべて選択」を押します。

2.データフィールドが表示されるので、操作ヒントから「選んだ画像リンクを抽出し、ダウンロードする」をクリックします。

3.識別が完了すると、データプレビューで画像のURLと保存先が表示されます。データ型に合ったSrc属性が自動的に選択されので、ダウンロードファイルの命名規則を確認し、「はい」をクリックします。

 4.タスクを実行する

「実行」ボタンをクリックすると、スクレイピングタスクが開始されます。タスク実行中は以下のような画面が表示されますので、完了するまで暫く待ちましょう。たったこれだけの操作で、画像のデータを自動取得できるのは驚きですね!

5.タ5.タスク実行が完了したら、「保存先」を押すと、抽出したすべての画像が確認できます。

いかがでしょうか?一度Octoparseの操作に慣れてしまえば、これまでデータを取得するために無駄な時間を費やしていたことを後悔するに違いありません。

スクレイピングタスクに不具合が生じる場合の対処方法

ここまで紹介した例のように自動識別で生成したスクレイピングタスクは問題なく実行できますが、もしタスクに不具合が生じた場合は、どのように修正すればいいでしょうか。ここでは2つのケースを紹介します。

1. ページネーションが無効の場合

ページネーション(ページ送り)が無効の場合は、タスクからページネーションを確認し、必要に応じてXpathを修正します。ページネーションの詳しい説明はこちらの記事もご覧ください。

<修正方法>

ステップ「ページネーション」をダブルクリックすると、ページネーションの設定画面が表示されます。その中に、自動識別で作成された「要素のXpath」があります。

Xpathの右側にある小さな矢印(②)をクリックして、「次のページ」ボタン(③)をクリックします。この操作によってWebクローラーに「これが私がクリックしたいボタン」を指示しています。

 もし上記の方法を試しても不具合が解消しない場合は、下記のXpathを入力してください。

(//a[@class=”item -next nextPage”][contains(string(),”次のページ”)][not(@disabled)])[1]

2. 画像が読み込まれない場合

ページ内が完全に読み込まれるための、スクロールダウン設定に不具合の可能性があります。Octoparseでは、数回のクリックだけでスクロールダウンを設定できます。

<修正方法>

ワークフローから「Webページを開く」をダブルクリックし、詳細設定を開きます。次に、「ほかのオプション」で「スクロールダウン」にチェックを入れます。2秒間隔でスクロール1回、回数50回を設定します。

まとめ

今回は、楽天市場を例にWebページ内の画像を一括ダウンロードする方法を紹介しました。最後にポイントをまとめます。 

1.Octoparseは、無料で使えるWebスクレイピングツールです。ノーコード技術を使うため、非エンジニアでもスクレイピングすることができます。Webスクレイピングプロジェクトをイチから始めるのに最適なツールです。

2.ウェブページからファイルをダウンロードする機能が充実しています。画像、音声、動画、ドキュメントを、わずか数秒でダウンロードが可能です。

画像以外にも様々な情報を収集することがもちろん、Octoparseの自動識別機能を利用すれば、Webサイトから簡単にデータを取得できます。さらにテンプレート機能を使えば、ワークフローやXpathの設定も不要です。本ブログでは、テンプレート機能の使い方も紹介していますので、ぜひ参考にしてください。

人気記事

トピックを検索する

今すぐOctoparseを始めて、業務効率化を実現しましょう。

ダウンロード

関連記事

  • avatarMashroomcat
    Twitterには毎日、全世界から何百万人ものユーザーが、顔出しなし、無記名で投稿したり閲覧したりを繰り返しています。その数は、全世界で月間3億3000万人以上といわれており、日本だけでも月4500万人もの人が利用しています。これらのデータをもし簡単に収集して分析できるとしたら、試してみたいと思いませんか?今回はTwitterの投稿の中に良く見かけるハッシュタグを利用したデータ分析方法についてご紹介します。
    2023.07.25 · 6 min read
  • avatarMurata
    人工知能に興味があるエンジニアやAIエンジニアなどが、最近多く利用しているのがOpenAIのコミュニティサイトです。OpenAIのコミュニティサイトには、さまざまなトピックがあり、利用者からのコメントが多く投稿されています。このOpenAIのコミュニティサイトから、自分が目的とするデータを抽出するには、どうしたらいいでしょうか。この記事では、OpenAIのコミュニティサイトからデータを抽出する方法について解説します。
    2023.02.27 · 7 min read
  • avatarKouyama
    App StoreはApple社製のデバイスに向けたアプリケーションを配布するプラットフォームです。非常に多くのアプリが集められており、アプリについてのランキングやレビューは、アプリケーション開発者やWebコンテンツ作成者にとって利用価値の高いデータといえます。本記事では、ローコードスクレイピングツールOctoparseを利用したApp Storeアプリのレビュー情報収集について紹介します。
    2023.02.20 · 7 min read
  • avatarTakahashi
    Twitterは、全世界で月間3億3000万人のアクティブユーザー数を誇り、日本でも月間4500万人が利用する人気SNSです。幅広い年代に利用されていることから、国内企業・日本政府でも積極的にTwitterを活用しています。今や企業のマーケティング活動において、Twitterのデータ活用は欠かせません。 しかし、Twitterデータをどのように抽出すれば良いかわからない方も多いはずです。そこで本記事では、Twitterからデータを抽出する方法を紹介します。 ここで紹介する方法は無料で活用できる上に、かんたんな操作だけでデータ抽出が可能なので、作業時間の短縮や業務生産性の効率化につながります。Twitterデータを上手に活用して、自社のマーケティング活動の精度を高めましょう。
    2023.01.31 · 5 min read