【タスク公開】2022年花火大会を例に、Webスクレイピングでイベント情報を自動収集する方法を解説!

夏の風物詩といえば「花火大会」ですよね。新型コロナウイルスの影響で2020年以降は、全国的に中止が続いていましたが、2022年の夏は復活するところも増えています。

しかし、全国の花火大会・夏祭り日程をイベント情報サイトやチケットサイトで、一つずつ検索するのは面倒に感じる方も多いでしょう。

そんなときにこそ、Webスクレイピングが役立ちます。Webスクレイピングとは、Webサイトから任意のデータを自動で収集する技術のことです。

中でもWebスクレイピングツール「Octoparse(オクトパス)」を使えば、プログラミングスキルがない方でも、かんたんな操作だけでデータ収集を実行できます。

本記事では、Octoparseを活用した花火大会情報の収集方法を紹介しますので、ぜひ夏休みの計画に役立ててください!

花火大会・イベント情報を自動収集するメリット

花火大会や夏祭りなどのイベントは、全国各地で催されるため、一つひとつチェックして探すのは時間と手間が掛かります。

そんな時に、Webスクレイピングを活用すればわずかな操作だけで、自動的にデータを抽出してくれます。さらに、抽出したイベントデータはExcelなどにエクスポートできるので、全国のイベント情報をかんたんにリスト化することが可能です。

花火大会の日程や開催場所をリストで一覧化すれば、いつ・どこに遊びにいくか計画も立てやすくなります。

花火大会情報を取得するのに役立つサイト

花火大会や夏祭り情報をWebスクレイピングで取得する際は、特定のサイトにアクセスする必要があります。花火大会情報をまとめているサイトとしては以下のようなサイトがおすすめです。

この他にも、観光協会のサイトで地元の花火大会開催情報を公開しています。例えば、静岡県熱海市の「熱海海上花火大会」は、年間を通して10回以上も開催されている熱海名物の花火大会です。

熱海観光協会のサイトでは、2022年(令和4年)の開催日程を公開しています。

参考:熱海観光協会公式観光サイト|あたみニュース

年間を通して花火大会を見られるなんて地元の方は羨ましいですね!

チケットぴあを使った花火大会サイトのタスク例を公開

参考までに「チケットぴあ」のデータ取得タスクを展開します。こちらのタスクをOctoparse上にインポートすれば、すぐに花火大会情報の取得が可能です。

ワークフロー作成に行き詰まっている方はこちらを参考にして、どのような流れでワークフローが設計されているか参考にしてみてください。

タスクの使い方

「新規作成> タスクインポート」の順にクリックします。タスクインポートのポップアップが表示されたら、タスクデータをアップロードします。

タスクデータは以下からダウンロード可能です。

タスクインポートが完了したら、「実行状態」の項目からクラウド抽出、またはローカル抽出を起動します。あとは、データ抽出が完了するまで待つだけです。

データ抽出をしたら、「すべて > エクスポート」をクリックすると抽出したデータをエクスポートできます。ファイルは、Excel・CSV・HTML・JSONから選ぶことが可能です。

 

Octoparseでイチから花火大会情報を取得する方法

ここからはOctoparseを使用して、イベント情報サイトから花火大会情報を取得する方法を解説します。ここでは、「ウォーカープラス」に掲載されている花火大会情報を抽出します。

参照:ウォーカープラス全国花火大会

1.Octoparseをダウンロードして、サービスを立ち上げます。

2.ホーム画面の検索バーの中に、花火大会サイトのURLを貼り付けます。

 3.抽出開始をクリックすると、画面が切り替わり自動的にページ内の識別が始まります。完了まで数秒待ちましょう。

4.以下の画像の順番で進めます。

①「2022年 開催速報」をクリックします(緑色になる)。

②操作ヒントで「選択した要素をクリックする」を選択します。

③リストページにアクセスし、操作ヒントの「Webページを自動識別する」を選択します。

数秒でデータが抽出され、データフィールド内に花火大会情報の一覧が表示されます。内容に問題がなければ、「ワークフローを生成」をクリックします。

 

④データをより簡潔にするために、抽出した項目は、正規表現を用いてフォーマットを作成する必要があります。設定方法については、以下の画像と正規表現のチュートリアルへのリンクをご参照してください。

 

⑤ワークフローが以下のようになっているのを確認し、問題がなければ「実行」を押します。

⑥抽出方法を選択します。「クラウド抽出」を利用するには、有料プランの契約が必要ですが、「ローカル抽出」は無料プランでも利用可能です。

⑦実行状況は左にある「ダッシュボード」を押すと確認できます。実行状態が「実行完了」となれば、データ抽出が完了です。csvにエクスポートするには、右側のメニューバーから「タスクをエクスポート」を選びましょう。

これで花火大会の情報が自動で抽出されました。

まとめ|花火大会以外のイベント情報にも利用可能

今回の記事では、花火大会・夏祭りイベントの自動取得方法を紹介しましたが、もちろん他のイベント情報収集でもWebスクレイピングは役立ちます。

例えば、コミケ・コスプレイベント・ビジネスセミナー・就活イベント・オンラインセミナーなどがあります。Octoparseを使えば、わざわざページをクリック操作しなくとも、短時間ですべての情報を自動で取得できるので、時間の効率化に役立ちます。浮いた時間でイベント参加に向けた準備に集中しましょう。ぜひ2022年の夏を満喫してくださいね!