リクナビNEXTから求人情報をスクレイピングする
2019年10月12日以前、Indeedから求人情報のスクレイピングする方法を紹介しました。今回はOctoparseを使って、日本最大級の転職求人サイト「リクナビNEXT」から求人情報をスクレイピングしようと思います。「リクナビNEXT」はベテラン経験者から若手未経験者まで、550万人以上の転職希望者が利用している、実績ある転職サイトです。この例を通じて、仕事を探している方にお役に立てれば何よりです。
このチュートリアルで次のURLを例として使います。
https://next.rikunabi.com/lst/?leadtc=top_jbmodal_submit&__m=1
(ご注意:「リクナビNEXT」サイトで予め職種と勤務地を選択しても、その特定のURLを新しいページで開くなら、絞る条件が無効にあります。ですから、職種と勤務地を入力する必要があります。この度入力する方法を割愛します。入力する方法をご覧ください。また、「リクナビNEXT」のテンプレートも用意しておりますから、ご参考ください。)
以下はチュートリアルの主な手順です。[デモファイルをダウンロードする ]
1)「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
2)「ページネーション」 - 複数のページからデータを取得する
そうすると、ページが内蔵ブラウザで開られます。
そうすると、一番目の詳細ページに入ります。
ヒント! 仕事の内容、求めている人材などの情報を抽出するなら、近くの2箇所のデータを関連付ける方法でも抽出できます。 |
場合によっては、必要なデータが不要な文字列と一緒になることがあります。たとえば、会社名を抽出したいですが、それをクリックして横にある「企業ページ」も一緒に抽出されます。この場合、まずすべてを抽出し、不要な文字列を削除するために抽出したデータを再フォーマットする必要があります。
この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!