logo
ダウンロード
languageJPdown
menu

ハローワーク求人をCSV自動取得する方法【実測763件・3分51秒・コード不要】

star

ハローワークの求人情報をノーコードでCSV自動取得する手順を、実際の操作と実測値(763件・3分51秒)で解説。Octoparseのテンプレートを使えば無料プランで今日から始められ、HR営業リストや労働市場調査にも活用できます。

約7分で読めます

著者が求人広告代理店に勤務していた頃、営業リストを作成するためにハローワークインターネットサービスを活用していました。例えば、「介護職×東京都×正社員」の条件で検索して出てくる求人の情報を、1件ずつコピペしてスプレッドシートに転記していたのです。

しかし、手作業には時間と労力がかかります。「もっと効率的なやり方はないだろうか?」と考え、色々調べるなかでスクレイピングツールのOctoparse(オクトパース・オクトパス)に出会いました。本記事では、Octoparseを活用してハローワークの求人情報を自動取得する方法を、実際に操作した手順・実測値とともに解説します。

なお、厚生労働省のサービスとして「求人情報提供サービス」がありますが、利用できるのは地方自治体・職業能力開発施設に限定されており、一般企業や個人は利用できません。

「本当にコードなしで取れるの?」と思う方のために、まずOctoparse(オクトパース・オクトパス)実際に763件のハローワーク求人データを3分51秒で取得した例をご覧ください。

下の画像は、Octoparseのハローワーク求人リストテンプレートを使って収集したデータプレビューです。

https://www.octoparse.jp/template/hellowork-job-listings-cloud-only-scraper

企業名・所在地・職種・給与・雇用形態・求人URLなどが、検索条件を入力して「実行」をクリックするだけで自動的に構造化データとして取得されています。

Octoparseで収集したハローワーク求人データのプレビュー画面(企業名・職種・給与・所在地・求人URLなどをCSV形式で一覧取得)
▲ Octoparseのデータプレビュー画面。取得したデータは CSV・Excel(.xlsx)・JSON・Googleスプレッドシート など複数形式でそのままエクスポート可能。実測:763件・収集時間3分51秒(クラウド収集・通常モード)

この操作に必要なのは、都道府県・職種・雇用形態を入力して「実行」をクリックするだけ。コードは1行も書いていません。

競合情報も営業リストも、ウェブデータをそのままExcel・CSV・Google Sheetsに出力

コード不要、誰でも今日から。クリック操作だけで必要な項目を自動抽出

Google Maps・食べログ・iタウンページ向けテンプレートで、リード獲得をすぐに開始

クラウドで毎日・毎週自動実行。大量取得でも安定して、競合動向を常に把握

MCP対応でAIエージェントと連携。収集データをAIに渡して分析・活用まで一気通貫

クレジットカード不要で無料スタート。世界600万人以上が選んだ信頼のツール

ハローワークインターネットサービスとは

ハローワークインターネットサービスとは、全国のハローワーク(公共職業安定所)に掲載されている求人情報をインターネット上で検索・閲覧できる、厚生労働省が運営する公式サービスです。リクナビNEXTやマイナビ転職などの民間求人サイトとは異なり、企業側の掲載費用は無料です。

厚生労働省「公共職業安定所(ハローワーク)の主な取組と実績(令和7年4月)」によると、令和5年度の年間新規求人数は1,027.5万件に上ります。掲載費が無料のため、採用広告に予算を割けない中小・零細・地方企業の求人が多く集まっており、民間の大手求人サイトだけでは把握しきれない雇用主情報を網羅しています。

一方、掲載費ゼロということは採用コストを極力抑えたい企業が多いということでもあります。こうした企業は新しいサービスや提案に対してニーズを持っていることが多く、HR営業や採用支援サービスのアプローチ先としても有効です。

しかし、これらの企業情報をすべて手作業でリスト化しようとすると、膨大な時間と労力がかかります。そこで、スクレイピングを用いた自動収集の仕組みを導入することで、大幅な時間短縮に繋がります。

参考:厚生労働省職業安定局「公共職業安定所(ハローワーク)の主な取組と実績」

ハローワーク求人データが持つ独自の価値とは

ハローワークのデータが有用な理由は、民間媒体とカバーしている企業層が異なる点にあります。主な利点は次の3点です。

① 中小企業・地方企業の求人が中心

民間の大手求人媒体へ求人を掲載する場合、掲載費用が数十万円〜数百万円ほどかかります。一方、ハローワークは公的機関であるため、無料で掲載できます。したがって、採用予算の限られた中小・零細企業はハローワークを中心に活用しています。

実際、dodaやリクナビNEXTといった大手求人サイトに掲載されていない企業の求人が多く、HR営業や採用支援サービスの新規開拓先リストを自動作成する際にも有効活用できます。

② 年間1,027万件超の求人情報が掲載

令和5年度の年間新規求人数は1,027.5万件です。民間媒体では得られない規模の求人データを、無料で参照できます。

出典:厚生労働省「公共職業安定所(ハローワーク)の主な取組と実績(令和7年4月)」

③ 労働市場調査のデータソースに役立つ

地域別・職種別・雇用形態別の求人動向を定点観測できます。月次で収集し続けることで、業界の採用トレンドを自社データとして蓄積できます。

求人サイトのスクレイピングによるデータ収集の詳しいノウハウも合わせてご覧ください。

スクレイピング前の確認事項|法的注意点

実際に操作する前に、利用規約と法的注意点を整理しておきます。

ハローワークインターネットサービスの利用規約

ハローワークインターネットサービスの利用規約では、掲載情報の無断転載・複製を禁止しています。「規約違反」と「法律違反」は別の話です。規約はサービス提供者とユーザー間の契約であり、違反した場合に起こりうるのはアクセス制限です。法律違反とは区別して理解しておくことが重要です。

社内の市場調査・採用支援・営業活動のための利用は規約の想定する範囲として解釈できますが、収集データの外部販売・第三者への無断提供は規約違反リスクが高いため避けてください。

個人情報保護法との関係

求人票に採用担当者の氏名・電話番号が記載されている場合、それは個人情報保護法上の個人情報に該当する可能性があります。収集データは社内利用に留め、名簿販売・外部公開は行わないことが基本です。

参考:個人情報保護委員会ガイドライン

アクセス頻度について

高頻度・短時間での大量アクセスはサーバーへの過度な負荷となり、不正アクセス禁止法の観点からも問題になりえます。Octoparse(オクトパース・オクトパス)のリクエスト間隔設定(推奨:1〜3秒)を活用し、大量収集は分散して実行することをお勧めします。なお、ブロックされずにスクレイピングを継続する方法についてもヘルプセンターで詳しく解説しています。

免責事項:本記事は法的アドバイスではありません。個別のケースについては法務部門・専門家にご確認ください。

ハローワーク求人をCSV化する3つの手段を比較

「ハローワーク スクレイピング」で検索すると、Python/Selenium、専用ソフト、Octoparseの3つが候補として出てきます。それぞれの特徴を以下表にまとめました。

比較軸Python/Selenium専用有料ソフトOctoparse
必要スキルPython・Selenium必須不要(専用ツール操作)不要(テンプレートURLを貼るだけ)
サイト改修への耐性コード修正が毎回必要ソフト提供者次第(更新が遅いケースも)Octoparseがテンプレートを随時更新
他サイトとの横断収集サイトごとにコードを書き直すハローワーク専用のため不可doda・Indeed等のテンプレートがすでにある
スケジュール自動収集サーバー環境を別途構築する必要あり一部対応(機能が限定的)クラウド収集で数クリックで設定完了
費用開発工数(人件費)ライセンス料(数万〜数十万円)無料プランあり・有料は月額$89〜

【著者視点】実際に各サービスを利用した感想

Python/Selenium

柔軟なカスタマイズが可能で、取得項目や収集ロジックを自由に設計できる点が強みです。ただし、ハローワークのサイト構造が変わるたびにコードの修正を行わなければならない点には注意が必要です。

また、Qiitaやはてなブログのコードをコピーした方から「サイトのリニューアルでコードが動かなくなった」「Seleniumのバージョン問題で環境構築から詰まった」という声もあります。メンテナンスコストが継続的にかかる点が課題です。

ハローワーク専用ソフト

ハローワークの仕様に特化して設計されているため、操作が直感的でわかりやすい点はメリットです。一方で、dodaやIndeedとの横断収集には別途開発が必要です。またハローワークのサイト構造が変更された場合は都度修正対応が発生し、開発・保守コストが継続的にかかります。

Octoparse(著者おすすめ)

Octoparse(オクトパース・オクトパス)はノーコードで使えるため非エンジニアの方でも直感的に利用できます。また、doda・リクナビNEXT・Indeedなど複数の求人サイトのテンプレートがすでに用意されているため、複数の求人サイトを横断収集したい場合でも同一ツールで完結できます。

テンプレートがOctoparse側で自動更新されるため、求人サイトの仕様変更があった場合でも保守コストはほぼゼロです。他の手段と比べて、圧倒的に扱いやすかったのがOctoparseでした。

Octoparseのホームページ

Octoparseのハローワーク専用テンプレート3種を使ってみた

Octoparseのハローワーク専用テンプレートコレクションには、現在3種類のテンプレートが用意されています。用途に合わせて使い分けるのがポイントです。

目的推奨テンプレート
まずはスクレイピングを試してみたい③ ハローワーク カンタン検索結果一覧
大量な求人情報を定期自動収集させたい① ハローワーク 求人リスト(クラウドのみ)
HP URLや電話番号まで収集したい① 求人リスト(クラウドのみ)で一覧を取得 → ② 求人詳細情報(URL入力)で詳細を追加取得

① ハローワーク 求人リスト(クラウドのみ)

https://www.octoparse.jp/template/hellowork-job-listings-cloud-only-scraper

クラウド収集専用のテンプレートです。大量収集・定期スケジュール収集に向いています。

取得できるデータフィールド:求人番号・会社名・職種・雇用形態・給与・就業場所(都道府県・市区町村)・就業時間・加入保険・求人URL

【テンプレート実行中の画面】

Octoparseのハローワーク求人リストテンプレート実行中の画面(クラウド収集)

【収集完了後のデータ一覧】

Octoparseで収集完了したハローワーク求人リストのデータプレビュー画面(763件取得)

入力パラメータが他のテンプレートに比べて多いと感じるかもしれません。これはハローワーク公式サイトの検索条件(都道府県・職種・雇用形態など)をそのまま入力する仕組みになっているためです。公式サイト上で検索条件を選んだ後、各条件のテキストを照らし合わせてOctoparseに入力すると迷わずに進められます。

向いている用途:毎日・毎週の定期自動収集、数百件以上の大量収集

実測結果:取得件数763件・所要時間3分51秒(クラウド収集・通常モード)

② ハローワーク 求人詳細情報(URL入力)

https://www.octoparse.jp/template/hellowork-job-listings-url-scraper

「ハローワーク 求人リスト(クラウドのみ)」で収集した求人URLを入力として、各求人の詳細情報を取得するテンプレートです。「求人リスト(クラウドのみ)」→「求人詳細情報(URL入力)」の2ステップで運用することで、一覧情報と詳細情報を組み合わせた網羅的なリストが作れます。

取得できるデータフィールド:企業HP(URL)・電話番号・仕事内容全文・必要な経験・技能・知識・賃金詳細・試用期間・加入保険・受動喫煙対策・求人備考

【詳細情報収集後のデータ】

Octoparseのハローワーク求人詳細情報テンプレートで取得したデータ(企業HP・電話番号・仕事内容全文など)

HR営業の現場でこのフローを使ったとき、企業名だけでなくHPと電話番号まで揃ったリストが手元にあることで、アプローチの精度が大幅に上がりました。企業サイトを個別に検索する手間がなくなることの効果は想定以上です。

向いている用途:HP・電話番号まで含めた営業リスト作成、詳細な採用条件の調査

実測結果:取得件数3件・所要時間45秒

③ ハローワーク カンタン検索結果一覧

https://www.octoparse.jp/template/hello-work-job-listings-scraper

ローカル収集にも対応しているテンプレートです。ハローワークインターネットサービスの検索結果URLをそのまま貼り付けて実行するシンプルな操作感で、今すぐ試してみたいときに最適です。

取得できるデータフィールド:求人番号・会社名・職種・雇用形態・給与・就業場所・求人URL

【テンプレート実行中の画面】

Octoparseのハローワーク カンタン検索結果一覧テンプレート実行中の画面(ローカル収集対応)

向いている用途:初めてOctoparseを試す方、定期収集ではなく今すぐ確認したいケース

実測結果:取得件数669件・所要時間22分27秒(ローカル収集)

【番外】Octoparse MCPで自然言語×AIワークフローに組み込む

「ハローワーク求人データをAIに自動分析させたい」「収集した情報を自社システムにリアルタイムで流し込みたい」という方に朗報です。

Octoparse(オクトパース・オクトパス)は新たにMCP(Model Context Protocol)に対応しました。Claude DesktopなどのAIクライアントに接続すると、「東京の介護職求人を200件取得して給与25万円以上だけ抽出して」と自然言語で指示するだけで、テンプレート選択→収集→フィルタリングが対話形式で完結します。

  • 毎日の求人データを自動取得してスプレッドシートに反映させたい
  • AIエージェントにハローワーク求人を自動リサーチさせたい
  • 自社のデータパイプラインに求人スクレイピングを組み込みたい

このような自動化・システム連携のニーズがある方は、Octoparse MCP機能の詳細ページMCP使用チュートリアルをご確認ください。MCPの概念から学びたい方は「OctoparseとMCPについて」もご参照ください。

Octoparse MCP

実際にやってみた|5ステップでCSV取得する手順

Step 1:Octoparseをインストールする

Octoparse公式サイト(octoparse.jp)から無料プランに登録し、デスクトップアプリをインストールします。所要時間は約10分。クレジットカード登録なしで始められます。

Step 2:使用するテンプレートを選ぶ

ホーム画面の「テンプレートタスク」から「hellowork」または「ハローワーク」と入力して検索します。まず試すなら③カンタン検索結果一覧、定期自動収集が目的なら①求人リスト(クラウドのみ)を選択します。

【都道府県・職種パラメータの入力画面(ハローワーク カンタン検索)】

Octoparseのテンプレート選択・パラメータ入力画面(ハローワーク カンタン検索)

Step 3:検索条件を設定する

テンプレートによって入力方法が異なります。③は公式サイトの検索結果URLをそのまま貼り付けるだけです。①はパラメータを個別に入力する形式で、都道府県(例:東京都)・職種(例:介護関連の職業)・雇用形態(例:正社員)を指定します。

Tipsポイント:①を使う場合は、先にハローワーク公式サイトで希望する検索条件を選び、各条件の表記を確認してからOctoparseに入力すると迷わずに進められます。

Step 4:収集を実行する

「保存実行」をクリックし、クラウド収集(①専用)またはローカル収集(③対応)を選択します。クラウド収集の場合はサーバーグループを「JP」に指定することを忘れないでください。JPサーバーを選択することで日本語データの取得精度が安定します。

Tipsポイントクラウド収集はOctoparseのサーバーで実行されるため、PCを閉じていても収集が続きます。夜間・休日に実行するよう設定しておけば、翌朝には結果が揃っています。

Step 5:エクスポートする

収集完了後、「データエクスポート」からCSV・Excel・Googleスプレッドシートのいずれかを選択してダウンロードします。列名(企業名・職種・所在地・給与・求人URL等)を確認し、不要な列を整理してから営業リスト・分析用データとして活用してください。

【エクスポート画面】

OctoparseのデータエクスポートメニューCSV・Excel・Googleスプレッドシート選択画面

Tipsポイント:Googleスプレッドシートへの直接エクスポートを使うと、スプレッドシートが自動更新される連携を組みやすくなります。定期収集と組み合わせることで、ハローワークの新着求人を毎朝自動的にスプレッドシートに追加する運用が実現します。

競合情報も営業リストも、ウェブデータをそのままExcel・CSV・Google Sheetsに出力

コード不要、誰でも今日から。クリック操作だけで必要な項目を自動抽出

Google Maps・食べログ・iタウンページ向けテンプレートで、リード獲得をすぐに開始

クラウドで毎日・毎週自動実行。大量取得でも安定して、競合動向を常に把握

MCP対応でAIエージェントと連携。収集データをAIに渡して分析・活用まで一気通貫

クレジットカード不要で無料スタート。世界600万人以上が選んだ信頼のツール

よくある質問(FAQ)

Q1. ハローワーク求人情報は公式でCSVダウンロードできますか?

厚労省の公式サービスとして求人データのCSV提供は存在しますが、利用できるのは地方自治体・職業能力開発施設に限定されており、申請・審査が必要です。一般企業・個人は利用できません。本記事で紹介したOctoparseのテンプレートが代替手段として最適です。

Q2. ハローワークのスクレイピングは違法ですか?

公開情報を収集すること自体は違法ではないと考えられますが、利用規約では無断転載・複製を禁止しています。社内の市場調査・採用支援・営業活動のための利用は許容される範囲として解釈できますが、収集データの外部販売・第三者への無断提供は避けてください。また、アクセス頻度が過度になると不正アクセス禁止法の観点から問題になりえます。スクレイピングの合法性についてのよくある誤解も参考にしてください。法的リスクが気になる場合は専門家にご相談ください。

Q3. CAPTCHAが出たときはどうすればいいですか?

タスクを一時停止し、Octoparseの内蔵ブラウザで手動解除してから再開することで対処できます。大量収集を短時間で行うとCAPTCHAが出やすくなるため、収集件数を分散させる・時間帯を変えるといった工夫が有効です。Octoparseのプレミアムプロキシ機能を活用することでリスクをさらに軽減できます。

Q4. 1回の収集で何件まで取得できますか?

著者の実測では、テンプレート①(クラウド収集)で763件、テンプレート③(ローカル収集)で669件を確認しています。ハローワーク公式サイト側の表示上限もあるため、大量取得の場合は都道府県・職種・雇用形態を分けて複数のURLまたはパラメータで収集することをお勧めします。

Q5. 東京・大阪など特定の地域に絞れますか?

はい。テンプレート①では都道府県を最大3件まで指定できます(例:東京都・大阪府・愛知県)。職種・雇用形態との組み合わせも可能です。テンプレート③ではハローワーク公式サイトで絞り込んだ後のURLをそのまま使用するため、公式の検索フィルターで絞れる条件はすべて引き継げます。

Q6. 毎日自動で新着求人を収集できますか?

Octoparse(オクトパース・オクトパス)のスケジュール収集機能(クラウドプラン以上)を使えば、毎朝7時などの指定時刻に自動でデータ取得が実行されます。スケジュール収集を使った営業リスト自動化の具体的な設定方法も参考にしてください。

Q7. PythonによるスクレイピングとOctoparseは何が違いますか?

Pythonはサイト構造が変わるたびにコードの修正が必要で、エンジニアリソースと継続的なメンテナンスコストがかかります。OctoparseはテンプレートがOctoparse側で随時更新されるためメンテナンスコストはほぼゼロです。また、doda・Indeed・リクナビNEXTなど他の求人サイトのテンプレートもすでに揃っているため、ハローワークとの横断収集を同じツールで完結できる点も大きな違いです。

Q8. OctoparseをAIツールや自社システムと連携できますか?

はい。Octoparse MCP(Model Context Protocol)に対応しており、Claude Desktop・Cursor・Gemini CLIなどのAIクライアントから自然言語でスクレイピングを呼び出せます。「ハローワークの介護職求人を毎朝200件取得してSlackに通知する」といった自動化ワークフローも構築可能です。詳細はMCP使用チュートリアルをご覧ください。

まとめ

ハローワーク求人情報のCSV取得は、公式の一括ダウンロード機能が一般企業・個人には開放されていないため、スクレイピングが現実的かつ最速の代替手段です。Octoparseの3つのテンプレートはそれぞれ用途が異なります。本記事でご紹介した内容を参考に、目的・用途にあったテンプレートを選択してください。

  • 今すぐ試したい → ③ ハローワーク カンタン検索結果一覧(無料プラン・ローカル収集対応)
  • 大量・定期収集したい → ① ハローワーク 求人リスト(クラウドのみ)・実測763件/3分51秒
  • HP・電話番号まで欲しい → ①+② の2ステップ運用
  • AIワークフローに組み込みたいOctoparse MCP で自然言語×自動化を実現

doda・リクナビNEXT・Indeedなど他の求人サイトのテンプレートについては「求人テンプレート一覧」からみつかります。ハローワークと民間媒体の横断収集に取り組む際の参考にしてください。

競合情報も営業リストも、ウェブデータをそのままExcel・CSV・Google Sheetsに出力

コード不要、誰でも今日から。クリック操作だけで必要な項目を自動抽出

Google Maps・食べログ・iタウンページ向けテンプレートで、リード獲得をすぐに開始

クラウドで毎日・毎週自動実行。大量取得でも安定して、競合動向を常に把握

MCP対応でAIエージェントと連携。収集データをAIに渡して分析・活用まで一気通貫

クレジットカード不要で無料スタート。世界600万人以上が選んだ信頼のツール

クリックだけでウェブ データを取得
無料ダウンロード

人気記事

トピックを検索する

今すぐOctoparseを始めて、業務効率化を実現しましょう。

ダウンロード

関連記事