注意:このページでは、旧バージョンのチュートリアルを紹介しています。最新のチュートリアルを表示するには、helpcenterに移動してください。

OctoparseはCAPTCHA / reCAPTHCAを処理できますか?

2019年03月12日

CaptchaまたはreCaptchaは、多くのWebサイトで適用される一般的なスクレイピング防止技術です。アカウントにログインしたり、データにアクセスする前にCaptchaを解決するように求められます。

OctoparseはCaptchaを自動的に処理できませんが、この問題の回避策があります。

1) ローカル抽出でCaptchaを手動で入力する

2) Captchaに遭遇しないようにクッキーを保存する

 

 

ローカル抽出でCaptchaを手動で入力する

1. タスクを構築する時、内蔵ブラウザでテキストボックスをクリックして、Captchaを手動で入力します。

 

2. ログインボタンをクリックするやCaptchaを解決してからのステップに十分な待ち時間を設定します。

 

 

 

 

3. タスクをローカルで実行するときは、Captchaを手動で入力するか、抽出ウィンドウに他のタイプのCaptchaを解決することができます。

 

 

 

 

Captchaに遭遇しないようにクッキーを保存する

 

タスクを実行するたびにCaptchaに手動で入力するのは非常に不便で、クラウド抽出には適用できません。サイトがクッキーの使用をサポートしている場合は、クッキーを保存してログインした状態を守れます。

ログインクッキーを保存する方法の詳細については、このチュートリアルを参照してください。

 

 

ヒント!

スクレイピング処理中に遭遇したCatpchaは現在解決できません。待ち時間機能を設定して 抽出を遅くすることをお勧めします。

 

btn_sidebar_use.png
btn_sidebar_form.png
当社ウェブサイトは、利便性、品質維持・向上を目的に、Cookieを使用しております。詳しくはプロキシーをご確認ください。Cookieの利用に同意頂ける場合は、「同意する」ボタンを押してください。同意頂けない場合は、ブラウザを閉じて閲覧を中止してください。
同意する 閉じる