OctoparseはCAPTCHA / reCAPTHCAを処理できますか?

Friday, October 12, 2018 5:00 PM

CaptchaまたはreCaptchaは、多くのWebサイトで適用される一般的なスクレイピング防止技術です。アカウントにログインしたり、データにアクセスする前にCaptchaを解決するように求められます。

OctoparseはCaptchaを自動的に処理できませんが、この問題の回避策があります。

1) ローカル抽出でCaptchaを手動で入力する

2) Captchaに遭遇しないようにクッキーを保存する

 

 

ローカル抽出でCaptchaを手動で入力する

1. タスクを構築する時、内蔵ブラウザでテキストボックスをクリックして、Captchaを手動で入力します。

 

2. ログインボタンをクリックするやCaptchaを解決してからのステップに十分な待ち時間を設定します。

 

 

 

 

3. タスクをローカルで実行するときは、Captchaを手動で入力するか、抽出ウィンドウに他のタイプのCaptchaを解決することができます。

 

 

 

 

Captchaに遭遇しないようにクッキーを保存する

 

タスクを実行するたびにCaptchaに手動で入力するのは非常に不便で、クラウド抽出には適用できません。サイトがクッキーの使用をサポートしている場合は、クッキーを保存してログインした状態を守れます。

ログインクッキーを保存する方法の詳細については、このチュートリアルを参照してください。

 

 

ヒント!

スクレイピング処理中に遭遇したCatpchaは現在解決できません。待ち時間機能を設定して 抽出を遅くすることをお勧めします。

 

btn_sidebar_use.png
btn_sidebar_form.png