Octoparseには、スクレピング初心者でも簡単に使える自動検出機能があります。本機能は、Webページの構造を分析し、類似の要素を自動で認識します。クリックした要素と同様の要素を候補として表示するため、手間が省けます。

類似した要素の認識

自動検出機能は、Webページのすべての構造を分析し、類似の要素を認識します。例えば、ウィキペディアのページのように、似たような構造を持つ要素を認識できます。

ページネーションの認識

ウェブページのデータを収集する場合、全ての情報を得るためにページをめくる必要があることがあります。Octoparseでは、ページ内のリンクを解析することで、次のページのデータを取得できます。ページを自動的にめくることができ、10ページでも1000ページでも大丈夫です。

ワークフローの作成

Webサイトがスクロールする必要がある場合や、リストページと詳細ページの収集が必要な場合でも、自動検出機能を使用することができます。Octoparseを使えば、多くのWebページからデータを収集することができます。なお、自動検出機能は、Webページの構造に大きく依存しています。特殊なWebサイトや非常に複雑なWebページの場合は、認識精度が低下することがあります。その場合は、Octoparseのカスタマーサポートにご連絡いただければ、サポートが対応いたします。

この機能の強力さをより良く理解していただくために、いくつかのウェブサイトを選んでデモンストレーションを行います。

All Star Health

レッスン2：タスクを最適化する

続きを読む→

自動検出機能とは?

リスト一覧ページからデータを抽出する

テキスト/URL/画像/HTML/属性値を抽出する方法

テーブルデータを抽出する

詳細ページ移動してデータを抽出する