トリガー

Friday, July 05, 2019 7:43 AM

Octoparseはバージョン7.2で新しい機能「トリガー」を追加しました。ユーザーはトリガーを利用して、特定した条件に満たすデータだけを抽出できます。

1.どういう場合でトリガーを使うべきですか?

Webページ上から特定した条件に満たす一部のデータしか抽出したくない場合です。

Octoparseでは価格やレビューなどのデータを抽出することができますが、それらのデータにまた特定な条件を設定したい時、トリガーの出番となります。この言い方ではちょっと混乱させてしまうかもしれませんが、トリガーの設定紹介を具体的に紹介します。

 

 2.トリガー作成

「データを抽出する」オプションのみにトリガーを設定し、ご自由に編集や削除などすることができます。(設定できるトリガーの数は最大50まで)

 

  •  トリガー名

画像のように、「新しいトリガーを作成する」をクリックしてトリガー名を設定します。

 

  • フィールド選択

 画像のように、「データを抽出する」のオプションで抽出したフィールドがすべて表示され、条件を追加したいフィールドを選択します。

 

 

 

ポイント!

フィールド名の右側にあるフィールド編集のアイコンがあります。取得したデータを再フォーマットする必要があれば、ぜひご利用ください。

  • 条件追加

画像のように、フィールドの種類に合わせて、テキスト、数字と日時の3種類の条件を分けて追加します。

 

ポイント

  • 「数字」の条件を追加する時、単に数字だけを入力してください。

 抽出したデータが「数字+単位」である場合は正規表現を利用して単位の部分を削除してください。(正規表現の使い方はデータ再フォーマットの記事をご参考ください。)

  • 「日時」の設定を決めましたら、後ろの部分に3つの条件を選んでさらに分けられます。「カスタマイズ」を選択してから、後ろにある編集のアイコンをクリックすれば、詳しく日時条件を設定できます。

 

 

  • 「なら」

以上の条件に満たした場合、「なら」の下にあるドロップダウンメニューから項目を選択して設定したら、それに相応するアクションが発生します。

 

このデータを破棄する」:以上の条件に満たせばデータを破棄する

ループを終了する」:後ろのドロップダウンから1つのループを選択して以上の条件に満たせば、ループ内に含むアクションを終了させる。

抽出を終了する」:以上の条件に満たせば、データ抽出を終了させる。

 

  • [AND] 、[OR]条件を追加

 

[AND]条件を追加:複数のフィールドに条件を同時に設定することができる。

例えば、「商品タイトル」に「三菱」というテキストを含みながら、価格2000円以上の商品データを抽出したいとします。

以下の画像のように、「もし」に2つの条件があります。1つ目は商品タイトルに「三菱」というテキストがないと同時に、価格も2000円より小さい場合はこのデータが捨てられます。

 

 

[OR]条件を追加:「もし」と「または」という2つ条件中の1つに満たす。

例えば、「商品タイトル」に「三菱」、あるいは「楽天ガード」というテキストを含む商品データを抽出したいとします。

以下の画像のように、商品タイトルに「三菱」というテキストがないですが、「楽天ガード」というテキストがあれば、データを保存。もし両方のテキストもなければ、このデータが捨てられます。

 

この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!

 

関連記事:

取得したデータを再フォーマットする

取得したデータを合併する

 

 

 

 

 

btn_sidebar_use.png
btn_sidebar_form.png