Octoparseはバージョン7.2で新しい機能「トリガー」を追加しました。ユーザーはトリガーを利用して、特定した条件に満たすデータだけを抽出できます。
1.どういう場合でトリガーを使うべきですか?
Webページ上から特定した条件に満たす一部のデータしか抽出したくない場合です。
Octoparseでは価格やレビューなどのデータを抽出することができますが、それらのデータにまた特定な条件を設定したい時、トリガーの出番となります。この言い方ではちょっと混乱させてしまうかもしれませんが、トリガーの設定紹介を具体的に紹介します。

2.トリガー作成
「データを抽出する」オプションのみにトリガーを設定し、ご自由に編集や削除などすることができます。(設定できるトリガーの数は最大50まで)

画像のように、「新しいトリガーを作成する」をクリックしてトリガー名を設定します。

画像のように、「データを抽出する」のオプションで抽出したフィールドがすべて表示され、条件を追加したいフィールドを選択します。

画像のように、フィールドの種類に合わせて、テキスト、数字と日時の3種類の条件を分けて追加します。

ポイント
- 「数字」の条件を追加する時、単に数字だけを入力してください。
抽出したデータが「数字+単位」である場合は正規表現を利用して単位の部分を削除してください。(正規表現の使い方はデータ再フォーマット の記事をご参考ください。)
- 「日時」の設定を決めましたら、後ろの部分に3つの条件を選んでさらに分けられます。「カスタマイズ」を選択してから、後ろにある編集
のアイコンをクリックすれば、詳しく日時条件を設定できます。


|
以上の条件に満たした場合、「なら」の下にあるドロップダウンメニューから項目を選択して設定したら、それに相応するアクションが発生します。

「このデータを破棄する」:以上の条件に満たせばデータを破棄する
「ループを終了する」:後ろのドロップダウンから1つのループを選択して以上の条件に満たせば、ループ内に含むアクションを終了させる。
「抽出を終了する」:以上の条件に満たせば、データ抽出を終了させる。

[AND]条件を追加:複数のフィールドに条件を同時に設定することができる。
例えば、「商品タイトル」に「三菱」というテキストを含みながら、価格2000円以上の商品データを抽出したいとします。
以下の画像のように、「もし」に2つの条件があります。1つ目は商品タイトルに「三菱」というテキストがないと同時に、価格も2000円より小さい場合はこのデータが捨てられます。

[OR]条件を追加:「もし」と「または」という2つ条件中の1つに満たす。
例えば、「商品タイトル」に「三菱」、あるいは「楽天ガード」というテキストを含む商品データを抽出したいとします。
以下の画像のように、商品タイトルに「三菱」というテキストがないですが、「楽天ガード」というテキストがあれば、データを保存。もし両方のテキストもなければ、このデータが捨てられます。

この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!
関連記事:
取得したデータを再フォーマットする
取得したデータを合併する