トリガー
2019年08月22日Octoparseはバージョン7.2で新しい機能「トリガー」を追加しました。ユーザーはトリガーを利用して、特定した条件に満たすデータだけを抽出できます。
1.どういう場合でトリガーを使うべきですか?
Webページ上から特定した条件に満たす一部のデータしか抽出したくない場合です。
Octoparseでは価格やレビューなどのデータを抽出することができますが、それらのデータにまた特定な条件を設定したい時、トリガーの出番となります。この言い方ではちょっと混乱させてしまうかもしれませんが、トリガーの設定紹介を具体的に紹介します。
2.トリガー作成
「データを抽出する」オプションのみにトリガーを設定し、ご自由に編集や削除などすることができます。(設定できるトリガーの数は最大50まで)
画像のように、「新しいトリガーを作成する」をクリックしてトリガー名を設定します。
画像のように、「データを抽出する」のオプションで抽出したフィールドがすべて表示され、条件を追加したいフィールドを選択します。
ポイント! フィールド名の右側にあるフィールド編集 |
画像のように、フィールドの種類に合わせて、テキスト、数字と日時の3種類の条件を分けて追加します。
ポイント
抽出したデータが「数字+単位」である場合は正規表現を利用して単位の部分を削除してください。(正規表現の使い方はデータ再フォーマット
|
以上の条件に満たした場合、「なら」の下にあるドロップダウンメニューから項目を選択して設定したら、それに相応するアクションが発生します。
「このデータを破棄する」:以上の条件に満たせばデータを破棄する
「ループを終了する」:後ろのドロップダウンから1つのループを選択して以上の条件に満たせば、ループ内に含むアクションを終了させる。
「抽出を終了する」:以上の条件に満たせば、データ抽出を終了させる。
[AND]条件を追加:複数のフィールドに条件を同時に設定することができる。
例えば、「商品タイトル」に「三菱」というテキストを含みながら、価格2000円以上の商品データを抽出したいとします。
以下の画像のように、「もし」に2つの条件があります。1つ目は商品タイトルに「三菱」というテキストがないと同時に、価格も2000円より小さい場合はこのデータが捨てられます。
[OR]条件を追加:「もし」と「または」という2つ条件中の1つに満たす。
例えば、「商品タイトル」に「三菱」、あるいは「楽天ガード」というテキストを含む商品データを抽出したいとします。
以下の画像のように、商品タイトルに「三菱」というテキストがないですが、「楽天ガード」というテキストがあれば、データを保存。もし両方のテキストもなければ、このデータが捨てられます。
この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!
関連記事: