logo
ダウンロード
languageJPdown
menu
Octoparse CLI

Octoparseを、ターミナルから。

ラップトップでも、CIパイプラインでも、来四半期リリースのAIエージェント内でも動く。バイナリも契約も、同じ。

ドキュメントを読む
  • 無料トライアル · クレジットカード不要
  • クロスプラットフォーム
  • 安定した契約

3つのチーム。1つのバイナリ

同じCLI、同じ終了コード、同じJSON契約。ノートPC、CI、エージェントループのどこで実行しても同じです。

開発者

npm installを1回。内蔵エンジンでローカル実行でき、抽出した行はマシン外へ出ません。

DevOpsチーム

GitHub Actions、Docker、Airflow、cronに組み込めます。安定した終了コードとディスクに触れない環境変数認証で、セキュリティレビューを通しやすくなります。

AIエージェント

CLIをClaude、Cursor、または独自エージェントループに渡せます。JSONLストリーミングにより、実行完了前に次のステップを計画できます。

1つのコマンド。3つのデプロイ事例

ノートPC、CIパイプライン、エージェント内で同じバイナリを利用。オンコール運用に入れられるほど予測可能です。

「スタンドアップ前にこのCSVが必要。」

グロースアナリストが毎朝、競合価格をJupyter Notebookへ取得。1回の実行と1回のデータエクスポートで、コーヒー前に最新シートを取得できます。Seleniumの監視は不要です。

$ octoparse run lp-pricing
✓ 248 rows → pricing.csv
セットアップ時間約90秒
日次実行時間< 3分

「週次データ取得に組み込む。」

小売データチームが毎週月曜06:00 UTCにCIで定期抽出を実行。安定した終了コードにより成功は下流へ、失敗はオンコールへ直行。維持するコンテナはありません。

# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build
オンコール通知7 → 0 / 月
削減したスタックSelenium群

「CLIをエージェントのツールとして渡す。」

Vertical AIスタートアップがClaude / Cursor内でCLIを構造化ツールとして公開。JSONLストリーミングが行ごとにフィードバックを返し、実行完了前に次のステップを計画できます。

tool: octoparse.run
stream: jsonl
next_action: enrich rows
堅牢性保証
セットアップ時間< 2秒

チームが使い続けるWebデータエンジン

お客様がOctoparseを選び、使い続ける6つの理由。

すぐに使えるグローバル対応

Amazon、LinkedIn、Google Maps、YouTube、Yelp、HN、Redditなど、200以上の実行可能なテンプレートを用意。同じREST構造と標準フィールドを使えるため、XPathやセレクターの保守は不要です。

8年のスクレイピング技術基盤

ブラウザプール、プロキシローテーション、anti-bot、ページネーション、構造化エクスポート。2018年から実運用で磨かれてきました。

あなたのデータ。あなたのルール。

実行結果もデータもあなたのものです。抽出したデータを再販売、再配布、学習利用することはありません。保持期間を設定し、削除すれば完了です。各実行には監査や再実行に使えるtrace_idが付与されます。

あらゆる形式で構造化出力

JSON、JSONL、CSV、XLSX、XMLを同じ標準構造で出力。Airbyte、dbt、Airflow、または独自ETL経由でSnowflakeへ直接連携できます。

最初からAI向けに設計

Claude、GPT、Cursor、Cline、Dify、LangChainと自然に連携します。JSONLストリーミングにより、実行完了前にエージェントが次のステップを計画できます。

カテゴリ最高水準のコストパフォーマンス

無料トライアル、クレジットカード不要。その後は透明な従量課金。社内スクレイピング基盤を人件費の1/18で置き換えたチームもあります。

通知で起こされないほど静かに動作

8年にわたるスクレイピング基盤と、すでに本番環境で運用しているチームからのフィードバックをもとに構築されています。

3M+クラウド実行時間
99.97%クラウド稼働率 · 90日
31OSベンチマーク
8年スクレイピング技術基盤

"3台のEC2で動かしていたSelenium群から、GitHub Actions内の1回のCLI実行に移行できました。"

Ravi P. avatarRavi P.Staff DevOps · D2C小売プラットフォーム

"エージェントループからツールとして呼び出しています。JSONLストリーミングにより、実行完了前に次のステップを計画できます。プロダクトUXに大きな変化がありました。"

Elena N. avatarElena N.Founding engineer · vertical-AIスタートアップ

"安定した終了コードと環境変数認証で、セキュリティレビューを一度で通過しました。スクレイピングツールではめったにないことです。"

Thomas K. avatarThomas K.セキュリティアーキテクト · Enterprise SaaS

データ・AIチームを支えています

Lumen LabsNorthwindQuanta AIDrift RetailHelio CapitalMosaic.ioPlurabankFieldNoteStride HealthArgon FoodsPivotsoftCobalt & Co.

よくある質問

スクレイパーを退役。データは維持

無料トライアル。クレジットカード不要。多くのチームが毎日のスタンドアップ前にCIで動かしています。