【簡単】Webスクレイピングで海外不動産データを一挙に取得する方法

日本の不動産市場が飽和状態にあることなどを背景に、海外不動産に興味を持っている個人・企業は多いでしょう。GDP成長率の高い東南アジアが人気の中、とりわけカンボジアのGDP成長率が高く、人口増加率も高いため将来的なキャピタルゲイン(購入・売却の差益)も狙えるとして注目を集めています。

一方で、海外不動産投資における問題点は「情報収集に時間がかかること」です。現地の不動産サイトにて1件ずつデータを集めるとなると、膨大な時間がかかってしまいます。そのため、多くの投資家は日本の海外不動産投資会社に頼りがちになり、能動的に情報収集できない状況にあります。

そこで今回は、Webスクレイピングツールの「Octoparse(オクトパス)」を使い、カンボジアの海外不動産データを現地サイトから直接取得してみます。気になる不動産のピックアップや、市場調査に最適なのでぜひお試しください。

Webスクレイピングツールの「Octparse(オクトパス)」とは?

ステップ1. 取得するデータの条件を考える

ステップ2. データを取得するためのワークフローを作る

ステップ3. 詳細なデータを取得するためのカスタマイズを行う

ステップ4. データを取得するワークフローを実行する

取得した海外不動産データをどう活用するかが大切です

まとめ

Webスクレイピングツールの「Octparse(オクトパス)」とは?

Web上にあるさまざまなデータを、プログラミングを用いて取得する方法をWebスクレイピングと呼びます。OctparseはそのWebスクレイピングを、“ノンプログラミング”で行えるツールです。

Octparseがあれば、Webスクレイピングで情報収集するにあたってプログラミング言語の習得、開発環境や用意は要りません。お使いのパソコンにOctparseのソフトウェアをインストールすれば、初心者でも簡単に、Webスクレイピングで幅広い情報収集が行えるようになります。

初心者の方には、AmazonやYouTube、Indeedといった主要Webサイトから情報収集が行えるワークフローのテンプレートが用意されているので、自分でワークフローを生成する必要もありません。数時間のトレーニングでOctparseの操作に慣れれば、任意のWebサイトから好きなデータだけを取得できるようにもなります。

これからご紹介する手順通りに設定すれば、海外不動産データをごく簡単に取得できるようになるので実践してみてください。

ステップ1. 取得するデータの条件を考える

Webスクレイピングで海外不動産データを取得するにあたってまず大切なことは、データの条件を絞ることです。それには次のようなメリットがあります。

  • ごく短時間で海外不動産データを取得できる
  • 欲しい情報だけを入手して具体的な検討材料にできる
  • 不要な情報を取得しないことでデータの視認性が高まる

今回のWebスクレイピングでは、カンボジアの首都であるプノンペン全域における、ベッドルームを2~4つ有する不動産の価格・所在地といったデータを取得していきます。

ちなみにデータの取得元は現地と外国人市場において最大級の不動産会社である、IPS(IndependentProperty Services)の不動産サイトです。

ステップ2. データを取得するためのワークフローを作る

IPSの不動産サイトをWebスクレイピングするためのテンプレートは用意されていないため、カスタマイズタスクを使用して該当ページからデータを取得していきます。

Octoparseを開き、画面左のメニューバーにて「新規作成」にマウスカーソルを合わせるとタスク作成の選択肢が表示されるので、その中から「カスタマイタスク」をクリックします。

次に、不動産データを取得したページのURLを入力し、「保存」をクリックします。

ここでは、IPSの不動産サイトにて次の条件で不動産情報を検索したページを入力しました。

  • 形態 :Sale
  • 市町村:Phnon Penh
  • エリア:All Ares
  • タイプ:Apartment / Flat / Confo
  • 寝室数:Bedroos 2~4

先ほどの画面で「保存」をクリックするとOctoparse上で指定したページが表示され、自動識別が開始するので、完了したら「ワークフローを生成」をクリックします。

自動識別が完了すると、表示された不動産情報の「タイトル、URL、ベッドルーム数、バスルーム数、価格」といったデータが抽出されるよう自動的に設定されます(赤枠で表示されている部分が抽出するデータ)。

このままでも問題ないのですが、タイトルとエリアを分けてデータを取得するために各ページにアクセスし、詳細にデータを取得していきます。

ステップ3. 詳細なデータを取得するためのカスタマイズを行う

画面右側に表示されている生成されたワークフローが表示されています。まずはこの中の「データを抽出」を削除し、新しいワークフローを作っていきます。

「データを抽出」のメニューボタン(3点)をクリックし、表示されたリストから「削除」を選択します。

次に、ブラウザ画面左上の要素をクリックし、操作ヒントにて「選択したリンクのURLを抽出する」をクリックします。

これで各ページにURLが取得できるようになりました。次に、詳細ページに記載されているデータを取得するために、各不動産の詳細ページに遷移するよう設定を行います。

同じようにブラウザ画面左上の要素をクリックし、操作ヒントにて「選択したリンクをクリックする」をクリックします。

すると詳細ページに遷移するので、さらにデータとして抽出したい部分を順番にクリックします。下記画像における緑色に表示されているのが選択部分です。さらに、操作ヒントにて「データを抽出する」をクリックします。

取得するデータが決定すると緑色から赤色に変化します。データを整理しやすくするために、画面下部にあるデータプレビューにて各データのラベル名を変更しておきます。

以上で取得したいデータが全て揃いました。最後に、データを取得し終わったら自動的にワークフローが終了するよう設定します。

「ページネーション」をクリックし、基本設定の最下部で「実行が次の回数に達する」にチェックを入れます。さらにデータを取得したいページ数を入力します。

これでカンボジアの海外不動産データを取得するためのワークフローが完成しました。

ここまでの所要時間はおよそ5分です。Webスクレイピングをゼロから始めようとすれば、プログラミングの学習だけで数百時間はかかってしまいます。

Octoparseならそれがたったの5分、しかもノンプログラミングで、海外不動産データを取得するためのワークフローを作成できるのです。

ステップ4. データを取得するワークフローを実行する

ワークフローが完成したら画面上部にある「保存」をクリックし、ワークフローが実行できる状態にします。その後、「実行」をクリックします。

タスク実行画面が表示されるので、任意の取得方法を選択してください。ここではローカル抽出の「通常モード」にて実行します。

ワークフローが実行され、Webスクレイピングが始まりました。実行中の画面では、重複データの数や実行時間、データ取得の平均速度、取得中のデータが確認できます。

さらに、画面右上の「ブラウザ」をクリックすると、ワークフローの実行画面をリアルタイムで確認できます。

ワークフローが完了するとデータのエクスポートが可能です。「データをエクスポート」をクリックし、任意のフォーマットまたはデータベースを選択して「はい」をクリックします。保存先を選ぶとダウンロードが開始されます。

ちなみに今回のWebスクレイピングでは、82件のデータを8分28秒で取得できました。詳細ページに遷移する分、少し時間がかかっていますが手作業と比較すれば圧倒的な時間短縮になりますね。

「不動産一覧ページから簡易的なデータを取得する」ということであれば、同件数のデータを1分30~2分で取得することができます

取得した海外不動産データをどう活用するかが大切です

以上の手順で、カンボジア・プノンペン全域内にあるベッドルーム数が2~4の不動産情報を集めることができました。これらの情報を不動産投資に活かすためには、「データをどう活用するか?」がとても重要です。たとえば、今回取得したデータでは次のような活用方法があります。

 

  • プノンペン全域にある不動産の平均価格を知る
  • エリアごとにある不動産の平均価格を知る
  • 不動産が積極的に売り出されているエリアを知る
  • ベッドルーム1つあたりの平均単価を知る
  • 1sqm(平方メートル)あたりの平均単価を知る
  • 同データを定期的に取得して不動産価格の遷移を知る

 

エクセルやCSVでダウンロードした各種データの平均値を出したり、並べ替えたり、さまざまな角度から分析することで不動産投資の判断材料の1つとして活用できます。これにカンボジア政府が発表している、エリアごとの人口増加率などのデータを合わせれば、不動産利回りの成長率も予測できるでしょう。

このように、Webスクレイピングを使って取得したデータはどう活用するかが、とても重要です。しかし、その活用に至るまでに膨大な時間をかけなければいけないとなると、そもそもデータ活用に挫折してしまいますね。

だからこそ今回ご紹介したOctoparseを使用し、海外不動産データを一挙に取得することをおすすめします。

まとめ

改めて、海外不動産の問題点は「独自の情報収集が難しいこと」です。OctoparseならノンプログラミングのWebスクレイピング技術を利用して、海外不動産投資会社に頼らない情報収集が行えるので、ぜひ投資判断の材料としてご活用ください。

また、海外不動産投資に興味がある個人・企業だけでなく、海外不動産投資を商品として扱っている会社においても、競合調査に大いに活用できます。

今回ご紹介した手順で競合会社の不動産情報を取得できれば、競合分析のサイクルを迅速化し、自社ビジネスに対して分析結果をリアルタイムに反映できます。

どのような理由であれ、「海外不動産データを一挙に取得したい」などのニーズをお持ちの場合は、情報収集にかかる時間を削減するためにOctoparseをぜひ利用してみてください。