今回は金融業界に絞ってデータ活用の事例を紹介していきます。特に金融業界で昨今注目されているオルタナティブデータに焦点を当てていきます。オルタナティブデータとは何かについて解説しつつ、オルタナティブデータの例や活用事例などをまとめていきます。
また、オルタナティブデータの収集方法についてもまとめます。収集方法は、APIやデータプロバイダーからの購入、スクレイピングなどがあります。スクレイピングの方法としては、ノーコードでスクレイピングが可能になるOctoparseと、プログラミング言語の1つであるPythonについてご紹介していきます。
本記事の執筆者:TAT ブログ:気ままなブログ
データ活用とは?
データ活用とは、文字通りデータを活用することです。何かしらの意思決定を行いたいとき、問題解決を図りたいとき、判断がなかなか下せないとき、こういった場面では、データを活用して意思決定に役立てることが重要になってきます。
昨今は、データドリブンという言葉も耳にするようになり、よりデータに基づいた意思決定が重要視されるようになっています。データ活用については、過去の記事で解説しているので、ここでは詳細は割愛してオルタナティブデータの説明に焦点を当てていきます。
オルタナティブデータとは?
それでは、本記事での本題であるオルタナティブデータについてご紹介していきます。オルタナティブデータとは何か、Wikipediaから抜粋します。
オルタナティブ・データ(英:Alternative Data)とは、 ヘッジファンドのマネージャーや他の機関投資家が投資行動に必要なインサイトを得るために使用される非伝統的なデータである。オルタナティブ・データは通常、特定の企業に関する公開情報以外の外部情報であり、即時的かつ特徴的なインサイトと投資機会を投資家に提供するものとされる。 Wikipedia「オルタナティブ・データ」より抜粋 |
上記の通り、オルタナティブデータはこれまで利用されてきた伝統的なデータとは異なり、非伝統的データでなおかつ非構造的データが中心となります。これまで利用されてきたデータは、政府の統計情報や企業の決算情報など、誰でも利用できる公開データが中心とされてきましたが、昨今ではこれらの伝統的データに加えてオルタナティブデータが注目されています。
オルタナティブデータの例
定義だけを聞いてもなかなかイメージが湧かないと思うので、例を挙げてみます。こちらもWikipediaから抜粋しました。
オルタナティブデータの例
- POS情報
- クレジットカードの利用履歴
- 経済ニュースの記事
- 位置情報
- ウェブサイトのアクセス数
- 衛星画像
- SNSの投稿
- 輸送用コンテナの領収書
- 商品レビュー
- 価格データ
- 貨物のトラッキング情報
Wikipedia「オルタナティブ・データ」より抜粋
上記の通り、非構造的なデータが多く含まれていることがわかります。これまで利用されることのなかったようなデータが投資判断などに活用されるケースが増えつつあります。
オルタナティブデータの収集方法
次にオルタナティブデータの収集方法についてみていきましょう。オルタナティブデータを活用するには、まずはデータを用意する必要があります。オルタナティブデータを収集するには、大きく分けて次の3つの方法があります。
オルタナティブデータの収集方法
- API
- データプロバイダーから購入
- スクレイピング
API
1つ目の収集方法はAPIです。APIとは「Application Programming Interface」の頭文字からきており、「プログラムやアプリケーションやWebサービスなどをつなぐインターフェース」を指します。簡単に言うと、APIを使えばプログラムを介してデータのやり取りや処理ができるようになります。
従来ならば、人間がWebサイトを開いて必要な作業をおこなっていましたが、APIを使えばこういった作業をプログラムを介して行えるようになります。特に金融業界ではAPIの導入が進んでおり、データ連携なども盛んに行われるようになりつつあります。
例えば、家計簿アプリのMoneyForwardなどは、複数の銀行口座や証券口座の情報を一元管理することができてとても便利です。これらのデータの連携にはまさにAPIが活用されています。銀行や証券会社のAPIによるデータ提供が進んできたからこそ生まれてきたサービスだとも言えます。
APIは有料化すれば企業としては売り上げ増加につながりますし、利用者としてもシステムに組み込んだりして自動化が図れるなど利便性が向上するので、双方にメリットがあります。今後もAPIを提供する企業は増えてくると思われます。
データプロバイダーから購入
2つ目の収集方法はデータプロバイダーから購入することです。独自のデータを保有している会社は、データを売ることで収益を上げることができます。こういった会社からデータを購入することで、オルタナティブデータを収集することも可能です。
例えば、クレジットカードのトランザクションデータから消費者行動を分析したり、GPSの位置情報から人々の行動の変化を解析したりできれば、投資に役立てることができたりします。
スクレイピング
3つ目の収集方法はスクレイピングです。スクレイピングとは、Web上のデータをプログラムを使って自動収集する技術のことを言います。プログラムで収集できるので、人間が手動で集めるより遥かに高速で正確です。定期的に実行すれば、データを自動収集することもできます。
スクレイピングの方法はいろいろありますが、ここでは例として2つご紹介します。ノーコードでスクレイピングが実現できるOctoparseと、プログラミング言語の1つであるPythonです。
ノーコードならOctoparseがおすすめ!
Octoparseは、ノーコードでスクレイピングができてしまうサービスです。なんとも便利な時代になったものです。ノーコードで利用できるので、プログラミングの知識は不要で誰でも簡単に利用することができます。
とにかく早くデータが欲しい、プログラミングができる人材がいない、という場合には、Octoparseはとても良い選択肢になります。無限スクロールやログインなどの複雑な動作にも対応しているので幅広いサイトで活用することができます。無料で利用できるフリープランもあるので、興味がある方は是非ともお試しください。
自力で収集するならPythonがおすすめ!
Pythonは、データ収集やデータ分析、データの可視化、機械学習などのAIに強いプログラミング言語です。Pythonなら、オルタナティブデータの収集から、データの加工やデータ分析、データの可視化、機械学習モデルの開発まで全て対応することができます。
Pythonを使うことができれば、自由にデータを扱うことができるようになるのでかなり便利です。また、APIの利用もPythonで行うことができます。スクレイピングに限らず、幅広い用途に使えるのでおすすめです。
オルタナティブデータの活用事例【金融編】
オルタナティブデータについてはお分かりいただけたと思いますので、ここからはオルタナティブデータの活用事例をご紹介していきます。ここでご紹介するのはごく一部で、他にも活用方法はたくさんあります。本記事では3つご紹介します。
データ活用の事例
- 経済ニュースの記事から株式市場へのインパクトを評価する
- SNSの投稿データを解析して株式投資の自動売買を行う
- コンテナ船の動きから経済の先行きを判断する
経済ニュースの記事から株式市場へのインパクトを評価する
1つ目の事例は「経済ニュースの記事から株式市場へのインパクトを評価する」です。投資判断に有益な経済ニュース媒体はたくさんあります。
有名どころでは、日本経済新聞やBloomberg、ロイターや東洋経済などが挙げられます。株式投資の判断を行う際にはさまざまなデータを活用されます。日々の市場動向はもちろん、企業の決算情報や政治ニュース、世界情勢や地政学リスクなどたくさんの情報が考慮されます。
こういった情報は、これまでは人間が分析してきました。昨今では、技術の進歩によりプログラムでニュース記事の内容を分析することができるようになってきています。記事内容から株式市場のインパクトを評価することで投資判断に活用することができます。これを行うには、テキストデータを収集・分析する技術が不可欠です。
過去のニュース記事を収集し、それらの記事と株式市場への関連などを調査していき、どのような単語や文脈が市場に影響を及ぼすのかを分析して特定することができれば、今後のニュース記事から株式市場へのインパクトを瞬時に判断することができるようになります。実用化する際には、リアルタイムでニュースを収集する技術も必要になります。実用的な判定システムを開発することができれば、人間の感情に惑わされることなく、ロジカルに判断することができるようになります。
SNSの投稿データを解析して株式投資の自動売買を行う
2つ目の事例は「SNSの投稿データを解析して株式投資の自動売買を行う」です。
AIモデルを開発してプログラミムに売買を委ねる、という取り組み自体は以前から行われています。特にアメリカで盛んで、売買の自動化が進みトレーダーが減少傾向にあります。人件費が浮くので会社的にはコスト削減につながります。代わりに必要とされるのが、AIや数学に強い人材やエンジニアです。この自動売買プログラムはさまざまなデータを利用します。SNSの投稿データもその1つです。
SNSは即時に情報が拡散されるリアルタイム性が大きな強みの1つです。この特性を活かして、SNSは株式投資に利用されます。金融界隈では、少し有名なSNSアカウントとして岡三マンというTwitter(The X)アカウントがあります。Bloombergの記事でも取り上げられるくらい有名なアカウントでした。投資に役立つ情報をかなりのスピードで発信していたので、投資家から注目されていました。このアカウントが突如いなくなって、少し金融界隈では話題になったほどです。
有益な情報を発信しているSNSアカウントは機関投資家なども利用しています。岡三マンのようなアカウントなどで、常に発信内容を収集して内容をチェックし、内容に応じてプログラムで自動売買を行うというケースもあります。
コンテナ船の動きから経済の先行きを判断する
3つ目の事例は「コンテナ船の動きから経済の先行きを判断する」です。
コンテナ船は物流の要です。飛行機よりも大量の物資をまとめて運ぶことができるので、今でも特に国際的な物流の要は船です。このコンテナ船の動きをトラッキングすることで、経済の先行きを判断することも可能です。
コンテナ船には、Automated Identification Systems (AIS, 自動船舶識別装置)というシステムがあり、これを利用すれば船の位置をトラッキングすることができるようになっています。このデータを収集することができると、コンテナ船の動きに変化があれば、サプライチェーンに影響を及ぼす可能性が出てくるので、景気への影響を分析することもできます。
昨今の例では、新型コロナウイルスによって世界各国でロックダウンが相次ぎ、世界のサプライチェーンが麻痺しました。ロサンゼルスや中国の港では、物資をおろせないコンテナ線が渋滞を起こしていました。コンテナ船の動きを追っていれば、このような変化にいち早く気づくことができたでしょう。
世界のコンテナ船の位置情報をまとめているサイトはいろいろありますが、ここでは例として1つだけご紹介しておきます。Marine Trafficというサイトです。サイトを開いた瞬間、世界中の船の位置がマップに表示されて驚くと思います。細かいデータを見るには有料版の登録が必要になりますが、こういったサイトからデータを収集すればコンテナ船の位置情報をトラッキングすることができるようになります。
収集したデータをうまく活用できる方法を見出すことができれば、経済の先行きへの影響をいち早く察知することができるようになります。
オルタナティブデータの活用はまだまだ発展途上
ここまでオルタナティブデータの活用事例をご紹介してきましたが、ここでご紹介したのは全体のごく一部であり、オルタナティブデータの活用方法は無限大です。機関投資家などはオルタナティブデータを投資に利用しようとしています。しかしながら、オルタナティブデータの利用した投資手法はまだまだ発展途上の段階であり、現在もいろいろな活用方法や投資手法が研究されているのが現状です。
オルタナティブデータを活用する最大の課題が、データを扱うことが難しいということです。これらのデータは伝統的なデータとは異なり、非構造的なものです。
まずデータを収集することが大変です。さらにそこから有益な情報を抽出することも簡単ではありませんし、そもそもその情報が有益かどうかをどうやって判断するのかも検証しないといけません。仮説を立てて膨大なデータを収集し、利用できるように整形して、過去の株価データなどとの関係を検証して、そのデータがきちんと機能するのかを確認しながらモデルの開発を進めていく必要があります。こういった作業ができる人材を確保することも課題の1つです。
現状では、オルタナティブデータをうまく活用できている機関投資家はまだあまり多くはありません。実際のところは利用方法を明かす機関投資家はいないので、どのように活用されているのかを知ることは困難です。逆を言えば、オルタナティブデータをうまく活用する投資手法を確率することができれば他社を出し抜くことができると捉えることもできます。
このような状況から、オルタナティブデータの需要は今後もどんどん拡大していくと思われます。
まとめ
ここでは、「【注目はオルタナティブデータ!】データ活用の重要性について語る【金融編】」というテーマで、金融業界で注目されているオルタナティブデータについて解説しつつ、オルタナティブデータの活用事例についてご紹介しました。
オルタナティブデータの注目度は上がっており、さまざまな活用方法が考えられていますが、機関投資家やヘッジファンドの活用はまだまだ発展途上であり、これからもいろいろな活用方法が編み出されていくと思います。