「ビッグデータ」は私たちの生活で、より身近に使われるようになりました。ビッグデータの実用例として、注目されているのがデータマイニング(Data mining)です。この記事では、データマイニングが私たちの生活にどのように影響を与えているのかを示し、面白いデータマイニングの活用事例10選についても紹介します。
データマイニングとは?
データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことです。
マイニングとは、日本語で「採掘・発掘」を意味する言葉です。すなわち、データマイニングとは膨大なデータの中から価値のあるデータを取り出すという意味を持ちます。
データマイニングの重要性と特徴などはこちらの記事をご参照ください。
データマイニングの面白い活用事例
データマイニングは業界・業種ごとにあらゆるシーンで活用されています。ここでは、データマイニングを活用したユニークな事例を10個紹介します。
1. レビュー分析による製品改善
SaaS企業であるOctoparse(オクトパス)は、Webスクレイピングツールの開発・サポートに特化しています。Octoparseは、ツールを利用したクライアントに利益をもたらすことを念頭に置き、スクレイピング活用による業務効率化の可能性を提案し続けています。
2022年、Octoparseはクライアントから寄せられた数千ものレビューを収集し、NLP(神経言語プログラミング)を利用して製品に対するレビュー内容を分析し、製品のアップグレードに生かしました。それによって、ユーザーエクスペリエンス(顧客体験価値)の大幅な改善に成功しました。
2. インフルエンザの流行予測
Googleは数千億回の検索を含む5年分のWeb上のログをマイニングしてアルゴリズムを組み立て、インフルエンザ予測モデル、「Googleインフルトレンド(GFT:Google Flu Trends)」を開発しました。
2009年ころに登場したGFTは、実際にはインフルエンザの流行率を課題評価するなど、実用化には至りませんでしたが、この失敗を機に専門家の間ではビッグデータの活用をどのように進めるかの議論がなされるようになりました。
3. スーパーマーケットの陳列
世界最大のスーパーマーケットチェーンであるウォルマートでは、マーケティング部門の意思決定を支援するためにビッグデータを活用しています。1992年に「ウォールストリートジャーナル」に掲載された記事によると、過去の販売データを分析した結果、顧客は「おむつ」と「ビール」を一緒に買う傾向が高いことがわかりました。
その結果に基づき、2つの製品を並べて陳列したところ、売上が上昇したというのです。しかし、1990年代前半はデータマイニングという言葉はまだ知られておらず、データ活用はまだ未成熟であったことから、この話を「単なる都市伝説」という声も少なくありません。
4. ファストフードメニューの切り替え
あるファストフードチェーンでは、監視カメラシステム(CCTV)で来店客の行列の長さを判断して、店内スクリーンに表示されるメニューを切り替えることができます。
プリセットアルゴリズムに基づいて、CCTVは行列の状況情報をコンピューターに送信し、コンピューターは計算を実行して結果を送り返すことで、表示メニューを切り替えています。これにより行列が長い場合は、より素早くできるメニューをたくさん載せる。空いている場合は、より収益性の高く準備に時間のかかる料理をメニューに切り替えることが可能になりました。
5. 自動車のモデル改善
アメリカを代表する自転車メーカー、フォード。かつて、フォード研究開発チームでは、ビッグデータを利用して、SUVのバックトラックを開く方法について分析を行いました。当時、バックトラックに関して顧客からの改善要望などはなく、社内の定期調査でもそれを潜在的な問題として捉えていませんでした。
しかし、実際には多くの顧客がソーシャルプラットフォーム上で関して話し合っていることが、データ分析によって発見されたのです。それらの分析情報に基づいて、車両モデルの改善につなげることができました。
6. 音楽の好みを分析
音楽識別サービスのGracenoteデータベースは、スマートフォンやタブレットの内蔵マイクによって、ユーザーのテレビやステレオで再生される曲を認識し、拍手やブーイングなどの反応を検出し、ユーザーが音量を上げたかどうかを検出する技術を生かしています。
それによって、ユーザーが好みの曲と、この曲が再生される時間と場所を分析することができます。
7. アカデミー賞の予想
日本の老舗ISPである株式会社インターリンクでは、インターンシップで学生が制作したAIシステムで日本アカデミー賞を予想しました。このAIシステムは、5つのデータマイニング手法をハイブリッドしたもので、監督・配給元・出演者のデータなども加味してスコア化しました。
8. 理想のパートナーとのマッチング
アメリカの大学に通っていたChris McKinlayは、恋人マッチングサービスOKCupidを使って恋人を見つけたいと願うものの、理想のパートナーを見つけることができませんでした。
OKCupidのマッチングアルゴリズムに問題があると考えたマッキンレイは、数学者としての才能を活かして、マッチングアルゴリズムを自作することにしました。
OKCupidに登録されている女性のQ&Aを収集後、アルゴリズムを用いて質問と回答のデータを分析。それに合わせて適切なプロフィールを作成したことで、理想の女性を見つけることに成功しました。
9. 犯罪発生現場の予測
プレッドポル(PredPol)は、カリフォルニア大学ロサンゼルス校の研究グループが、サンタクルーズ警察の協力を元に開発した犯罪予測システムです。過去の犯罪情報のデータベースをもとに、いつ・どこで犯罪が起きるか、発生リスクを正確に予測します。
ロサンゼルス市警のプロによる犯罪分析とAIの予測を比較したところ、AIの方が2倍以上高い正確性が得られました。実際にプレッドポルを導入したロサンゼルスでは、19週間のうちに犯罪発生率が47%減少しました。
10. 偽造品・模倣品防止策の実施
中国のEC大手アリババでは、偽造品・模倣品の取り締まりにビッグデータを活用しました。この取り締まりは「クラウドソード(Cloud Sword)」と呼ばれ、4カ月間もの期間を要して実施されました。
アリババの偽造・模倣防止技術を支えているのが、分析に必要なデータポイントを算出する機械学習エンジンです。この機械学習エンジンでは、価格や取引記録などの100以上の要素から数値で評価し、危険かどうかを瞬時に判断します。
さらに配送先住所やIPアドレス、返品先などに関する情報を通じて、オフラインの倉庫場所を突き止めることができました。その結果、アリババが提供した情報を活用した警察は製造詐欺417件を摘発し、容疑者332人の逮捕、14億3000万元相当の偽造・模造品の押収に成功したのです。
まとめ
以上のように、データマイニングの面白い活用事例についてご説明しました。私たちの生活には、ビッグデータとデータマイニングの実用的な用途が非常に多くあります。現在では、ビッグデータ活用は高額な予算を掛けてシステムを構築せずとも、クラウド上でリーズナブルな費用で利用できます。
中でも、WebスクレイピングツールのOctoparseは無料から利用できるため、データマイニングを自社のビジネスに導入したい方は、ぜひ本記事を参考にデータ活用方法を模索してみてください。