【初心者向け】ビッグデータ分析用オンライン講座10選

 

データサイエンスは、データ駆動型社会市場の台頭としてはもはや流行語ではありません。PWC(Price Waterhouse Coopers)によると、2015年から2018年までの間に「分析スキル」で5000万人を超える雇用が創出されています。IBMのレポートでは、2020年までにデータ関連の求人が270万人に達すると報告しています。機械学習やAIのようなデータ関連の専門的スキルは、分析職にとって欠かせないものです。

この記事では初心者、特にデータ分析の仕事をしたい人のためビッグデータ分析用オンライン講座10選を紹介します。

 

Coursera

1. データ分析とプレゼンテーションスキル:PwCのアプローチ専門講座

提供者:Price Waterhouse Coopers LLP

推奨学習時間:21週間、週3〜4時間

このコースは、データ駆動型の意思決定、Excelの基本機能利用による問題解決、Excel高級オプション利用によるデータの視覚化、PowerPointを使ったビジネス・プレゼンテーション、そしてデータ分析とプレゼン技術といった5つの内容を紹介します。 一般的な従業員向け、さらにプログラミングの経験がない人にも適する専門的なデータ分析スキルコースは、理論的な知識よりもビジネスアプリケーションに焦点を当てています。

 

2. データサイエンス専門講座

提供者:John Hopkins University

推奨学習時間:43週間、週4〜9時間

10コースを利用して、適切な質問をすることからデータをまとめて見える化することで結果を公表することまで、データサイエンスパイプライン全体で必要となる概念とツールを紹介します。

Courseraで最も長いデータサイエンス専門分野の1つで。前で紹介したPWCの口座とは異なり、統計学、アルゴリズムおよびデータ分析に関する理論により焦点を当てています。しかし、このコースはR言語に基づいて行われたので、コースを受講する前にプログラミングの基本的な知識を固めたほうがおすすめです。

 

3. ビッグデータ専門講座

提供者:University of California, San Diego

推奨学習時間:30週間、週3〜6時間

基本的な紹介、モデリング、管理システム、統合、処理から機械学習やグラフ分析まで6つのコースからビッグデータの主な側面をカバーしています。初心者ためのビッグデータ入門書でプログラミングについて深く掘り下げていないので、事前のプログラミング経験は必要ありません。

 

4. Rによる統計学専門講座

提供者: Duke University

推奨学習時間:27週間、週5〜7時間

Rでデータを分析および視覚化する方法を学ぶ5つのコースで紹介します。再現可能なデータ分析レポートを作成し、統計的推論の統一された性質を概念的に理解できます。R言語に関する知識が必要です。 

 

EDX

5. マイクロソフト・プロフェッショナル・プログラム・イン・データ・サイエンス

提供者:Microsoft

推奨学習時間:56-58週間、週2〜4時間

3つのユニット(合計10コース)と1つのプロジェクトで構成されています。データサイエンスの基本的な紹介、重要なプログラミング言語、および応用データサイエンスにおける高度なプログラミング言語について説明します。Microsoftソフトウェアとの関連性が高く、例えばExcel、Power BI、Azure、Rサーバーなど、もちろんR言語とPythonも含みます。

 

6. マーケティング・アナリティクス

提供者:University of California, Berkeley

推奨学習時間:16週間、週5〜7時間

このコースは、マーケティング測定戦略、価格と販売促進分析、競合分析と市場細分化、製品流通と販売を含む4つのコースに分かれています。Oracle、3Com、NASAなどの企業でマーケティングおよび製品開発において主導的な役割を果たしてきた業界専門家のステファン・ソルジャー(Stephan Sorger)によって設計および指導されています。

 

Cognitive Class

7. ビッグデータの基礎知識 

提供者:IBM

推奨学習時間:2週間、週5〜7時間

3つのコースから構成されて、ビッグデータ、Hadoop、およびSparkについて簡単に紹介します。Cognitive classはIBMが主導するビックデータに関するオンライン上の学習コミュニティです。

 

MIT Open Courseware

8. 上級データ構造

提供者:Prof. Erik Demaine

推奨学習時間:22セッション(90分/1セッション)

このコースは、時系列に沿って行われるストレージのように、幾何学的データ構造や時間的データ構造など、さまざまなタイプのデータ構造の概要を示します。そのような多様なデータ構造の主な研究方向をカバーしています。

 

 

9. Python

提供者:Austin Bingham, Robert Smallshire, Terry Toy, Bo Milanovich

推奨学習時間:7コース(約28時間)

このコースは、Python言語の基本からWebフレームワークおよびプログラミングの処理に至るまで紹介します。 Pythonは、汎用のプログラミング言語で、コードがシンプルで扱いやすく設計されており、C言語などに比べて、さまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴があります。それはPythonがデータ分析で人気のあるプログラミング言語になる原因です。

 

Udemy

10. 完全な初心者のためのJavaチュートリアル

講師:John Purcell

推奨学習時間:75レクチャー(約28時間)

事前のプログラミング知識は必要なく、Javaプログラミング言語を学ぶための初心者コースです。HadoopはJavaベースであり、ビッグデータ分析の基盤を築く最もホットなオープンソースソフトウェアの1つです。

 

Octoparse

上記のコースにはデータ分析のさまざまな側面が含まれていますが、十分なデータを入手するという前提条件があります。オンラインでデータを手動で抽出する従来のアプローチは、もはや使用されていません。インターネット上の情報を抽出するには、はるかに効率的なWebスクレイピングツールが必要です。
Octoparseは、多くのデータ専門家によって推奨されている自動Webスクレイピングツールです。それは使いやすく、早く習得でき、事前のプログラミング知識を必要としません(ノーコード)。何百万というオンラインのデータが、数秒であなたの指先で構造化データシート(Excel、CSV、SQL、API)にインポートすることができます。

Octoparseを利用してスクレイピングする活用事例をOctoparseのホームページまでご参考いただきます。

1. Yahoo!ショッピングから商品情報をスクレイピングする

2. 楽天市場から商品価格をスクレイピングする

提供者:Octoparse Support Team

推奨学習時間:約1時間

 

最大の課題は、コースがそれほど難しいことではなく、キャリアを次のレベルに引き上げることです。
一緒に頑張りましょう!

 

 


 関連記事:

2021年データサイエンスにオススメの本80冊!

2021年データ分析・データ可視化ツールおすすめの30選!

オルタナティブ・データ(代替データ)とは?どのように使えるか?

中国のシリコンバレー、Huaweiも本社をおく深センで暮すにはいくらかかる?