データサイエンスはAIや機械学習と共に広く知られるようになってきましたね。
今回はUdemyのデータサイエンス講座『【ゼロから始めるデータ分析】ビジネスケースで学ぶPythonデータサイエンス入門』を受講しました。
その感想と具体的にどういった知識が得られるのか!?「受講して意味あるの?」といった疑問にお答えしてます!
【本記事のポイント】
・『ビジネスケースで学ぶPythonデータサイエンス入門』で学べる知識概要がわかる
・講座受講にあたり準備物や注意点がわかる
・データサイエンス、データ分析に興味ある方は受講して絶対に損なし!
それでは早速、ご紹介していきます!
Udemyで『Pythonデータサイエンス入門』を受講した感想

Udemyとは!?
そもそもUdemyとは何か?がはじめての方に、Udemyを簡単に紹介します。既に知っている方は次へ進んでください。
Udemyとは、シリコンバレー発祥、世界最大規模のオンライン学習サイトです。
世界中に発信されており、海外の講師や日本の講師が多数在籍。海外の講師でも字幕で視聴することができます。
またUdemyは最新テクノロジー(AWS、Docker、Python、AI、人口知能etc)に注目した講座が豊富のため、新しい技術を学びたい方にも十分役立つサービスです。
※2020年4月現在の最新テクノロジーです。

【Udemyの特徴】
・全米の名だたるエンジニア、講師の方から直接教えてもらえる
・最先端技術を動画で学べる
・アプリにダウンロードでき、いつでもどこでもスキマ学習できる
・セール時期は1講座1500円ほどになる
・30日返金保証あり
といったオンライン学習サイトです。
そもそもデータサイエンスって?海外では数億円のコンペも
そもそもデータサイエンスとは、ビッグデータ(過去のデータ)から未来を予測をすることを目的とした分野です。
最近ではデータサイエンティストと呼ばれる職種があるくらいですで海外では数千万円の年収をもらうデータサイエンティストも数多く存在します。
しかし、日本ではまだまこういった活動は多くありません。
オプトカフェというサイトの記事『データサイエンスラボ新卒科学者、アカデミックな世界を飛び出した志に迫る。』では、以下のように言われています。
・アメリカでは数千万の給与があるデータサイエンティストが少なくありません
・kaggleというデータ分析のプラットフォームがあり報奨金が3億円になるようなコンペも
・ノーベル賞受賞者がコンペに参加している。
実はこんなにも夢のある職業なのです。
もしもデータサイエンスということに少しでも興味があるなら、すぐにでも触れてみるべきだと思います。
※データサイエンスを学ぶ意味、可能性について別記事でまとめる予定です。しばらくお待ちください。
ベストセラー講座『ビジネスケースで学ぶPythonデータサイエンス入門』
今回ご紹介するのはUdemyではベストセラーにもなる人気講座で「データサイエンス」について学べる講座です。いわゆるデータ分析のこと。
講師は株式会社SIGNATEの高田朋貴さんという方です。データサイエンティストとして国家戦略とともに活躍されています。
SIGNATEの高田朋貴さんによる「データサイエンス/AI概論」のセッションが終わり、ただいまお昼休みです。
午後13:15~からいよいよ演習を行なっていきます。はじめはRESTEC小田川信哉さんによる「衛星データ解析ツール演習」です。#TellusSBC#宇宙ビジネス#衛星データ#宇宙 pic.twitter.com/h3F0gNUb7n
— Tellus公式 (@Tellus_xdata) January 13, 2019
僕はデータサイエンスなど全く知らない世界でしたが、本講座ではとてもわかりやすく解説してくれておりとても効率的にデータサイエンスを学ぶことができました。
講座の概要は以下となります。
・Udemy講座の中でもベストセラーとなっている
・2500以上の全体評価に対し、4.4と高評価の講座
・合計8時間の動画である
・Python言語を使ったデータサイエンスの基礎が学べる
特に4つのPythonを使ったデータサイエンスというのが、一番気になるところだと思います。僕自身もPython言語は今まで触れたことありませんでした。
また講座の中でも講師の方から「Pythonのコードをすべて覚える必要はありません」と仰っているので、初めての方でも安心です。
講座内では4行程度、「おまじない」コードを毎回入力するのですが、こちらは入力していれば覚えられるので慌てる必要はありません。
・Pythonコードを全部覚えなくてよい
・プログラミング初めての方でも大丈夫
なので安心してください。
Udemy『Pythonデータサイエンス入門』で得られる知識一覧

ここではデータサイエンス講座で得られる知識をご紹介します。この講座はデータサイエンスの入り口部分です。統計やら、分析やら、たくさんあります。
『Pythonデータサイエンス入門』で得られるデータサイエンスの知識
この辺りからは専門的な言葉が出てきますので、「ああこういう言葉が出てくるんだ~」と流していただくだけで問題ありません。
基礎分析 | どんな分析にもまず行う動作 |
グラフの描き方 | Pythonコードを使ってグラフを作成します。 |
単回帰モデルの作り方 | データ分析手法の一つ |
重回帰モデルの作り方 | |
決定木の作り方 | |
パラメータの概念 | より精度の高い分析モデルを作るためにパラメータの概念、使い方を学びます。 |
➡これらを使いながら覚えて、ビジネスなど具体的な事例を分析することを想像しましょう。
今回の講座では「お弁当屋さんの売上予測が知りたい!」「銀行口座のターゲット顧客をしぼりたい!」といった具体的なケースで学ぶことができます。
データ分析難しい!という前に興味があれば手を動かして覚えてみることが大事です。
『Pythonデータサイエンス入門』講座の概要
下記は『ビジネスケースで学ぶPythonデータサイエンス入門』の口座で学ぶことができる目録です。こんな感じで学べるんだな・・・というぐらいでOK!
分析環境を準備(Anaconda3インストール) |
分析環境を準備(Matplotlib日本語化) |
SIGNATEでデータダウンロード |
データの読み込み方法 |
Pythonのコード基礎 |
グラフを描く(ヒストグラム、箱ひげ図) |
予測モデルの作り方 |
お弁当大作戦(売上データから、未来を予測) |
銀行顧客ターゲッティング(過去の口座開設データから、未来を予測) |
ザックリ8時間程度の動画になります。
こちらがセール時期だと1500円程度で購入できます。本1冊分なので安いですよね。
実際の作業画像はこのような感じです。
<Pythonでデータを読み込ませる動作>

<決定木モデルで分析した場合の図です> なんだこれ・・・!こういったややこしい図でも何に着目していけばよいか!こういったことを教えてくれます。

データサイエンスの目的は「より精度の高い分析モデルを作成し、未来を予測すること」にあります。
企業の売上を上げることにも繋がりますし、消費者がより良い選択ができるような方向性を示せる可能性があります。
もしデータサイエンスに興味がわいた方はUdemyホームページでチェックしてみてください。
Udemyの講座を検討している方はこちら➡【世界最大級のオンライン学習サイトUdemy】(Udemy公式ホームページへ移動します。)
もう『ビジネスケースで学ぶPythonデータサイエンス入門』の購入しようと考えている方へ
購入前にパソコンの動作確認をした方が良いので、以下より試してみてください。
また本記事の最後にUdemy講座のセール情報も記載しています。合わせてご確認ください。
Udemy『Pythonデータサイエンス入門』の準備物
さて初めに本講座を受講するにあたり、以下の準備ができるかの確認はしておいた方が良いです。
Windows10の場合、Anaconda3内のライブラリバージョンのせいでうまく動作しないことがあります。
※私はMacで動作させました。
Anaconda3はコードを動かすためのプラットフォームで、ご自身のパソコンにインストールしていただくものです。また講座の中でもインストール方法を詳しく紹介しています。
AnacondaのインストールとJupiterの動作確認
まずAnacondaダウンロードサイト(Anacondaホームページへ移動します)へアクセスし、Anaconda3をインストールします。
ご自身のパソコンのビット数に合わせてダウロードします。64bitか32bitかの確認は(「コントロールパネル」-「システム」で確認できます。)
(ビット数の確認は下画像を参照ください)

①Anacondaをインストールします。(講座内では指定されていますが、ぶっちゃけどこでもいいです。)
②インストールしたらAnacondaNavigaterアプリがインストールされてるはずなので起動します。AnacondaNavigaterを起動すると以下のような画面になります。

「Jupyter」というところにある「Launch」をクリックします。するとブラウザが起動し、自分のパソコンのファイル構成が見えるはずです。そこから「New」-「Python3」とクリックします。

こんな感じでJupyter上にPython3コードが書けるファイルが作成されます。

ここにおまじない(下記4行)を書きましょう。(枠内にコピー&ペーストでOK)これは「Anaconda内にあるPythonコードのライブラリ(図書館)」のようなものです。
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline
入力するとこんな感じです。ここでコードを入力すると枠が緑色になりますので、そこで「Shift+Enter」(実行)を押しましょう。

↓
エラー無く次の行が作成され、In[1]と表示されれば動作に問題はありませんので、講座を進められます。(数字は実行した回数分加算されていきます。)

僕がWindows10でおまじないを実行したときは以下のようなメッセージが出力されました。

Anacondaの「mkl」というライブラリのバージョンが新しすぎたようです。(新しすぎるってなんだよ・・・って感じですが)出力された場合、以下のような対象方法があるようです。
1.Anaconda Navigatorを起動
2.Enviromentsを選択肢、「Search Packages」欄に「mkl」を入力
3.一番上にmklライブラリが表示されるので、mkl左横のチェックをクリックし、一番下の「Mark for specific version installation」からバージョンを「2018.0.2」に変更
(参考URL)
動作確認が終わったらデータサイエンス講座を存分に使い倒しましょう!
UdemyはQ&Aが使いやすい。
Udemyは問題が発生したときに講師の方に気軽に質問できるのが大きいメリットです。
先ほど紹介して不明なポップアップも、対象方法を調べて試してダメなので質問したところちゃんと返答が返ってきました。

なので安心して学習を進めることができます。
Udemyで『Pythonデータサイエンス入門』の感想まとめ

さてここまで『ビジネスケースで学ぶPythonデータサイエンス入門』を受講した内容をお伝えしましたがいかがでしたでしょうか?
僕はデータサイエンスもPythonもましてやプログラミングすること自体ほぼ初めてでした。
そんな僕でもデータサイエンスの概要は理解できましたし、手を動かしながらやるのでとても身に付きやすかったです。自分の時間でできるのも嬉しいです。
こういう感じで分析するんだ・・・という肌感覚は実際に体験した人にしかわかりません。
もし「データ分析はじめようか迷っている」「データサイエンスってやって意味あるのかな?」と考えているあなたに、一度体験してほしい講座です。絶対に損はありません。
『ビジネスケースで学ぶPythonデータサイエンス入門』を購入するならセール時期を狙いましょう!
最後に『ビジネスケースで学ぶPythonデータサイエンス入門』は通常で購入すれば19,800円と高額です。一個人が購入するには買えません。
ですがUdemyには毎月セールが行われいているのでセール時期を狙いましょう。私は1500円程度で購入しました。
【セール時期については以下の記事でまとめているので、ご確認ください】
今回は以上です。参考になれば幸いです。