わたし達の周りにあるデータの量は最近増えているようです。ビッグデータとまではいかなくても多くの人がエクセルやCSVのデータが近くにある環境にいるのではないでしょうか。このコースは、「そのようなデータから何か新しい知見を引き出して、ビジネスに役立てたい……。そんな思いを持っている方々のためのコースです。
■2限目: ヒストグラムや散布図を、サバ缶を使ってデータを可視化しよう
データを統計的に分析する方法は難しい計算だけではありません。優れた方法でデータを視覚的に表現することで、同じデータからもより多くの理解を得ることができるようになります。統計分析において最もよく使われるヒストグラムや散布図を、サバ缶を使って作成することで、「手に取るように」データを可視化しましょう。
統計分析と言うと、一般的には難しくつまらない印象ですが、本コースでは「ヤバイ実験」を通じ、より身近なところにある例から統計を学ぶことができます。これにより、売上データ、マーケティングデータ、ユーザーの行動、アンケート調査などなど、あらゆる目的に応用できる統計的データ分析の基礎を、誰でも簡単に学べます。また、授業内でゲストに出演していただき、データ分析の第一人者の生の声を聞くことで、統計分析がどのように世界にインパクトを与えるような価値を作り出しているのかを学んでいただくことができます。
統計学はまじめに取り組むと面白くない学問です。そこで、今回のコースでは、出来る限り「実験」を使追うと思います。例えばサイコロを転がしたり、道でレシートを拾ってきてデータ収集したり、突然外に出てインタビューしたり、人の行動を観察したり、物を投げたり……。その他いろいろな方法でデータ収集をするところから始めることで、面白く、かつ体系的に理解できるような内容にできればと思います。
■このコースで学べること
統計学の基本的な概念
データ分析にどのように統計学を応用できるのか
手近にあるツール(Excel)を使って、どうやって分析を行うのか
データがない場合には、どのように収集するのか
これらの分析を行うことで、どんな価値を作り出せるのか
データ分析から価値を生み出して活躍している人・会社たちはどういう仕事をしているのか
■より詳細には
統計の基礎
平均、分散などの基本的な定量化
ヒストグラムなどによるデータの可視化
統計分布の種類(正規分布、ポアソンブンプなど)
検定(P値とか)
ランダム変数とサンプリング
相関関係と回帰分析
測定エラーの見積もり
データの扱い方
データの収集方法
データの種類
データのクリーニング方法
データ分析ツールの使い方
……etc.