データ前処理 ビジネスデータを分析にかける前のチェックリスト

データ前処理 ビジネスデータを分析にかける前のチェックリスト

コース概要を見る
  • 初回から並べる
  • 最新から並べる

コース概要

データ分析は、前処理で9割決まる。

 

本授業は、ビジネスデータを分析にかける前にやっておくべき、データ加工の全体の流れを把握し、実際にExcelデータの加工処理の仕方を簡単な事例をもとに実践形式で学ぶ授業です。


社内にあるデータを分析にかける前にどのような処理をしなければいけないのか?また、前処理をすることでどこまで精度が高くなるのかについて考えていきましょう。


【受講対象者】
全般

【コース全体で学べること】
① 汚いデータ (欠損値や外れ値など) はなぜ生じるのか?
② Google Sheetを用いた汚いデータの対処法
③ 具体的な顧客情報をもとにしたデータ前処理ステップの実演


【授業のゴール】
◯ 前処理がデータ分析の成否を分ける重要な指標であることを理解し、実際に自身のビジネスデータに対し、前処理を行う流れと簡単な実践例がわかる

【コース構成】
第1回:データ前処理とは?
第2回:データ統合
第3回:データの整理① 欠損値の対処法
第4回:データの整理② 外れ値の対処法
第5回:データの整理③ フィルタリング
第6回:データ前処理のプロセス実演

2回目以降で行うハンズオン演習では事前にGoogle Sheetsの設定をする必要がございます。以下の動画を見て設定のほど、宜しくお願いいたします。

 

【授業素材】
2回目以降で使用する授業素材 (Google Sheets) は下記よりダウンロードすることができます。
ダウンロードしてお使いください。

第2回:授業素材(3つのSheet)
第3回:授業素材(1つのSheet)
第4回:授業素材(1つのSheet)
第5回:授業素材(1つのSheet)
第6回:授業素材(2つのSheet)


■ ご登壇いただく講師


オング 優也 (おんぐ ゆうや) さん
IBM Research リサーチソフトウェアエンジニア


1996年東京都で生まれ、幼少期からニューヨーク州とニュージャージー州で過ごす。現在、カリフォルニア州に在住。ペンシルベニア州立大学で情報科学技術学部データサイエンスを専攻。現在はシリコンバレーのIBM Research で機械学習、ディープラーニング、確率的最適化やフェデレーテッドラーニングなど様々な研究開発を行なっている。過去には感情認識、感情表現、画像処理や時系列関連の研究も行ってきた。

主な著書に「現場のプロが伝える前処理技術〜基礎から実践まで学ぶテーブルデータ/自然言語/画像データの前処理」や「Federated Learning 」などがある。
 

こんな人にオススメ

◯ 社内データを分析しながら戦略的に事業戦略を立てる方 ◯ データを武器にした分析手法を模索している方