chevron_left

DS検定(データサイエンティスト検定)対策講座

PREMIUM

スライド資料

会員登録して、全てのスライドを見よう

1 / 56

授業の概要

第7回「データエンジニアリング⼒」

本授業では以下について学びます。
 

  • システム構築と運用

    • クラスタ構成で性能向上・高可用性を実現
  • データベース管理

    • バックアップ種類:
      • フルバックアップ(全データ保存)
      • 差分・増分バックアップ(変更分のみ保存)
    • 正規化: データ重複を排除し、整合性を向上(第1〜第3正規化)
  • 分散処理技術

    • Hadoop: 大規模データをストレージで分散処理
    • Spark: メモリ上で高速分散処理
  • データ収集と通信

    • Webクローラー・スクレイピングでデータ収集
    • 通信プロトコル: HTTP/FTPを利用したデータ転送
  • データフォーマットとエクスポート

    • フォーマット: CSV、JSON、XML
    • エクスポート: 指定形式でデータ保存

こんな人にオススメ

DS検定受験者、データサイエンティストを目指している方、実務に役立てたい方