План на курса

  1. Основни принципи на Big Data
    • Big Data и нейната роля в корпоративния свят
    • Фазите на развитие на стратегия за Big Data в корпорация
    • Объяснение на логиката, лежаща в основата на холистичен подход към Big Data
    • Компоненти, необходими в платформа за Big Data
    • Решение за съхранение на Big Data
    • Граници на традиционните технологии
    • Обзор на типове бази данни
    • Четири измерения на Big Data
  2. Влияние на Big Data върху бизнес
    • Бизнесова важност на Big Data
    • Изявления на предизвикателства при извличане на полезни данни
    • Интеграция на Big Data с традиционни данни
  3. Технологии за съхранение на Big Data
    • Обзор на технологии за Big Data
      • Модели за съхранение на данни
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Избор на правилната технология за Big Data
  4. Обработка на Big Data
    • Връзка и извличане на данни от база данни
    • Трансформация и подготовка на данни за обработка
    • Използване на Hadoop MapReduce за обработка на разпределени данни
    • Мониторинг и изпълнение на Hadoop MapReduce задачи
    • Основни блокове на Hadoop разпределена файлова система
    • Mapreduce и Yarn
    • Работа с потокови данни с Spark
  5. Инструменти и технологии за анализ на Big Data
    • Програмиране на Hadoop с езика Pig Latin
    • Запитване на Big Data с Hive
    • Добиване на данни с Mahout
    • Инструменти за визуализация и докладване
  6. Big Data в бизнес
    • Управление и установяване на нуждите от Big Data
    • Бизнесова важност на Big Data
    • Избор на правилните инструменти за Big Data за задачата

Концепции за сторъжище на данни

  • Какво е сторъжище на данни?
  • Разлики между OLTP и сторъжище на данни
  • Приобщаване на данни
  • Извличане на данни
  • Трансформация на данни
  • Зареждане на данни
  • Данни маркетинг
  • Зависими vs независими данни маркетинг
  • Дизайн на база данни

Концепции за тестване на ETL:

  • Въведение.
  • Животен цикъл на разработката на софтуер.
  • Методологии за тестване.
  • Процес на работен поток за тестване на ETL.
  • Отговорности за тестване на ETL в етап на данни.

Основни принципи на Big Data

  • Big Data и нейната роля в корпоративния свят
  • Фазите на развитие на стратегия за Big Data в корпорация
  • Объяснение на логиката, лежаща в основата на холистичен подход към Big Data
  • Компоненти, необходими в платформа за Big Data
  • Решение за съхранение на Big Data
  • Граници на традиционните технологии
  • Обзор на типове бази данни

NoSQL бази данни

Hadoop

Map Reduce

Apache Spark

Изисквания

Делегатите трябва да имат познания и известен опит с инструментите за съхранение и да имат представа за работа с големи набори от данни

 14 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории