План на курса

    Основи на големи данни Големи данни и тяхната роля в корпоративния свят Фази на развитие на стратегия за големи данни в рамките на една корпорация Обяснете обосновката, която стои в основата на холистичния подход към Компонентите на големи данни, необходими в платформа за големи данни Решение за съхранение на големи данни Ограничения на традиционните технологии Преглед на типовете бази данни Четирите измерения на Big Data Големи данни Въздействие върху бизнеса Бизнес значение на Big Data Предизвикателства при извличането на полезни данни Интегриране на Big data с традиционни данни Технологии за съхранение на големи данни Преглед на технологиите за големи данни Модели за съхранение на данни Hadoop Hive Cassandra MongoDB Избор на правилния голям технология за данни Обработка на големи данни Свързване и извличане на данни от база данни Трансформиране и подготовка на данни за обработка Използване на Hadoop MapReduce за обработка на разпределени данни Наблюдение и изпълнение на задачи на Hadoop MapReduce Градивни блокове на разпределена файлова система Hadoop Mapreduce и Yarn Работа с поточно предаване на данни с инструменти за анализ на Spark Big data и технологии Програмиране на Hadoop с Pig Latin език Запитване за големи данни с Hive Mining данни с Mahout Инструменти за визуализиране и отчитане Големи данни в бизнеса Управление и установяване на нуждите от големи данни Бизнес значение на големите данни Избор на правилните инструменти за големи данни за проблема

 

Концепции за съхранение на данни

    Какво е Data Ware House? Разлика между OLTP и Data Ware Получаване на данни Извличане на данни Трансформация на данни. Зареждане на данни Мартове с данни Зависими срещу независими Март за данни Дизайн на база данни

Концепции за тестване на ETL:

    Въведение. Жизнен цикъл на разработка на софтуер. Методологии за тестване. Работен процес на ETL тестване. Отговорности за тестване на ETL на етап данни.

Основи на големи данни

    Big Data и нейната роля в корпоративния свят Фазите на разработване на Big Data стратегия в рамките на една корпорация Обяснете обосновката в основата на холистичния подход към Big Data Компонентите, необходими в Big Data Платформа Решение за съхранение на големи данни Ограничения на традиционните технологии Преглед на типовете бази данни

НеSQL Бази данни

Hadoop

Карта Намаляване

Apache Spark

 

Изисквания

Делегатите трябва да имат познания и известен опит с инструментите за съхранение и да имат представа за работа с големи набори от данни

 14 Hours

Брой участници



Цена за участник

Oтзиви от потребители (4)

Свързани Kурсове

Unified Batch and Stream Processing with Apache Beam

14 Hours

Apache Apex: Processing Big Data-in-Motion

21 Hours

Apache Storm

28 Hours

Apache Flink Fundamentals

28 Hours

Introduction to Graph Computing

28 Hours

Knowledge Discovery in Databases (KDD)

21 Hours

Свързани Kатегории