План на курса

Въведение

    Защо и как проектните екипи приемат Hadoop Как започна Ролята на ръководителя на проекта в Hadoop проекта

Разбиране на архитектурата и ключовите концепции на Hadoop.

    HDFS MapReduce Други части от Hadoop екосистемата

Какво представлява Big Data?

Различни подходи за съхранение Big Data

HDFS (Hadoop Разпределена файлова система) като основа

Как се обработва Big Data.

    Силата на разпределената обработка

Обработка на данни с MapReduce

    Как се разделят данните стъпка по стъпка

Ролята на групирането в широкомащабна разпределена обработка

    Архитектурен преглед Подходи за групиране

Клъстериране на вашите данни и процеси с YARN

Ролята на нерелационните Database в съхранението на големи данни

Работа с Hadoop нерелационна база данни: HBase

Преглед на архитектурата на хранилище на данни

Управление на вашето хранилище за данни с Hive

Изпълнение на Hadoop от Shell-скриптове

Работа с Hadoop Поточно предаване

Други Hadoop инструменти и помощни програми

Първи стъпки по Hadoop проект

    Демистифицираща сложност

Мигриране на съществуващ проект към Hadoop

    Съображения относно инфраструктурата Мащабиране извън разпределените ви ресурси

Hadoop Заинтересовани страни по проекта и техните инструменти

    Разработчици, учени по данни, бизнес анализатори и ръководители на проекти

Hadoop като фондация за нови технологии и подходи

Заключителни бележки

Изисквания

  • Общо разбиране на програмирането
  • Разбиране на бази данни
  • Основни познания по Linux
  14 Hours

Брой участници



Цена за участник

Oтзиви от потребители (3)

Свързани Kурсове

Hadoop For Administrators

  21 Hours

Samza for Stream Processing

  14 Hours

Datameer for Data Analysts

  14 Hours

Свързани Kатегории