План на курса

Обзор: Big Data

  • Кой е Big Data
  • Защо Big Data става популярно
  • Примери с Big Data
  • Характеристики на Big Data
  • Решения за работа с Big Data.

Hadoop и неговите компоненти:

  • Кой е Hadoop и какви са неговите компоненти.
  • Архитектура на Hadoop и характеристиките на данните, които може да обработи / процесира.
  • Кратък преглед на историята на Hadoop, компаниите, които го използват, и защо са започнали да го използват.
  • Фреймуъркът на Hadoop и неговите компоненти - подробно обяснение.
  • Кой е HDFS и четене/записване в разпределената файлова система на Hadoop.
  • Как да конфигурирате Hadoop кластер в различни режими - самостоятелен/псевдо/множествен кластер.

(Това включва конфигуриране на Hadoop кластер в VirtualBox/KVM/VMware, мрежови конфигурации, които трябва да бъдат внимателно разгледане, стартиране на Hadoop демони и тестване на кластера).

  • Какво е фреймуъркът на Map Reduce и как работи.
  • Стартиране на Map Reduce задачи в Hadoop кластера.
  • Разбиране на репликация, огледало и знание за стойките в контекста на Hadoop кластъри.

Планиране на Hadoop кластера:

  • Как да планирате вашия Hadoop кластер.
  • Разбиране на аппаратното и програмното оборудване за планиране на вашия Hadoop кластер.
  • Разбиране на работната натовареност и планиране на кластера, за да се избегнат провали и да се постигне оптимална производителност.

Кой е MapR и защо MapR:

  • Преглед на MapR и неговата архитектура.
  • Разбиране и работа с MapR Control System, MapR Volumes, снимки и огледала.
  • Планиране на кластер в контекста на MapR.
  • Сравнение на MapR с други дистрибуции и Apache Hadoop.
  • Инсталиране на MapR и развертане на кластера.

Конфигуриране и администрация на кластера:

  • Управление на услуги, възли, снимки, огледални томове и отдалечени кластъри.
  • Разбиране и управление на възли.
  • Разбиране на компоненти на Hadoop, инсталиране на компоненти на Hadoop заедно с услугите на MapR.
  • Access на данни в кластера, включително чрез NFS Управление на услуги и възли.
  • Управление на данни чрез томове, управление на потребители и групи, управление и назначаване на роли на възли, комисиониране и декомисиониране на възли, администрация на кластера и мониторинг на производителността, конфигуриране/анализ и мониторинг на метриките, за да се контролира производителността, конфигуриране и управление на сигурността на MapR.
  • Разбиране и работа с M7 - Нативно съхранение за таблици на MapR.
  • Конфигуриране и оптимизиране на кластера за оптимална производителност.

Актуализиране на кластера и интеграция с други настройки:

  • Актуализиране на версията на софтуера на MapR и видове актуализация.
  • Конфигуриране на MapR кластера за достъп до HDFS кластера.
  • Настройка на MapR кластер на Amazon Elastic Mapreduce.

Всички горепосочени теми включват демонстрации и практични сесии, за да дадат на учениците ръководство с технологиите.

Изисквания

  • Основни знания за Linux FS
  • Основни Java
  • Знания за Apache Hadoop (препоръчително)
 28 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории