План на курса

Преглед на големи данни:

    Какво е Big Data Защо Big Data набира популярност Big Data Казуси от практиката Big Data Характеристики Решения, върху които да работите Big Data.

Hadoop и неговите компоненти:

    Какво е Hadoop и какви са неговите компоненти. Hadoop Архитектура и нейните характеристики на данни, които може да обработва /процес. Кратко за Hadoop История, компании, които го използват и защо са започнали да го използват. Hadoop Рамка и нейните компоненти – обяснени подробно. Какво е HDFS и чете -записва в Hadoop разпределена файлова система. Как да настроите Hadoop клъстер в различни режими - самостоятелен/псевдо/клъстер с множество възли.

(Това включва настройка на Hadoop клъстер във VirtualBox/KVM/VMware, мрежови конфигурации, които трябва да бъдат внимателно разгледани, стартиране на Hadoop Daemons и тестване на клъстера).

    Какво е Map Reduce frame work и как работи. Изпълнение на карта Намалете заданията на Hadoop клъстер. Разбиране на репликацията, огледалото и Rack осведомеността в контекста на Hadoop клъстери.

Hadoop Клъстерно планиране:

    Как да планирате вашия hadoop клъстер. Разбиране на хардуер-софтуер за планиране на вашия hadoop клъстер. Разбиране на работните натоварвания и планиране на клъстера, за да се избегнат неуспехи и да се изпълнява оптимално.

Какво е MapR и защо MapR:

    Преглед на MapR и неговата архитектура. Разбиране и работа на MapR Control System, MapR Volumes, моментни снимки и Mirrors. Планиране на клъстер в контекста на MapR. Сравнение на MapR с други дистрибуции и Apache Hadoop. Инсталиране на MapR и внедряване на клъстер.

Настройка и администриране на клъстера:

    Управление на услуги, възли, моментни снимки, огледални томове и отдалечени клъстери. Разбиране и управление на възли. Разбиране на Hadoop компонента, Инсталиране на Hadoop компонента заедно с MapR Services. Достъп до данни в клъстер, включително чрез NFS Управление на услуги и възли. Управление на данни чрез използване на обеми, управление на потребители и групи, управление и присвояване на роли на възли, пускане в експлоатация, извеждане от експлоатация на възли, администриране на клъстери и наблюдение на производителността, конфигуриране/анализиране и наблюдение на показатели за наблюдение на производителността, конфигуриране и администриране на сигурността на MapR. Разбиране и работа с M7 - собствено хранилище за MapR таблици. Конфигурация и настройка на клъстера за оптимална производителност.

Надстройка на клъстера и интеграция с други настройки:

    Надграждане на софтуерна версия на MapR и видове надстройки. Конфигуриране на Mapr клъстер за достъп до HDFS клъстер. Настройване на MapR клъстер на Amazon Elastic Mapreduce.

Всички горепосочени теми включват демонстрации и практически сесии за учащите, за да придобият практически опит с технологията.

Изисквания

  • Основни познания по Linux FS
  • Основна Java
  • Познаване на Apache Hadoop (препоръчително)
 28 Hours

Брой участници



Цена за участник

Oтзиви от потребители (1)

Свързани Kурсове

Hadoop For Administrators

21 Hours

Samza for Stream Processing

14 Hours

Datameer for Data Analysts

14 Hours

Свързани Kатегории