План на курса
Въведение
- Защо и как проектните екипи приемат Hadoop Как започна Ролята на ръководителя на проекта в Hadoop проекта
Разбиране на архитектурата и ключовите концепции на Hadoop.
- HDFS MapReduce Други части от Hadoop екосистемата
Какво представлява Big Data?
Различни подходи за съхранение Big Data
HDFS (Hadoop Разпределена файлова система) като основа
Как се обработва Big Data.
- Силата на разпределената обработка
Обработка на данни с MapReduce
- Как се разделят данните стъпка по стъпка
Ролята на групирането в широкомащабна разпределена обработка
- Архитектурен преглед Подходи за групиране
Клъстериране на вашите данни и процеси с YARN
Ролята на нерелационните Database в съхранението на големи данни
Работа с Hadoop нерелационна база данни: HBase
Преглед на архитектурата на хранилище на данни
Управление на вашето хранилище за данни с Hive
Изпълнение на Hadoop от Shell-скриптове
Работа с Hadoop Поточно предаване
Други Hadoop инструменти и помощни програми
Първи стъпки по Hadoop проект
- Демистифицираща сложност
Мигриране на съществуващ проект към Hadoop
- Съображения относно инфраструктурата Мащабиране извън разпределените ви ресурси
Hadoop Заинтересовани страни по проекта и техните инструменти
- Разработчици, учени по данни, бизнес анализатори и ръководители на проекти
Hadoop като фондация за нови технологии и подходи
Заключителни бележки
Изисквания
- Общо разбиране на програмирането
- Разбиране на бази данни
- Основни познания по Linux
Oтзиви от потребители (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay