План на курса
Раздел 1: Въведение в Hadoop
- история на hadoop, концепции еко система дистрибуции високо ниво архитектура hadoop митове hadoop предизвикателства хардуерна / софтуерна лаборатория: първи поглед към Hadoop
Раздел 2: HDFS
- Концепции за дизайн и архитектура (хоризонтално мащабиране, репликация, локализация на данните, информираност за стелажи) Демони: Namenode, вторичен namenode, комуникации на възел с данни / път за четене/запис на интегритета на данните на сърдечния ритъм Namenode High Availability (HA), Federation labs: Взаимодействие с HDFS
Раздел 3: Намаляване на картата
- концепции и архитектурни демони (MRV1): jobtracker / tasktracker фази: драйвер, картограф, разбъркване/сортиране, редуктор Map Reduce Версия 1 и Версия 2 (YARN) Вътрешни елементи на Map Reduce Въведение в Java Лабораторни дейности на програмата Map Reduce: Изпълнение на примерен MapReduce програма
Секция 4: Прасе
- pig срещу java map намаляване на потока от задания на pig pig латински език ETL с Pig трансформации и присъединявания Потребителски дефинирани функции (UDF) лаборатории: писане на Pig скриптове за анализиране на данни
Раздел 5: Hive
- поддръжка на типове данни за архитектура и дизайн SQL в Hive Създаване на Hive таблици и дялове за заявки се присъединява към лаборатории за обработка на текст: различни лаборатории за обработка на данни с Hive
Раздел 6: HBase
- концепции и архитектура hbase срещу RDBMS срещу cassandra HBase Java API Данни за времеви редове на лаборатории за проектиране на схеми на HBase: Взаимодействие с HBase с помощта на обвивка; програмиране в HBase Java API ; Упражнение за проектиране на схема
Изисквания
- удобно с езика за програмиране Java (повечето упражнения по програмиране са на java)
- удобни в Linux среда (да можете да навигирате в Linux командния ред, да редактирате файлове с помощта на vi / nano)
Лабораторна среда
Нулева инсталация: Няма нужда да инсталирате софтуер hadoop на машините на учениците! За студентите ще бъде осигурен работещ hadoop клъстер.
Студентите ще имат нужда от следното
- SSH клиент (Linux и Mac вече имат ssh клиенти, за Windows се препоръчва Putty)
- браузър за достъп до клъстера. Препоръчваме браузър Firefox
Oтзиви от потребители (6)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.
vyzVoice
Course - Hadoop for Developers and Administrators
practical things of doing, also theory was served good by Ajay