План на курса
Въведение
Общ преглед на функционалностите и архитектурата на "Open Studio for Big Data"
Настройка на Open Studio for Big Data
Навигация в потребителския интерфейс
Разбиране на компонентите и конекторите за големи данни
Свързване с кластър Hadoop
Четене и записване на данни
Обработка на данни с Hive и MapReduce
Анализ на резултатите
Подобряване на качеството на големите данни
Създаване на канал за големи данни
Управление на потребители, групи, роли и проекти
Приложение на Open Studio в продукцията
Мониторинг на Open Studio
Разкриване на проблеми
Резюме и заключение
Изисквания
- Разбиране на релационните бази данни
- Разбиране на хранилищата за данни
- Разбиране на концепциите ETL (Извличане, Преобразуване, Зареждане)
Публика
- Профессионални лица в бизнеса за разбираемостта на данните
- Профессионални бази данни
- Разработчици на SQL
- Разработчици ETL
- Архитекти на решенията
- Архитекти на данните
- Профессионални лица, свързани с хранилищата за данни
- Системни администратори и интеграционисти
Отзиви от потребители (5)
Примери в реално време
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
очень интерактивен...
Richard Langford
Курс - SMACK Stack for Data Science
Машинен превод
Достъпен практическо обучение, треньорът е компетентен
Chris Tan
Курс - A Practical Introduction to Stream Processing
Машинен превод
Започнете да се запознавате с Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод
задачи за практика
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
Машинен превод