План на курса
Введение в Google Colab и Apache Spark
- Обзор на Google Colab
- Введение в Apache Spark
- Настройка на Spark в Google Colab
Обработка на данни с Apache Spark
- Работа с RDDs и DataFrames
- Зареждане и обработка на големи набори данни
- Използване на Spark SQL за заявки за структурирани данни
Разширени анализи с Spark
- Машинно обучение с Spark MLlib
- Извършване на анализи на данни в реално време
- Разпределени изчисления с Spark
Визуализация и Collaboration в Google Colab
- Интегриране на Colab с популярни библиотеки за визуализация
- Колaborative работни процеси с Colab ноутбуци
- Споделяне и износване на резултати
Оптимизиране на Big Data работни процеси
- Настройка на Spark за постигане на производителност
- Оптимизиране на използването на памет и съхранение
- Масштабиране на работни процеси за големи набори данни
Big Data в облака
- Интегриране на Google Colab с инструменти, базирани на облака
- Използване на облачно съхранение за големи данни
- Работа с Spark в разпределени облачни среди
Примери и добри практики
- Преглед на реални приложения на големи данни
- Примери с използване на Apache Spark и Colab
- Добри практики за анализи на големи данни
Резюме и следващи стъпки
Изисквания
- Основни знания за концепциите на науката за данни
- Знакомство с Apache Spark
- Python умения за програмиране
Целева аудитория
- Научни работници по данни
- Инженери по данни
- Изследователи, работещи с големи данни
Отзиви от потребители (5)
Разнообразни практически упражнения ни позволиха да се запознаем с действието на програмата. Goясни обяснения и интеграция на теоретични концепции и как те са свързани с практическото им приложение.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Всички теми, които той покрива, включително и примери. И обясни как те са полезни в нашата ежедневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод
Хареса ми стила на Пабло, факта, че той покриваше много теми от дизайна на отчети, персонализиране с html до прилагане на прости ML алгоритми. Goот баланс теоретична информация / упражнения. Пабло наистина обхвана всички теми, които ме интересуваха, и даде изчерпателни отговори на въпросите ми.
Cristian Tudose - SC Automobile Dacia SA
Курс - Advanced Data Analysis with TIBCO Spotfire
Машинен превод
Практично приложение на Spotfire и всички базови функции.
Michael Capili - STMicroelectronics, Inc.
Курс - Introduction to Spotfire
Машинен превод
Когато ми харесах най-много в обучението беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод