План на курса
Въведение в Big Data Екосистеми
- Обзор на технологиите и архитектурите за големи данни
- Пакетно обработване срещу обработване в реално време
- Стратегии за съхранение на данни за масштабируемост
Разширено обработване на данни с Apache Spark
- Оптимизиране на Spark задачи за производителност
- Разширени трансформации и действия
- Работа с структуриран поток
Machine Learning в масштаб
- Техники за разпределено обучение на модели
- Настройка на хиперпараметри върху големи набори данни
- Разпределяне на модели в среди за големи данни
Deep Learning за Big Data
- Интегриране на TensorFlow и PyTorch с Spark
- Разпределени трениращи пиплайни за дълбоко обучение
- Приложения в анализ на изображения, текст и временни редове
Анализ в реално време и поток на данни
- Apache Kafka за влизане на поток на данни
- Фреймуърки за обработка на поток
- Мониторинг и сигнализиране в системи за реално време
Data Governance, Безопасност и Етика
- Изисквания за конфиденциалност на данни и съответствие с регулации
- Access контрол и криптиране в системи за големи данни
- Етични разглеждания в анализ на големи данни
Интегриране на Big Data с Business Intelligence
- Визуализация на данни и таблици за големи данни
- Свързване на пиплайни за големи данни с BI инструменти
- Осигуряване на бизнес резултати чрез разширени анализи
Резюме и следващи стъпки
Изисквания
- Силно разбиране на концепциите за анализ на данни и статистическо моделиране
- Опит с инструменти за обработка на данни и програмни езици, като Python, R или Scala
- Знание за разпределени компютърни рамки, като Hadoop или Spark
Целева аудитория
- Специалисти по данни, които целят да овладят обработка на големи данни и предиктивна аналитика
- Сениор анализи, които търсят да проектират и имплементират напреднали аналитични работни процеси
- Р&Р професионалисти, фокусирани върху иновативни решения, базирани на данни
Oтзиви от потребители (5)
Разнообразни практически упражнения ни позволиха да се запознаем с действието на програмата. Goясни обяснения и интеграция на теоретични концепции и как те са свързани с практическото им приложение.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Всички теми, които той покрива, включително и примери. И обясни как те са полезни в нашата ежедневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод
Хареса ми стила на Пабло, факта, че той покриваше много теми от дизайна на отчети, персонализиране с html до прилагане на прости ML алгоритми. Goот баланс теоретична информация / упражнения. Пабло наистина обхвана всички теми, които ме интересуваха, и даде изчерпателни отговори на въпросите ми.
Cristian Tudose - SC Automobile Dacia SA
Курс - Advanced Data Analysis with TIBCO Spotfire
Машинен превод
Практично приложение на Spotfire и всички базови функции.
Michael Capili - STMicroelectronics, Inc.
Курс - Introduction to Spotfire
Машинен превод
Когато ми харесах най-много в обучението беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод