План на курса
Въведение в Big Data Екосистеми
- Обзор на технологиите и архитектурите за големи данни
- Пакетно обработване срещу обработване в реално време
- Стратегии за съхранение на данни за масштабируемост
Разширено обработване на данни с Apache Spark
- Оптимизиране на Spark задачи за производителност
- Разширени трансформации и действия
- Работа с структуриран поток
Machine Learning в масштаб
- Техники за разпределено обучение на модели
- Настройка на хиперпараметри върху големи набори данни
- Разпределяне на модели в среди за големи данни
Deep Learning за Big Data
- Интегриране на TensorFlow и PyTorch с Spark
- Разпределени трениращи пиплайни за дълбоко обучение
- Приложения в анализ на изображения, текст и временни редове
Анализ в реално време и поток на данни
- Apache Kafka за влизане на поток на данни
- Фреймуърки за обработка на поток
- Мониторинг и сигнализиране в системи за реално време
Data Governance, Безопасност и Етика
- Изисквания за конфиденциалност на данни и съответствие с регулации
- Access контрол и криптиране в системи за големи данни
- Етични разглеждания в анализ на големи данни
Интегриране на Big Data с Business Intelligence
- Визуализация на данни и таблици за големи данни
- Свързване на пиплайни за големи данни с BI инструменти
- Осигуряване на бизнес резултати чрез разширени анализи
Резюме и следващи стъпки
Изисквания
- Силно разбиране на концепциите за анализ на данни и статистическо моделиране
- Опит с инструменти за обработка на данни и програмни езици, като Python, R или Scala
- Знание за разпределени компютърни рамки, като Hadoop или Spark
Целева аудитория
- Специалисти по данни, които целят да овладят обработка на големи данни и предиктивна аналитика
- Сениор анализи, които търсят да проектират и имплементират напреднали аналитични работни процеси
- Р&Р професионалисти, фокусирани върху иновативни решения, базирани на данни
Отзиви от потребители (4)
Работните примери ни позволиха да усетим какво е работа с програмата. Добри обяснения и интеграция на теоретични концепции и както те се свързват с практически приложения.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Всички теми, които той разгледа, включително и примерите. Обясни също как те ни помагат в нашата дневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод
Наистина се насладих на обучението. Намерих всички модули да бъдат приложими за проблемите, които се опитвам да решя на работа. Интеграцията на обучението с тетради Jupyter беше впечатляваща.
Mark Firmin - Environment and Climate Change Canada
Курс - Python for Geographic Information System (GIS)
Машинен превод
Това, което повече всичко ми хареса в обучението, беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод