План на курса

Употреба на напредна аналитика с Spark

Big Data в облака

Примери за добри практики

Обработка на данни с Apache Spark

Въведение в Google Colab и Apache Spark

Оптимизиране на процеси с Big Data

Резюме и следващи стъпки

Визуализация и Collaboration в Google Colab

  • Интегриране на Colab с популярни библиотеки за визуализация
  • Колективни процеси с Colab ноутбуци
  • Споделяне и експортиране на резултати
  • Интегриране на Google Colab с облачни инструменти
  • Използване на облачно съхранение за големи данни
  • Работа с Spark в разпределени облачни среди
  • Машинно обучение с Spark MLlib
  • Извършване на реално време анализ на данни
  • Разпределено изчисляване с Spark
  • Обзор на Google Colab
  • Въведение в Apache Spark
  • Настройка на Spark в Google Colab
  • Обзор на реални приложения на големи данни
  • Примери за добри практики с Apache Spark и Colab
  • Добри практики за аналитика на големи данни
  • Настройка на Spark за оптимална работа
  • Оптимизиране на използване на памет и съхранение
  • Мащабиране на процеси за големи набори от данни
  • Работа с RDDs и DataFrames
  • Зареждане и обработка на големи набори от данни
  • Използване на Spark SQL за запитване на структурирани данни

Изисквания

Целева аудитория

  • Основни знания за концепции на науката за данни
  • Знание за Apache Spark
  • Python умения по програмиране
  • Научни работници по данни
  • Инженери на данни
  • Изследователи, работащи с големи данни
 14 Часа

Брой участници


Цена за участник

Oтзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории